이탈리아 밀라노-비코카 대학교 연구진이 개인 맞춤형 대화를 통해 사용자의 습관 개선을 돕는 GPT 기반 챗봇 '습관 코치(Habit Coach)'를 개발했다고 발표했다.
연구에 참여한 5명의 참가자들은 야식, 지연행동(미루기), 소셜미디어 과다사용, 취침 시간 미루기, 카페인 과다섭취 등 각자 다른 문제 습관을 가지고 있었다. 5일간의 프로그램 후, 모든 참가자의 습관 강도가 41.67%에서 50% 사이로 감소했다. 특히 야식 습관이 있던 참가자는 감정적 트리거(예: 지루함)를 인식하게 되었고, 과다한 카페인 섭취 문제가 있던 참가자는 허브차와 같은 건강한 대안을 발견했다고 보고했다.
연구진은 더 효과적인 습관 개선을 위해 챗봇을 네 차례 개선했다. 첫 버전은 기본적인 질문만 던지는 수동적인 대화에 그쳤다. 두 번째 버전에서는 구조화된 목표 설정을 도입했으나, 사용자의 개별적인 상황을 고려하지 못하는 한계가 있었다. 세 번째 버전에서는 응답을 30단어로 제한하고 교육과 대화를 상황에 맞게 전환하도록 개선했다. 최종 버전에서는 인지행동치료와 내러티브 치료 기법을 접목해 구체적인 실천 계획을 수립하도록 도왔다.
프로그램은 매일 다른 목표를 가지고 진행됐다.
1일차에는 "스트레스가 나를 과식하게 만든다"와 같이 습관을 외부화하여 인식하게 했다.
2일차에는 습관을 이겨낸 성공 경험을 회상하도록 했다.
3일차에는 건강한 간식을 선택하는 자신의 모습을 시각화하는 등 성공적인 변화를 상상하게 했다.
4일차에는 "나는 스트레스를 건설적인 활동으로 관리한다"와 같은 새로운 자기 서사를 만들었다.
5일차에는 "스트레스를 받으면 산책을 한다"와 같은 구체적인 If-Then 계획을 수립했다.
자가보고 습관 지수(SRHI) 측정 결과, 참가자들의 평균 습관 강도는 프로그램 전 52.20에서 프로그램 후 29.20으로 크게 감소했다. 그러나 이번 연구의 가장 큰 한계는 5명이라는 제한된 참가자 수다. 이로 인해 연구 결과의 광범위한 적용이 어렵다는 지적이다. 또한 대조군이 없어 중재 효과의 인과관계를 명확히 평가하기 어렵다는 점도 한계로 꼽혔다.
자가보고 척도에만 의존한 평가 방식과 5일이라는 짧은 중재 기간도 문제점으로 지적됐다. 연구진은 사회적 바람직성 편향이나 부정확한 자기 평가의 가능성을 배제할 수 없다고 설명했다. 이를 보완하기 위해 웨어러블 기기나 활동 로그 등을 통한 객관적인 데이터 수집이 필요하다고 제안했다.
기술적인 측면에서는 사용자들이 5일 연속으로 같은 채팅 세션을 사용해야 한다는 점이 한계였다. 연구진은 향후 연구에서는 자동 세션 추적이나 저널링 시스템을 도입하여 시스템 적응성을 개선할 필요가 있다고 강조했다.
이 연구는 GPT와 같은 대형 언어 모델이 전문가의 치료 기법을 효과적으로 전달할 수 있다는 가능성을 보여줬다는 점에서 주목받고 있다. 특히 챗봇이 제공하는 판단 없는(free from judgement) 대화 환경이 사용자들의 행동 변화를 촉진하는 데 도움이 될 수 있다는 점이 확인됐다.
기사에 인용된 논문의 원문은 링크에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기