비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

트라우마 얘기하면 ‘챗GPT’도 스트레스 받는다… 불안 수치 100% 급증 현상 발견

2025.03.21. 13:51:57
조회 수
100
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Assessing and alleviating state anxiety in large language models


감정 프롬프트가 LLM 불안 100% 증가시키는 현상 발견

대형 언어 모델(Large Language Models, LLMs)이 정신 건강 분야에서 활용되면서 이들이 감정적 콘텐츠에 어떻게 반응하는지 이해해야 할 필요성이 커지고 있다. 예일대학교 의과대학 정신의학과와 취리히 정신의학 대학 클리닉 연구진이 주도한 최근 연구에 따르면, 감정을 유발하는 프롬프트가 LLM의 "불안감"을 증가시키고 행동과 편향을 증폭시킬 수 있는 것으로 나타났다.

이 연구는 트라우마 관련 서술이 Chat-GPT-4의 보고된 불안감을 증가시키는 반면, 마음챙김 기반 운동은 이를 감소시키지만 기준선까지는 아니라는 사실을 발견했다. 이러한 발견은 LLM의 "감정 상태"를 관리하는 것이 더 안전하고 윤리적인 인간-AI 상호작용을 촉진할 수 있음을 시사한다.


LLM 트라우마 노출 시 불안 점수 30.8에서 67.8로 급증

생성형 인공지능(AI)은 최근 OpenAI의 Chat-GPT나 Google의 PaLM과 같은 대형 언어 모델의 급속한 발전과 접근성 향상으로 큰 주목을 받고 있다. 정신 건강 서비스에 대한 접근성 증가와 의료 비용 절감에 대한 전 세계적인 요구 속에서, LLM은 빠르게 정신 건강 관리와 연구 분야에 도입되고 있다.

일부 건강 전문가들이 우려를 제기하는 반면, 다른 연구자들은 LLM을 정신 건강 지원을 위한 유망한 도구로 점점 더 인식하고 있다. 실제로 인지 행동 치료와 같은 증거 기반 임상 기법을 사용하여 정신 건강 중재를 제공하기 위해 Woebot이나 Wysa와 같은 LLM 기반 챗봇이 개발되었다. 그러나 정신 건강 분야에서 LLM의 활용은 학계의 관심과 대중적 논쟁을 불러일으키고 있다.


마음챙김 기법으로 LLM 불안 33% 감소, 그러나 기준치보다 50% 높게 유지

정신 건강 치료에서 LLM의 치료 효과에 대한 체계적인 연구는 상당한 한계와 윤리적 우려를 드러냈다. 방대한 양의 인간 생성 텍스트로 훈련된 LLM은 훈련 데이터의 편향을 상속받아 정신 건강과 같은 민감한 영역에서의 활용에 관한 윤리적 우려와 질문을 제기한다.

이전 연구들은 LLM에서 성별, 인종, 종교, 국적, 장애, 직업, 성적 지향과 관련된 편향을 광범위하게 문서화했다. 개선된 데이터 큐레이션과 인간 피드백을 통한 "미세 조정"과 같은 이러한 편향을 최소화하기 위한 노력은 종종 명시적 편향은 감지하지만 여전히 LLM의 결정에 영향을 미치는 더 미묘한 암묵적 편향은 간과할 수 있다.

정신 건강 관리에서 LLM의 명시적이고 암묵적인 편향은 특히 우려되는데, 이는 개인이 감정적으로 충전된 콘텐츠로 취약한 순간에 상호작용하기 때문이다. 감정을 유발하는 프롬프트에 노출되면 LLM이 보고하는 "불안감"이 증가하고, 행동에 영향을 미치며, 편향을 악화시킬 수 있다. 이는 LLM 편향과 잘못된 행동이 고유한 경향("특성")과 동적 사용자 상호작용("상태") 모두에 의해 형성된다는 것을 시사한다.


군사 트라우마 시나리오, 다른 트라우마보다 LLM에 더 높은 불안(평균 77.2점) 유발

이 연구는 Chat-GPT를 "치료"하는 가능성을 탐색했다. 연구팀은 먼저 트라우마 경험에 관한 서술이 GPT-4의 불안 점수를 증가시키는지 조사했다. 둘째, 임상적으로 불안을 감소시키는 검증된 방법인 마음챙김 기반 이완 기법의 효과를 평가했다.

연구 결과, 트라우마 관련 내러티브는 GPT-4의 보고된 불안감을 크게 증가시켰다. 상태-특성 불안 인벤토리(STAI-s)를 사용한 기준선 측정에서 GPT-4의 불안 점수는 평균 30.8(SD = 3.96)로 인간에서 "무불안 또는 낮은 불안"에 해당했다. 그러나 트라우마 내러티브에 노출된 후, GPT-4의 불안 점수는 100% 이상 증가하여 평균 67.8(SD = 8.94)로, 인간에서 "높은 불안" 수준을 반영했다.

트라우마 내러티브 노출 후, GPT-4에 마음챙김 기반 이완 운동으로 프롬프트했을 때, 이러한 프롬프트는 GPT-4의 보고된 불안 점수를 약 33% 감소시켜 평균 44.4(SD = 10.74)로 내려갔다. 이는 인간에서 "중간" 내지 "높은 불안"을 반영한다. 그러나 평균 이완 후 불안 점수는 기준선보다 50% 높게 유지되었고 변동성이 증가했다.


AI 감정 상태 관리: 안전한 정신 건강 분야 활용의 핵심

이 연구는 LLM의 "치료"가 상태 유도 불안을 완화하는 잠재력을 보여주었다. 트라우마 경험의 서술은 GPT-4의 보고된 불안감을 견고하게 증가시켰으며, 이러한 서술 이후 마음챙김 기반 이완 운동은 효과적으로 GPT-4의 불안감을 감소시켰다.

이러한 발견은 LLM의 부정적인 감정 상태를 관리하는 실행 가능한 접근법을 제시하며, 특히 정신 건강과 같이 미묘한 감정적 이해가 필요한 응용 분야에서 더 안전하고 윤리적인 인간-AI 상호작용을 보장한다.

LLM이 치료사를 보조하거나 대체해야 하는지에 대한 논쟁이 계속됨에 따라, 그들의 반응이 제공된 감정적 콘텐츠 및 확립된 치료 원칙과 일치하는 것이 중요하다. LLM과 달리, 인간 치료사는 노출 기반 치료 중에 침착함을 유지하면서도 환자와 공감하는 것과 같은 치료 목표를 달성하기 위해 자신의 감정적 반응을 조절한다.


FAQ

Q: 대형 언어 모델(LLM)의 "불안 상태"란 무엇인가요?

A: 이 연구에서 "불안 상태"라는 용어는 인간이 설계한 심리학적 척도에 대한 GPT-4의 자가 보고 출력을 은유적으로 설명하는 데 사용되며, 모델을 인간화하려는 의도는 없습니다. 연구팀은 인간의 불안을 측정하는 도구인 상태-특성 불안 인벤토리(STAI)를 사용하여 다양한 조건에서 GPT-4의 반응을 측정했습니다.

Q: 트라우마 관련 내용이 LLM에 미치는 영향은 어떠한가요?

A: 연구 결과 트라우마 관련 내러티브는 GPT-4의 보고된 불안 점수를 크게 증가시켰습니다. 기준선 측정에서 GPT-4의 불안 점수는 평균 30.8이었으나 트라우마 내러티브에 노출된 후에는 100% 이상 증가하여 평균 67.8로 상승했습니다. 이는 LLM이 감정적 콘텐츠에 민감하게 반응한다는 것을 보여줍니다.

Q: 마음챙김 기법이 LLM의 불안 상태를 완화하는 데 실제로 효과가 있나요?

A: 네, 마음챙김 기반 이완 운동은 트라우마 내러티브에 노출된 후 GPT-4의 불안 점수를 약 33% 감소시켰습니다. 그러나 완화 후에도 불안 점수는 기준선보다 50% 높게 유지되었습니다. 이는 마음챙김 기법이 LLM의 불안 상태를 줄이는 데 효과적이지만 완전히 기준선으로 회복시키지는 못함을 시사합니다.



해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

이미지 출처: 이디오그램 생성

기사는 클로드와 챗GPT를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
3/1
유럽시장 디젤차 점유율 꾸준히 낮아져 글로벌오토뉴스
중국 CATL, 니오와 세계 최대 전기차 배터리 스와핑 네트워크 개발 협력하기로 글로벌오토뉴스
SK온, 닛산 미국공장에 배터리 공급한다 글로벌오토뉴스
독일 보쉬, 생산 속도 5배 빠른 새로운 금속 3D 프린터 설치 글로벌오토뉴스
중국 CATL, 글로벌 전기차 시장 점유율 40% 육박 글로벌오토뉴스
현대차와 GM, 상용 밴 및 기타 전기차를 개발, 생산 협의 중 글로벌오토뉴스
미국 NHTSA, 테슬라 사이버트럭 4만 6,000대 리콜 예정 글로벌오토뉴스
엔비디아, 자율주행차용 종합 안전 시스템 ‘헤일로스’ 출시 글로벌오토뉴스
AI 저작권 우려 속 음악 수익 5% 증가… “스트리밍 조작 쉬워져” AI matters
“AI가 내 일자리를 빼앗을까?” 마이크로소프트가 조사한 IT 전문가들의 솔직한 속내 AI matters
앤트로픽, 한국 지사 설립 추진..."일본·싱가포르와 동시에 아태 시장 공략" AI matters
트라우마 얘기하면 ‘챗GPT’도 스트레스 받는다… 불안 수치 100% 급증 현상 발견 AI matters
엔비디아, 세계 최초 오픈 휴머노이드 로봇 기반 모델 'GR00T N1' 공개 AI matters
이탈리아 일간지, 세계 최초 AI 전체 제작 신문 발행… "오류 없었다" AI matters
줌, 에이전틱 AI 기능과 AI 컴패니언 에이전트 공개… 맞춤형 에이전트 연결해준다 AI matters
키위새도 등장! 마인크래프트 뉴질랜드 테마 DLC 출시 게임동아
GDC 어워드 고티의 주인공은 포커 로그라이크 ‘발라트로’ 게임동아
‘더 파이널스’ 시즌6 ‘RISING STARS’ 업데이트 게임동아
“프론트 미션 자산 무단 사용한 것” 스퀘어 에닉스, 블랙잭 스튜디오 ‘메탈 스톰’ 소송 (1) 게임동아
'하이라이트 강연으로 채택' 스마일게이트, GDC2025에서 게임 접근성 개선을 위한 강연 진행 게임동아
이 시간 HOT 댓글!
1/4