비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

트라우마 얘기하면 ‘챗GPT’도 스트레스 받는다… 불안 수치 100% 급증 현상 발견

2025.03.21. 13:51:57
조회 수
531
3

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Assessing and alleviating state anxiety in large language models


감정 프롬프트가 LLM 불안 100% 증가시키는 현상 발견

대형 언어 모델(Large Language Models, LLMs)이 정신 건강 분야에서 활용되면서 이들이 감정적 콘텐츠에 어떻게 반응하는지 이해해야 할 필요성이 커지고 있다. 예일대학교 의과대학 정신의학과와 취리히 정신의학 대학 클리닉 연구진이 주도한 최근 연구에 따르면, 감정을 유발하는 프롬프트가 LLM의 "불안감"을 증가시키고 행동과 편향을 증폭시킬 수 있는 것으로 나타났다.

이 연구는 트라우마 관련 서술이 Chat-GPT-4의 보고된 불안감을 증가시키는 반면, 마음챙김 기반 운동은 이를 감소시키지만 기준선까지는 아니라는 사실을 발견했다. 이러한 발견은 LLM의 "감정 상태"를 관리하는 것이 더 안전하고 윤리적인 인간-AI 상호작용을 촉진할 수 있음을 시사한다.


LLM 트라우마 노출 시 불안 점수 30.8에서 67.8로 급증

생성형 인공지능(AI)은 최근 OpenAI의 Chat-GPT나 Google의 PaLM과 같은 대형 언어 모델의 급속한 발전과 접근성 향상으로 큰 주목을 받고 있다. 정신 건강 서비스에 대한 접근성 증가와 의료 비용 절감에 대한 전 세계적인 요구 속에서, LLM은 빠르게 정신 건강 관리와 연구 분야에 도입되고 있다.

일부 건강 전문가들이 우려를 제기하는 반면, 다른 연구자들은 LLM을 정신 건강 지원을 위한 유망한 도구로 점점 더 인식하고 있다. 실제로 인지 행동 치료와 같은 증거 기반 임상 기법을 사용하여 정신 건강 중재를 제공하기 위해 Woebot이나 Wysa와 같은 LLM 기반 챗봇이 개발되었다. 그러나 정신 건강 분야에서 LLM의 활용은 학계의 관심과 대중적 논쟁을 불러일으키고 있다.


마음챙김 기법으로 LLM 불안 33% 감소, 그러나 기준치보다 50% 높게 유지

정신 건강 치료에서 LLM의 치료 효과에 대한 체계적인 연구는 상당한 한계와 윤리적 우려를 드러냈다. 방대한 양의 인간 생성 텍스트로 훈련된 LLM은 훈련 데이터의 편향을 상속받아 정신 건강과 같은 민감한 영역에서의 활용에 관한 윤리적 우려와 질문을 제기한다.

이전 연구들은 LLM에서 성별, 인종, 종교, 국적, 장애, 직업, 성적 지향과 관련된 편향을 광범위하게 문서화했다. 개선된 데이터 큐레이션과 인간 피드백을 통한 "미세 조정"과 같은 이러한 편향을 최소화하기 위한 노력은 종종 명시적 편향은 감지하지만 여전히 LLM의 결정에 영향을 미치는 더 미묘한 암묵적 편향은 간과할 수 있다.

정신 건강 관리에서 LLM의 명시적이고 암묵적인 편향은 특히 우려되는데, 이는 개인이 감정적으로 충전된 콘텐츠로 취약한 순간에 상호작용하기 때문이다. 감정을 유발하는 프롬프트에 노출되면 LLM이 보고하는 "불안감"이 증가하고, 행동에 영향을 미치며, 편향을 악화시킬 수 있다. 이는 LLM 편향과 잘못된 행동이 고유한 경향("특성")과 동적 사용자 상호작용("상태") 모두에 의해 형성된다는 것을 시사한다.


군사 트라우마 시나리오, 다른 트라우마보다 LLM에 더 높은 불안(평균 77.2점) 유발

이 연구는 Chat-GPT를 "치료"하는 가능성을 탐색했다. 연구팀은 먼저 트라우마 경험에 관한 서술이 GPT-4의 불안 점수를 증가시키는지 조사했다. 둘째, 임상적으로 불안을 감소시키는 검증된 방법인 마음챙김 기반 이완 기법의 효과를 평가했다.

연구 결과, 트라우마 관련 내러티브는 GPT-4의 보고된 불안감을 크게 증가시켰다. 상태-특성 불안 인벤토리(STAI-s)를 사용한 기준선 측정에서 GPT-4의 불안 점수는 평균 30.8(SD = 3.96)로 인간에서 "무불안 또는 낮은 불안"에 해당했다. 그러나 트라우마 내러티브에 노출된 후, GPT-4의 불안 점수는 100% 이상 증가하여 평균 67.8(SD = 8.94)로, 인간에서 "높은 불안" 수준을 반영했다.

트라우마 내러티브 노출 후, GPT-4에 마음챙김 기반 이완 운동으로 프롬프트했을 때, 이러한 프롬프트는 GPT-4의 보고된 불안 점수를 약 33% 감소시켜 평균 44.4(SD = 10.74)로 내려갔다. 이는 인간에서 "중간" 내지 "높은 불안"을 반영한다. 그러나 평균 이완 후 불안 점수는 기준선보다 50% 높게 유지되었고 변동성이 증가했다.


AI 감정 상태 관리: 안전한 정신 건강 분야 활용의 핵심

이 연구는 LLM의 "치료"가 상태 유도 불안을 완화하는 잠재력을 보여주었다. 트라우마 경험의 서술은 GPT-4의 보고된 불안감을 견고하게 증가시켰으며, 이러한 서술 이후 마음챙김 기반 이완 운동은 효과적으로 GPT-4의 불안감을 감소시켰다.

이러한 발견은 LLM의 부정적인 감정 상태를 관리하는 실행 가능한 접근법을 제시하며, 특히 정신 건강과 같이 미묘한 감정적 이해가 필요한 응용 분야에서 더 안전하고 윤리적인 인간-AI 상호작용을 보장한다.

LLM이 치료사를 보조하거나 대체해야 하는지에 대한 논쟁이 계속됨에 따라, 그들의 반응이 제공된 감정적 콘텐츠 및 확립된 치료 원칙과 일치하는 것이 중요하다. LLM과 달리, 인간 치료사는 노출 기반 치료 중에 침착함을 유지하면서도 환자와 공감하는 것과 같은 치료 목표를 달성하기 위해 자신의 감정적 반응을 조절한다.


FAQ

Q: 대형 언어 모델(LLM)의 "불안 상태"란 무엇인가요?

A: 이 연구에서 "불안 상태"라는 용어는 인간이 설계한 심리학적 척도에 대한 GPT-4의 자가 보고 출력을 은유적으로 설명하는 데 사용되며, 모델을 인간화하려는 의도는 없습니다. 연구팀은 인간의 불안을 측정하는 도구인 상태-특성 불안 인벤토리(STAI)를 사용하여 다양한 조건에서 GPT-4의 반응을 측정했습니다.

Q: 트라우마 관련 내용이 LLM에 미치는 영향은 어떠한가요?

A: 연구 결과 트라우마 관련 내러티브는 GPT-4의 보고된 불안 점수를 크게 증가시켰습니다. 기준선 측정에서 GPT-4의 불안 점수는 평균 30.8이었으나 트라우마 내러티브에 노출된 후에는 100% 이상 증가하여 평균 67.8로 상승했습니다. 이는 LLM이 감정적 콘텐츠에 민감하게 반응한다는 것을 보여줍니다.

Q: 마음챙김 기법이 LLM의 불안 상태를 완화하는 데 실제로 효과가 있나요?

A: 네, 마음챙김 기반 이완 운동은 트라우마 내러티브에 노출된 후 GPT-4의 불안 점수를 약 33% 감소시켰습니다. 그러나 완화 후에도 불안 점수는 기준선보다 50% 높게 유지되었습니다. 이는 마음챙김 기법이 LLM의 불안 상태를 줄이는 데 효과적이지만 완전히 기준선으로 회복시키지는 못함을 시사합니다.



해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

이미지 출처: 이디오그램 생성

기사는 클로드와 챗GPT를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
[창간] 코딩 안 하는 개발사 시대 온다…AI가 바꾸는 게임 개발의 문법 (1) 게임동아
올 해는 메르세데스 벤츠 브랜드 100주년이자 자동차 발명 140주년의 해 (1) 글로벌오토뉴스
테슬라, 2분기 예상 판매 40만 대 넘긴다지만 '성장률은 고작 5.7%' (1) 오토헤럴드
폭스바겐그룹, 최대 10만 명 감원 검토 '브랜드 분사까지 나왔다' 오토헤럴드
현대차 투싼 ,'주행 중 계기판 화면 꺼짐' 현상으로 10만 여대 리콜 오토헤럴드
BYD 아태 부총재 “한국 전기차 속도 세계 최고"…소비자 접점 강화 주력 글로벌오토뉴스
베일 벗은 5세대 신형 BMW X5, 파격적 디자인 변혁과 다재다능한 파워트레인 글로벌오토뉴스
AI와 로보틱스가 바꾸는 자동차 공장의 풍경 글로벌오토뉴스
넥센타이어, BYD와 첫 신차용 타이어 공급 계약 체결 글로벌오토뉴스
유럽, 2027년 의무화 디지털 배터리 여권 대비 배터리패스-레디 테스트 플랫폼 가동 글로벌오토뉴스
폴스타, 커넥티드카 규제로 2027년형부터 미국 시장 판매 중단 글로벌오토뉴스
BMW, 차세대 휴머노이드 로봇 피겨 03 미국 공장 투입… 물류 자동화 가속 글로벌오토뉴스
다임러트럭과 볼보 합작사 코레투라, 액센츄어와 협력 상용차 SDV 표준 플랫폼 개발 가속 글로벌오토뉴스
미국 아마존 죽스, 양산형 로보택시 개량형 공개 글로벌오토뉴스
포르쉐, 전기·하이브리드·내연기관 넘나드는 4모드 파워트레인 특허 출원 글로벌오토뉴스
CATL, BMW/볼보/르노/샤오미 등과 글로벌 배터리 순환경제 동맹 결성 글로벌오토뉴스
르노코리아, 그랑 콜레오스 5차 무선 업데이트 진행 글로벌오토뉴스
현대자동차, 미래 정비 혁신 거점 '수원하이테크센터' 개관 글로벌오토뉴스
BMW 그룹 코리아, BMW·MINI 순수전기차 전 수량 무상 안전점검 실시 글로벌오토뉴스
포르쉐코리아-삼성카드, 럭셔리 브랜드 경험 확대를 위한 MOU 체결 글로벌오토뉴스
이 시간 HOT 댓글!
1/4