비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

"오늘은 내향적, 내일은 외향적?" 카이스트, AI 챗봇 '이중인격' 잡는 기술 개발

2025.06.29. 02:24:10
조회 수
48
8

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Spotting Out-of-Character Behavior
: Atomic-Level Evaluation of Persona Fidelity in Open-Ended Generation


한국과학기술원(KAIST) 연구진이 대형 언어모델(LLM)의 페르소나 일관성을 미세하게 평가할 수 있는 새로운 원자 단위 평가 프레임워크를 개발했다. 이 연구는 기존 평가 방법이 놓치는 미묘한 성격 불일치 현상을 정확히 탐지할 수 있는 혁신적인 접근법을 제시한다.

기존 평가로는 놓치는 AI의 '성격 변덕'…GPT-4o 실험 사례로 한계 드러나

연구진은 현재 대형 언어모델의 페르소나 일관성 평가가 전체 응답에 단일 점수를 부여하는 방식으로 이루어져 미묘한 성격 불일치를 감지하지 못한다는 문제를 지적했다. 예를 들어, '내향적이지도 외향적이지도 않은' 페르소나를 부여받은 GPT-4o가 생성한 두 개의 에세이를 기존 방법으로 평가하면 동일한 점수를 받지만, 실제로는 한 에세이는 일관된 성격을 보이는 반면 다른 에세이는 외향적-내향적 성향 사이에서 변동하는 모습을 보였다.

연구진이 개발한 원자 단위 평가 프레임워크는 이러한 문장 수준의 미세한 성격 변화를 정확히 포착할 수 있다. 이 시스템은 생성된 텍스트를 최소 단위로 분할하여 각각의 페르소나 일치도를 측정함으로써 기존 방법이 놓치는 OOC(Out-of-Character) 행동을 효과적으로 탐지한다.


문장별 성격 분석하는 ACCatom·ICatom·RCatom 세 가지 지표 개발

연구진은 페르소나 충실도를 종합적으로 평가하기 위해 세 가지 핵심 지표를 도입했다. ACCatom(원자 단위 정확도)은 개별 원자 단위가 할당된 페르소나와 얼마나 일치하는지를 측정한다. 이 지표는 기존의 응답 수준 평가와 달리 문장별로 페르소나 정렬을 평가하여 더욱 세밀한 분석을 가능하게 한다.

ICatom(원자 단위 내부 일관성)은 단일 생성 응답 내에서 페르소나 표현의 일관성을 평가한다. 이 지표는 특성 점수 분포의 정규화된 표준편차의 역수로 계산되며, 높은 점수일수록 내부적으로 일관된 페르소나 표현을 의미한다. RCatom(원자 단위 재검사 일관성)은 동일한 입력에 대해 반복 생성했을 때 페르소나 정렬의 재현성을 측정한다. 이 지표는 Earth Mover's Distance를 사용하여 분포 수준에서의 일관성을 평가한다.


설문조사 형태 작업에서 73% vs 소셜미디어 52%… 구조화된 작업일수록 성격 일관성 높아

실험 결과 모델들은 작업 유형에 따라 페르소나 충실도에서 뚜렷한 차이를 보였다. 설문조사 형태의 인터뷰 작업에서 가장 높은 성능을 기록했으며(ACCatom=0.73), 에세이 작업(0.58), 소셜미디어 포스트 작업(0.52) 순으로 성능이 나타났다. 이는 할당된 페르소나와 직접 연관된 어휘와 표현이 포함된 구조화된 질문이 페르소나 정렬을 개선하는 데 효과적임을 시사한다.

특히 주목할 점은 사회적으로 바람직한 성격 특성을 가진 페르소나에서 모델들이 일관되게 높은 성능을 보였다는 것이다. 예를 들어 '정서적으로 안정적인' 페르소나는 거의 완벽한 ACCatom 점수를 달성한 반면, '열린 마음도 닫힌 마음도 아닌' 중립적 페르소나에서는 현저히 낮은 성능을 보였다. 이는 RLHF(인간 피드백을 통한 강화학습) 과정에서 사회적으로 선호되는 특성이 모델 학습에 암묵적으로 반영되었음을 보여준다.


LLaMA 모델이 최고 성능, GPT는 내부 일관성 강점… 튜닝 모델이 기본 모델 압도

12개 대형 언어모델을 대상으로 한 종합 평가에서 튜닝된 모델들이 기본 모델들보다 모든 원자 단위 페르소나 충실도 점수에서 우수한 성능을 보였다. GPT 모델들과 Claude는 내부 일관성(ICatom)에서 강점을 보였으며(0.71-0.75), 이는 내부적으로 일관된 생성 능력을 의미한다. 인스트럭션 튜닝된 LLaMA 모델은 가장 높은 ACCatom과 RCatom 점수를 달성하여 페르소나에 맞는 문장 생성과 반복 생성 간 일관된 분포 유지에서 뛰어난 성능을 입증했다.

연구진의 지표 간 상관관계 분석 결과 정확도 기반 지표(ACCatom)와 일관성 기반 지표들(ICatom, RCatom) 간에는 중간 정도의 상관관계(r=0.45-0.51)만 나타났다. 이는 높은 페르소나 정확도가 반드시 강한 내부 일관성이나 재현성을 보장하지 않음을 의미하며, 다차원적 평가의 필요성을 강조한다. 특히 내부 일관성과 재검사 일관성 간 상관관계도 낮아(r=0.44) 단일 응답 내 안정성과 반복 생성 간 일관성이 서로 다른 측면임을 확인했다.


FAQ

Q: 원자 단위 평가 프레임워크가 기존 방법과 어떻게 다른가요?

A: 기존 방법은 전체 응답에 하나의 점수만 부여하지만, 원자 단위 평가는 문장별로 페르소나 일치도를 측정합니다. 이를 통해 평균적으로는 올바른 점수를 받지만 일부 문장에서 성격 불일치를 보이는 미묘한 문제를 정확히 탐지할 수 있습니다.

Q: 이 연구 결과가 실제 AI 서비스 개발에 어떻게 활용될 수 있나요?

A: 챗봇이나 AI 어시스턴트가 일관된 성격을 유지하는지 정밀하게 평가할 수 있어, 더욱 신뢰할 수 있고 몰입감 있는 AI 상호작용 서비스 개발에 기여할 수 있습니다. 특히 롤플레잉이나 개인화된 AI 서비스에서 중요한 지표로 활용 가능합니다.

Q: 모든 성격 유형에서 동일한 성능을 보이나요?

A: 아닙니다. 사회적으로 바람직한 성격(예: 정서적 안정성)에서는 높은 성능을 보이지만, 중립적이거나 사회적으로 덜 선호되는 성격에서는 상대적으로 낮은 성능을 보입니다. 이는 AI 모델 학습 과정에서 인간의 선호도가 반영된 결과로 분석됩니다.

해당 기사에 인용된 논문 원문은 arxiv에서 확인 가능하다.

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
장유빈, LIV 골프 댈러스 2R 공동 51위…리드 3타 차 선두 연합뉴스
임진희·이소미, 다우 챔피언십 3R 2위…박성현·윤이나 4위 연합뉴스
뉴스 분석해 전염병 예측? 인도서 운영 중인 AI 실시간 질병 감시체계 AI matters
"오늘은 내향적, 내일은 외향적?" 카이스트, AI 챗봇 '이중인격' 잡는 기술 개발 AI matters
챗GPT 모바일 트래픽 60% 차지... 2030년 스마트 글래스 시대 온다 AI matters
AI가 개발자 대체한다? 바이브 코딩 AI 도구 웹사이트 트래픽 127% 폭증 AI matters
카카오, 생성형 AI 안전장치 만든다… AI 보호 기술 총정리한 ‘ESG 보고서’ 공개 AI matters
메타, 작가들과의 AI 저작권 소송에서 승소... "시장 영향 입증 부족" AI matters
EBS, 'AI 단편극장' 27일 방송... “국내 최초 전편 AI 제작” AI matters
게티이미지, 스태빌리티 AI 상대 영국 내 저작권 주장 철회… 美 소송은 계속 AI matters
아마존 링, AI ‘모션 알림’ 도입… “검은 개와 계단 오르는 사람” 텍스트로 알려줘 AI matters
버니 샌더스 “AI가 생산성 높인다면, 노동자에겐 주 4일 근무 보장하라” AI matters
구글, AI 코딩 도우미 ‘제미나이 CLI’ 오픈소스로 공개… VS 코드 에이전트 지원 AI matters
[순위분석] 2년 반 만의 신 직업, 메이플 ‘2위’ 등극 게임메카
수노, 유디오에 숨겨진 '주파수 지문' 발견... AI 음악, 이제 전부 잡아낸다 AI matters
영혼 세계의 수호자, 롤 신규 챔피언 ‘유나라’ 영상 공개 게임메카
"이제 AI가 스스로 공부한다" MIT, 인간 없이 스스로 학습하는 AI 언어 모델 개발 AI matters
직장 내 AI 도입률 93%지만 직원 인지도는 33%에 그쳐... 소통과 교육 필수 AI matters
"AI 많이 쓸수록 더 행복" 직장인 대상 설문으로 밝혀진 직장 생활 만족도 차이 AI matters
2025년 AI 투자 대폭발, 주요 5개국이 수천조 원 쏟아붓는 이유와 전략 분석 AI matters
이 시간 HOT 댓글!
1/4