비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

"오늘은 내향적, 내일은 외향적?" 카이스트, AI 챗봇 '이중인격' 잡는 기술 개발

2025.06.29. 02:24:10
조회 수
373
15
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Spotting Out-of-Character Behavior
: Atomic-Level Evaluation of Persona Fidelity in Open-Ended Generation


한국과학기술원(KAIST) 연구진이 대형 언어모델(LLM)의 페르소나 일관성을 미세하게 평가할 수 있는 새로운 원자 단위 평가 프레임워크를 개발했다. 이 연구는 기존 평가 방법이 놓치는 미묘한 성격 불일치 현상을 정확히 탐지할 수 있는 혁신적인 접근법을 제시한다.

기존 평가로는 놓치는 AI의 '성격 변덕'…GPT-4o 실험 사례로 한계 드러나

연구진은 현재 대형 언어모델의 페르소나 일관성 평가가 전체 응답에 단일 점수를 부여하는 방식으로 이루어져 미묘한 성격 불일치를 감지하지 못한다는 문제를 지적했다. 예를 들어, '내향적이지도 외향적이지도 않은' 페르소나를 부여받은 GPT-4o가 생성한 두 개의 에세이를 기존 방법으로 평가하면 동일한 점수를 받지만, 실제로는 한 에세이는 일관된 성격을 보이는 반면 다른 에세이는 외향적-내향적 성향 사이에서 변동하는 모습을 보였다.

연구진이 개발한 원자 단위 평가 프레임워크는 이러한 문장 수준의 미세한 성격 변화를 정확히 포착할 수 있다. 이 시스템은 생성된 텍스트를 최소 단위로 분할하여 각각의 페르소나 일치도를 측정함으로써 기존 방법이 놓치는 OOC(Out-of-Character) 행동을 효과적으로 탐지한다.


문장별 성격 분석하는 ACCatom·ICatom·RCatom 세 가지 지표 개발

연구진은 페르소나 충실도를 종합적으로 평가하기 위해 세 가지 핵심 지표를 도입했다. ACCatom(원자 단위 정확도)은 개별 원자 단위가 할당된 페르소나와 얼마나 일치하는지를 측정한다. 이 지표는 기존의 응답 수준 평가와 달리 문장별로 페르소나 정렬을 평가하여 더욱 세밀한 분석을 가능하게 한다.

ICatom(원자 단위 내부 일관성)은 단일 생성 응답 내에서 페르소나 표현의 일관성을 평가한다. 이 지표는 특성 점수 분포의 정규화된 표준편차의 역수로 계산되며, 높은 점수일수록 내부적으로 일관된 페르소나 표현을 의미한다. RCatom(원자 단위 재검사 일관성)은 동일한 입력에 대해 반복 생성했을 때 페르소나 정렬의 재현성을 측정한다. 이 지표는 Earth Mover's Distance를 사용하여 분포 수준에서의 일관성을 평가한다.


설문조사 형태 작업에서 73% vs 소셜미디어 52%… 구조화된 작업일수록 성격 일관성 높아

실험 결과 모델들은 작업 유형에 따라 페르소나 충실도에서 뚜렷한 차이를 보였다. 설문조사 형태의 인터뷰 작업에서 가장 높은 성능을 기록했으며(ACCatom=0.73), 에세이 작업(0.58), 소셜미디어 포스트 작업(0.52) 순으로 성능이 나타났다. 이는 할당된 페르소나와 직접 연관된 어휘와 표현이 포함된 구조화된 질문이 페르소나 정렬을 개선하는 데 효과적임을 시사한다.

특히 주목할 점은 사회적으로 바람직한 성격 특성을 가진 페르소나에서 모델들이 일관되게 높은 성능을 보였다는 것이다. 예를 들어 '정서적으로 안정적인' 페르소나는 거의 완벽한 ACCatom 점수를 달성한 반면, '열린 마음도 닫힌 마음도 아닌' 중립적 페르소나에서는 현저히 낮은 성능을 보였다. 이는 RLHF(인간 피드백을 통한 강화학습) 과정에서 사회적으로 선호되는 특성이 모델 학습에 암묵적으로 반영되었음을 보여준다.


LLaMA 모델이 최고 성능, GPT는 내부 일관성 강점… 튜닝 모델이 기본 모델 압도

12개 대형 언어모델을 대상으로 한 종합 평가에서 튜닝된 모델들이 기본 모델들보다 모든 원자 단위 페르소나 충실도 점수에서 우수한 성능을 보였다. GPT 모델들과 Claude는 내부 일관성(ICatom)에서 강점을 보였으며(0.71-0.75), 이는 내부적으로 일관된 생성 능력을 의미한다. 인스트럭션 튜닝된 LLaMA 모델은 가장 높은 ACCatom과 RCatom 점수를 달성하여 페르소나에 맞는 문장 생성과 반복 생성 간 일관된 분포 유지에서 뛰어난 성능을 입증했다.

연구진의 지표 간 상관관계 분석 결과 정확도 기반 지표(ACCatom)와 일관성 기반 지표들(ICatom, RCatom) 간에는 중간 정도의 상관관계(r=0.45-0.51)만 나타났다. 이는 높은 페르소나 정확도가 반드시 강한 내부 일관성이나 재현성을 보장하지 않음을 의미하며, 다차원적 평가의 필요성을 강조한다. 특히 내부 일관성과 재검사 일관성 간 상관관계도 낮아(r=0.44) 단일 응답 내 안정성과 반복 생성 간 일관성이 서로 다른 측면임을 확인했다.


FAQ

Q: 원자 단위 평가 프레임워크가 기존 방법과 어떻게 다른가요?

A: 기존 방법은 전체 응답에 하나의 점수만 부여하지만, 원자 단위 평가는 문장별로 페르소나 일치도를 측정합니다. 이를 통해 평균적으로는 올바른 점수를 받지만 일부 문장에서 성격 불일치를 보이는 미묘한 문제를 정확히 탐지할 수 있습니다.

Q: 이 연구 결과가 실제 AI 서비스 개발에 어떻게 활용될 수 있나요?

A: 챗봇이나 AI 어시스턴트가 일관된 성격을 유지하는지 정밀하게 평가할 수 있어, 더욱 신뢰할 수 있고 몰입감 있는 AI 상호작용 서비스 개발에 기여할 수 있습니다. 특히 롤플레잉이나 개인화된 AI 서비스에서 중요한 지표로 활용 가능합니다.

Q: 모든 성격 유형에서 동일한 성능을 보이나요?

A: 아닙니다. 사회적으로 바람직한 성격(예: 정서적 안정성)에서는 높은 성능을 보이지만, 중립적이거나 사회적으로 덜 선호되는 성격에서는 상대적으로 낮은 성능을 보입니다. 이는 AI 모델 학습 과정에서 인간의 선호도가 반영된 결과로 분석됩니다.

해당 기사에 인용된 논문 원문은 arxiv에서 확인 가능하다.

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
[이구동성] 쇠더룬드 회장이 이끄는 넥슨 '7조' 원정대 게임메카
김태곤 신작 MMO, 타이틀명 '임진왜란: 조선의 반격' 확정 (1) 게임메카
100% 전기차 르노 세닉 E-테크, ‘2026 올해의 차' 주요 자동차 시상식 2관왕 오토헤럴드
'6년은 타야 본전' 기아 텔루라이드 하이브리드 연비·가격 공개  오토헤럴드
BMW 올리버 집세 회장, ‘2026 월드 카 어워즈 올해의 인물' 선정 오토헤럴드
값 내리자 일주일 만에 1000대…볼보 EX30 계약 급증 오토헤럴드
푸조 올 뉴 3008 스마트 하이브리드, ‘2026 올해의 차 디자인’ 2관왕 오토헤럴드
포르쉐 K1 전기차 계획 철회 'V6·V8 내연기관으로 2028년' 출시 오토헤럴드
사이버캡 양산 직후 총괄 매니저 퇴사 '테슬라 리더십 공백 확대' 오토헤럴드
'AI 수소 시티' 본격화, 현대차그룹 새만금 미래기술 기지 건설 오토헤럴드
대한항공-영국 스카이포츠, 상용 eVTOL 운영 플랫폼 개발 파트너십 체결 글로벌오토뉴스
애스톤 마틴, 실적 부진에 인력 20% 감축 및 EV 투자 축소 글로벌오토뉴스
현대차그룹 대학생 교육봉사단 ‘현대점프스쿨’ 13기 발대식 개최 글로벌오토뉴스
푸조, 2026 WEC 출격할 ‘9X8’ 신규 리버리 공개 글로벌오토뉴스
익숙한 차가 지루해진 시대…’르노 필랑트’가 던진 변화의 신호 글로벌오토뉴스
엔드게임 확 바뀐다, 패스 오브 엑자일 '허상' 3월 7일 시작 게임메카
데브시스터즈, 삼성전자와 협업해 ‘갤럭시 S26 시리즈’ 스페셜 테마 선보인다 게임동아
위메이드의 글로벌 e스포츠 토너먼트 ‘이미르컵 월드 챔피언십’, 오는 28일 개최! 게임동아
PvP 대전, 위메이드 이미르컵 월드 챔피언십 28일 개최 게임메카
10주년 맞은 스타듀 밸리, 새 로맨스 대상 2인 공개 게임메카
이 시간 HOT 댓글!
1/4