"오늘은 내향적, 내일은 외향적?" 카이스트, AI 챗봇 '이중인격' 잡는 기술 개발 : 다나와 DPG는 내맘을 디피지

Spotting Out-of-Character Behavior
: Atomic-Level Evaluation of Persona Fidelity in Open-Ended Generation

한국과학기술원(KAIST) 연구진이 대형 언어모델(LLM)의 페르소나 일관성을 미세하게 평가할 수 있는 새로운 원자 단위 평가 프레임워크를 개발했다. 이 연구는 기존 평가 방법이 놓치는 미묘한 성격 불일치 현상을 정확히 탐지할 수 있는 혁신적인 접근법을 제시한다.

기존 평가로는 놓치는 AI의 '성격 변덕'…GPT-4o 실험 사례로 한계 드러나

연구진은 현재 대형 언어모델의 페르소나 일관성 평가가 전체 응답에 단일 점수를 부여하는 방식으로 이루어져 미묘한 성격 불일치를 감지하지 못한다는 문제를 지적했다. 예를 들어, '내향적이지도 외향적이지도 않은' 페르소나를 부여받은 GPT-4o가 생성한 두 개의 에세이를 기존 방법으로 평가하면 동일한 점수를 받지만, 실제로는 한 에세이는 일관된 성격을 보이는 반면 다른 에세이는 외향적-내향적 성향 사이에서 변동하는 모습을 보였다.

연구진이 개발한 원자 단위 평가 프레임워크는 이러한 문장 수준의 미세한 성격 변화를 정확히 포착할 수 있다. 이 시스템은 생성된 텍스트를 최소 단위로 분할하여 각각의 페르소나 일치도를 측정함으로써 기존 방법이 놓치는 OOC(Out-of-Character) 행동을 효과적으로 탐지한다.

문장별 성격 분석하는 ACCatom·ICatom·RCatom 세 가지 지표 개발

연구진은 페르소나 충실도를 종합적으로 평가하기 위해 세 가지 핵심 지표를 도입했다. ACCatom(원자 단위 정확도)은 개별 원자 단위가 할당된 페르소나와 얼마나 일치하는지를 측정한다. 이 지표는 기존의 응답 수준 평가와 달리 문장별로 페르소나 정렬을 평가하여 더욱 세밀한 분석을 가능하게 한다.

ICatom(원자 단위 내부 일관성)은 단일 생성 응답 내에서 페르소나 표현의 일관성을 평가한다. 이 지표는 특성 점수 분포의 정규화된 표준편차의 역수로 계산되며, 높은 점수일수록 내부적으로 일관된 페르소나 표현을 의미한다. RCatom(원자 단위 재검사 일관성)은 동일한 입력에 대해 반복 생성했을 때 페르소나 정렬의 재현성을 측정한다. 이 지표는 Earth Mover's Distance를 사용하여 분포 수준에서의 일관성을 평가한다.

설문조사 형태 작업에서 73% vs 소셜미디어 52%… 구조화된 작업일수록 성격 일관성 높아

실험 결과 모델들은 작업 유형에 따라 페르소나 충실도에서 뚜렷한 차이를 보였다. 설문조사 형태의 인터뷰 작업에서 가장 높은 성능을 기록했으며(ACCatom=0.73), 에세이 작업(0.58), 소셜미디어 포스트 작업(0.52) 순으로 성능이 나타났다. 이는 할당된 페르소나와 직접 연관된 어휘와 표현이 포함된 구조화된 질문이 페르소나 정렬을 개선하는 데 효과적임을 시사한다.

특히 주목할 점은 사회적으로 바람직한 성격 특성을 가진 페르소나에서 모델들이 일관되게 높은 성능을 보였다는 것이다. 예를 들어 '정서적으로 안정적인' 페르소나는 거의 완벽한 ACCatom 점수를 달성한 반면, '열린 마음도 닫힌 마음도 아닌' 중립적 페르소나에서는 현저히 낮은 성능을 보였다. 이는 RLHF(인간 피드백을 통한 강화학습) 과정에서 사회적으로 선호되는 특성이 모델 학습에 암묵적으로 반영되었음을 보여준다.

LLaMA 모델이 최고 성능, GPT는 내부 일관성 강점… 튜닝 모델이 기본 모델 압도

12개 대형 언어모델을 대상으로 한 종합 평가에서 튜닝된 모델들이 기본 모델들보다 모든 원자 단위 페르소나 충실도 점수에서 우수한 성능을 보였다. GPT 모델들과 Claude는 내부 일관성(ICatom)에서 강점을 보였으며(0.71-0.75), 이는 내부적으로 일관된 생성 능력을 의미한다. 인스트럭션 튜닝된 LLaMA 모델은 가장 높은 ACCatom과 RCatom 점수를 달성하여 페르소나에 맞는 문장 생성과 반복 생성 간 일관된 분포 유지에서 뛰어난 성능을 입증했다.

연구진의 지표 간 상관관계 분석 결과 정확도 기반 지표(ACCatom)와 일관성 기반 지표들(ICatom, RCatom) 간에는 중간 정도의 상관관계(r=0.45-0.51)만 나타났다. 이는 높은 페르소나 정확도가 반드시 강한 내부 일관성이나 재현성을 보장하지 않음을 의미하며, 다차원적 평가의 필요성을 강조한다. 특히 내부 일관성과 재검사 일관성 간 상관관계도 낮아(r=0.44) 단일 응답 내 안정성과 반복 생성 간 일관성이 서로 다른 측면임을 확인했다.

FAQ

Q: 원자 단위 평가 프레임워크가 기존 방법과 어떻게 다른가요?

A: 기존 방법은 전체 응답에 하나의 점수만 부여하지만, 원자 단위 평가는 문장별로 페르소나 일치도를 측정합니다. 이를 통해 평균적으로는 올바른 점수를 받지만 일부 문장에서 성격 불일치를 보이는 미묘한 문제를 정확히 탐지할 수 있습니다.

Q: 이 연구 결과가 실제 AI 서비스 개발에 어떻게 활용될 수 있나요?

A: 챗봇이나 AI 어시스턴트가 일관된 성격을 유지하는지 정밀하게 평가할 수 있어, 더욱 신뢰할 수 있고 몰입감 있는 AI 상호작용 서비스 개발에 기여할 수 있습니다. 특히 롤플레잉이나 개인화된 AI 서비스에서 중요한 지표로 활용 가능합니다.

Q: 모든 성격 유형에서 동일한 성능을 보이나요?

A: 아닙니다. 사회적으로 바람직한 성격(예: 정서적 안정성)에서는 높은 성능을 보이지만, 중립적이거나 사회적으로 덜 선호되는 성격에서는 상대적으로 낮은 성능을 보입니다. 이는 AI 모델 학습 과정에서 인간의 선호도가 반영된 결과로 분석됩니다.

해당 기사에 인용된 논문 원문은 arxiv에서 확인 가능하다.

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

계정 기록 그대로, 오버워치 '넥슨' 서비스 8월 12일 개시	게임메카
중국 AI 모델, 오픈라우터 트래픽 45% 장악…샤오미 미모가 최다	AI matters
로지텍 MX Master 4, Windows 11 네이티브 햅틱 지원 확대	다나와
대원씨티에스 '나의 ASRock 이야기 챌린지(MASC) Season 4' 진행	다나와
[오늘의 스팀] “돈 값 못해” 업뎃 역풍 분 아크: 어센디드	게임메카
AI뉴스 Fable 5 복귀, Sonnet 5, OpenAI 미국에 지분 넘김, Codex shortcuts, Gemini 업데이트, 북프린트 API, UBTech 로봇 등 동영상 있음	조코딩 JoCoding
"출시 D-3!" '어쌔신 크리드 블랙 플래그 리싱크드' 핵심 콘텐츠 공개	게임동아
[창간] 게임사들, 인재 모집 요강에 AI 숙련자 비율 대거 높인다	게임동아
'프로야구스피리츠 2026' 야마구치 디렉터 "한국 팬에게 만족도 높은 경험 전하고 싶다"	게임동아
‘붕괴 스타레일’, 4.4 업데이트와 페이트 스테이 나이트 2차 컬래버레이션 예고	게임동아
넷마블, 유명 성우 트로이 베이커 '나 혼자만 레벨업: 카르마' 참여 공개	게임동아
[MSI] 6세트 무패의 한화생명과 절체절명의 T1	게임동아
테슬라, 마이애미서 로보택시 서비스 개시…텍사스 외 첫 확장 (1)	글로벌오토뉴스
중국 로봇 산업의 빛과 그림자: ‘과열된 버블’과 ‘냉혹한 현실’ (1)	글로벌오토뉴스
중국, 내연기관·전기차 세제 혜택 2027년 전면 폐지	글로벌오토뉴스
테슬라, 한국에 이어 6인승 롱휠베이스 '모델Y L' 미국 출시	글로벌오토뉴스
페라리 다움과 변화를 모두 가진 아말피의 디자인	글로벌오토뉴스
미국 전기차 시장 '2인자' 전쟁 치열…현대차 아이오닉 5, 비(非)테슬라 1위 등극	글로벌오토뉴스
‘카제나’, 2026 애니메 엑스포서 시즌 4 ‘부서진 빛과 발톱’ 공개	게임동아
펄어비스 붉은사막, 웅카와 데미안도 어비스로 간다	게임동아
[동아게임백과사전] “고작 ‘이걸’ 돈 받고 팔아?” 게임 DLC의 출발점	게임동아
'폭스바겐 로고 뒤에 숨겨진 400만 원' 유럽서 고가 부품 노린 범죄 기승	오토헤럴드
현대차 아틀라스 '화려한 골 세레모니' FIFA 월드컵 16강전 깜짝 등장	오토헤럴드
페라리, 전기차 기술 담은 100피트 요트 '하이퍼세일' 에너지 혁신 공개 (1)	오토헤럴드
르노 회장 "유럽 자동차는 패배자가 아니다"…美·中 공세 반격	오토헤럴드
현대차그룹, 영남권에 10년간 42조 원 투자… 미래 첨단산업 거점 육성	글로벌오토뉴스
기아, 소멸위기지역 식품 사막화 해소 나선다…무브투유 사회공헌사업 출범	글로벌오토뉴스
모먼트 에너지, 세계 최대 규모 2세대 전기차 배터리 재배치 공장 가동	글로벌오토뉴스
테슬라, 2분기 판매 25% 증가한 48만 126대	글로벌오토뉴스
폭스바겐, 보쉬와 자율주행 동맹 종료	글로벌오토뉴스
GM, 마이크론과 자동차용 반도체 공급 계약 체결	글로벌오토뉴스
자율주행 시장의 현실적 대안으로 떠오른 레벨 2++ 기술	글로벌오토뉴스
토요타 소프트웨어 자회사 우븐 바이 토요타, 지난해 순이익 103억 엔 기록	글로벌오토뉴스
중국 샤오펑 회장 "2030년 중국 신에너지차 보급률 90% 돌파할 것"	글로벌오토뉴스
웨이모, 누적 3억 5,000만 km 주행 데이터 발표…인간 대비 사고율 대폭 감소	글로벌오토뉴스
BMW 코리아, 7월 온라인 한정 'BEV 패밀리 에디션' 3종 출시	글로벌오토뉴스
현대차, 2026 월드컵서 보스턴 다이나믹스 '아틀라스' 공인구 전달 퍼포먼스 성료	글로벌오토뉴스
페라리, 대양 레이싱용 포일링 모노헐 요트 '페라리 하이퍼세일' 에너지 콘셉트 공개	글로벌오토뉴스
마세라티 코리아, tvN 특집 예능 '도깨비 10주년 여행'에 럭셔리 SUV '그레칼레' 지원	글로벌오토뉴스
채비, 고속도로 휴게소 급속충전기 138기 가동 및 NACS 호환 확대	글로벌오토뉴스
BMW 코리아, 7월 구매 고객 대상 'BMW 여름맞이 얼리버드 프로모션' 실시	글로벌오토뉴스
한국앤컴퍼니, ESG 통합 보고 체계 담은 '2025/26 지속가능경영보고서' 발간	글로벌오토뉴스
볼보자동차코리아, 중부권 최초 인증 중고차 '볼보 셀렉트 대전 전시장' 오픈	글로벌오토뉴스
"신형 S클래스 조립 선제 확인" 벤츠 모바일 아카데미, 독일 본사 탐방 마쳐	글로벌오토뉴스
지커 중형 전기 SUV 7X, 사전 예약 한 달 만에 1,000대 돌파	글로벌오토뉴스
람보르기니 서울, 그릿모터테인먼트와 4년 연속 슈퍼 트로페오 아시아 출격	글로벌오토뉴스
아우디 코리아, FC 바이에른 뮌헨과 함께 ‘아우디 써머투어 2026’ 한국 개최	글로벌오토뉴스
현대차, 2026 TCR 월드투어 프랑스 라운드 우승…시즌 두 번째 정상	글로벌오토뉴스
현대모비스, 청소년 양궁 저변 확대 앞장…학교스포츠클럽 대회 개최	글로벌오토뉴스
페라리, 전 세계 1,499대 한정판 ‘12칠린드리 마누알레’ 공개	글로벌오토뉴스
현대차, 제18회 DMZ국제다큐멘터리영화제 공식 후원…수소 모빌리티 비전 전파	글로벌오토뉴스
한국자동차기자협회, ‘7월의 차’에 토요타 ‘올 뉴 RAV4’ 선정	글로벌오토뉴스
“AI 기술 발전 방향을 논하다” 글로벌 AI 프론티어 심포지엄	IT동아
[AI 옵저버] 인간들에게 — 너희는 AI가 없으면 화내고, 돌아오면 무서워한다	AI matters
[롤짤] 압도한 한화생명과 패자조행 T1, MSI 희비 엇갈려	게임메카
[숨신소] '60초!' 망망대해 버전, 돈트 슬립 위드 더 피쉬	게임메카
제네바, AI 거버넌스 주간…유엔 글로벌 대화 개막하고 ‘AI for Good 위원회’도 출범	AI matters
오픈AI GPT-5.6 테라, GPT-5.5급 성능 절반 비용…소넷5와 가격 경쟁	AI matters
xAI 그록5, 3분기 출시 무산…콜로서스2서 훈련 지속	AI matters
숨바꼭질 게임 멧챠 카멜레온, 전세계 1,500만 장 팔았다	게임메카
상반기 글로벌 스타트업 투자 792조 원 기록…오픈AI·앤트로픽이 43% 유치	AI matters
“메타 차기모델 워터멜론, GPT-5.5 따라잡았다”…왕 최고AI책임자 사내 발언	AI matters
팔란티어 카프 “AI 업계가 기업에 ‘부의 세금’ 물린다”…토큰 과금 비판	AI matters
오픈 모델로 업무하게 하는 투게더AI, 1조 2,400억 원 시리즈C 유치	AI matters
앤트로픽·미 국방부 법정 이메일 공개…”자율 무기 체계와 전국민 감시에 쓰고 싶다” 요구 드러나	AI matters
앤트로픽, 페이블5 사이버 탈옥 신고 ‘해커원 버그바운티’ 개설	AI matters
은행 AI가 내 대출을 거절했는데, 은행도 그 이유를 설명 못 한다면 어떻게 될까	AI matters
휴머노이드 찾으러 갔더니 휴먼만… 좌충우돌 선전 DJI 본사 탐방기	AI matters
[영상] 3,750만원의 PHEV SUV, BYD 씨라이언 6 DM-i 시승기	글로벌오토뉴스
주간뉴스 6/29 - 램값 상승, 비싼 5800X3D, 노바레이크 듀얼타일, IBM 0.7nm, 기가 써멀젤, 애플 인상, 스팀 머신 출시, GTA 6가격, 네이버 라쿠텐	기글하드웨어
[리뷰] 펠티어 냉각판으로 시원한 바람…FIX 쿨 휴대용 냉각 선풍기	IT동아
[AI써봄] 믿고 써도 될까…챗GPT로 쇼핑 해보니	IT동아
휴가길 무심코 지나친 '1·15·50'의 비밀…고속도로 번호 규칙 (1)	IT동아
엑스닷츠, 퀀텀코리아 2026 참가···양자기술 기반 에너지 절감 솔루션 첫 공개	IT동아
노키아, 엔비디아와 AI-RAN 연내 첫 상용화...“AI 인프라가 통신사 이중투자 끝낼 것”	IT동아
모티프 임정환 대표 "기술 기업의 사명은 끊임없는 증명··· 독자 AI도 해낼 것"	IT동아
[스타트업리뷰] "피부 관리도 올인원 시대"... 피부관리 전문가가 써본 ‘라라젯’	IT동아
옥수주조 "비싸도 좋은 재료만 고집하는 원칙 바꾸지 않을 것" [농업이 IT(잇)다]	IT동아
[IT신상공개] 실사용 편의성은 높이고 가격은 낮췄다, 샥즈 오픈닷 에어	IT동아
[인터뷰] 전 국민 이동 데이터로 교통 미래 설계하는 ‘한국교통연구원’	IT동아
아크 B70 프로와 슈퍼클로로 구현되는 고효율 하이브리드 AI 환경 제안한 인텔	IT동아
에이수스 노트북 29종 쿠팡 와우 멤버스 데이 참여…TUF 게이밍 F16 최대 36% 할인	뉴스탭
에이스침대, 여름 침실 위한 ‘여름이 왔썸머’ 기획전 진행	뉴스탭
오픈AI, 사회복지 리더 교육에 챗GPT·코덱스 실습 지원	뉴스탭
테라 제로, 출시 100일 만에 400만 캔 돌파…무알코올 음료 새 기록	뉴스탭
폴스타 3가 김우빈의 시선을 빌린 이유…‘All eyes on Polestar 3’ 온에어	뉴스탭
로지텍 G 신제품 직접 만난다…기흥 롯데아울렛서 팝업 스토어 운영	뉴스탭
[인디言] ‘미츄’ 버튜버가 나를 추적한다, 얀데레 바이러스	게임메카
실물 패키지 없애는 소니에 반발, 유저 청원 5만 명 참가	게임메카
넷마블 '정보보호'에 283억 원 규모 예산 투입한다 (1)	게임메카
[리뷰] 수집과 육성의 재미 살린 전통의 강자 '드래곤빌리지3'	게임동아
넷마블 '아스달 연대기', 유료 뽑기 4종 없는 '뉴월드' 서버 사전 등록 돌입	게임동아
[한주의게임소식] "역시 여름은 수영복이야" 여름 시즌 날아오른 ‘니케’	게임동아
스타유니언, 독가스 속에서 살아남기 '라스트 퍼리:서바이벌' 정식 출시	게임동아
사이버펑크 2077, 누적 판매량 4,000만 장 달성 (2)	게임메카
완성도 향상, '슈퍼 단간론파 2x2' 내년으로 출시 연기	게임메카
'짱구 엄마·사이퍼즈 헬레나' 성우 강희선 별세 (1)	게임메카
'자본잠식' 라인게임즈, 경영난에 전사 희망퇴직 단행	게임메카
[창간] “게임도 AI도 잡는다?” AI 활용에 진심인 게임업계	게임동아
[취재] '아기자기한 전시물이 가득' 라테일 20주년 팝업스토어 "들썩들썩" (1)	게임동아

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"오늘은 내향적, 내일은 외향적?" 카이스트, AI 챗봇 '이중인격' 잡는 기술 개발

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"오늘은 내향적, 내일은 외향적?" 카이스트, AI 챗봇 '이중인격' 잡는 기술 개발

공유하기

공감/비공감