챗GPT에 1,000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다 : 다나와 DPG는 내맘을 디피지

대규모 AI 언어모델이 JSON 같은 정해진 형식으로 답변을 만들 때, 문법적으로는 맞지만 비슷비슷한 답변만 반복한다는 문제가 새로운 연구로 확인됐다. 중국 베이징대 연구팀은 이 문제를 해결하기 위해 AI가 답변을 만드는 과정을 추적하고, 덜 사용된 답변 방식을 선택하도록 유도하는 새로운 방법을 개발했다. 이 기술은 답변의 다양성을 크게 높이면서도 처리 속도는 기존의 약 88% 수준을 유지했다.

AI에게 1,000개 답변 요청했더니 전체 가능성의 20%만 사용

해당 논문에 따르면, 연구팀은 현재 가장 많이 쓰이는 '아웃라인스'라는 AI 도구를 테스트했다. 이메일 주소와 웹 색상 코드를 만드는 규칙을 정해주고 각각 1,000개씩 답변을 요청했다. 그 결과 놀라운 사실이 드러났다. 이메일 주소의 경우 AI가 사용할 수 있는 전체 답변 방식 중 겨우 18.60%만 활용했고, 웹 색상 코드는 더 심각해서 16.96%만 사용했다.

쉽게 말해 AI는 문법상 만들 수 있는 다양한 형태의 답변 중 극히 일부만 반복해서 생성했다는 의미다. 예를 들어 이메일 주소에서 큰따옴표를 사용하는 특별한 형식이나, 웹 색상에서 HSL이라는 표현 방식은 전혀 만들어지지 않았다. 연구팀이 AI의 창의성을 높이는 설정값을 조정해봤지만 상황은 크게 나아지지 않았다. 이메일 주소의 다양성이 23.26%로 약간 올랐을 뿐, 여전히 대부분의 가능한 형태는 사용되지 않았다.

AI가 지나간 길을 기록해서 새로운 답변 방향으로 유도

연구팀이 만든 새로운 방법의 핵심은 AI가 답변을 만드는 과정을 계속 기록하고, 이 기록을 바탕으로 AI가 덜 사용한 방식을 선택하도록 유도하는 것이다. 구체적으로 AI가 답변을 만들 때 거쳐 간 모든 단계를 전체적으로 추적한다. 그리고 상대적으로 덜 사용된 경로에는 가산점을 주어 AI가 새로운 형태의 답변을 탐색하도록 돕는다.

하지만 단순히 가산점만 주면 AI가 같은 곳을 계속 맴돌며 끝없이 반복하는 문제가 생길 수 있다. 이를 막기 위해 연구팀은 한 번의 답변 생성 과정에서 각 단계를 얼마나 방문했는지도 별도로 기록했다. 그리고 자주 방문한 단계로 다시 가려는 선택에는 감점을 부여했다. 또한 상황에 따라 가산점과 감점의 강도를 자동으로 조절하는 장치도 추가해 지나친 조정을 방지했다.

답변 다양성 최대 45% 향상, 처리 속도는 88% 유지

연구팀은 이메일 주소, 웹 색상 코드, JSON 형식 데이터, 그리고 특정 단어를 피하는 답변 등 네 가지 규칙으로 새 방법을 시험했다. 큐웬2.5 모델을 사용해 각 규칙 당 1,000개씩 답변을 만든 결과, 기존 방법과 비교해 평균적으로 AI가 활용하는 답변 단계가 45%, 단계 간 이동 방식이 12%, 전체 답변 경로가 40% 증가했다.

답변 내용의 다양성을 측정하는 '벤디 점수'라는 지표는 평균 90% 올랐다. 이메일 주소의 경우 활용 단계가 18.60%에서 95.35%로, 웹 색상 코드는 16.96%에서 62.49%로 대폭 증가했다. 특히 특정 단어를 피하는 규칙에서는 유효한 모든 답변 단계를 활용하는 데 성공했다. 이렇게 다양성이 크게 향상됐는데도 처리 속도는 기존 방법의 평균 88.8% 수준을 유지했다. 추가 계산 과정이 필요해 약간 느려졌지만, 다양성 향상을 고려하면 충분히 받아들일 만한 수준이다.

창의성 설정값 높여도 새 방법이 여전히 우수, 품질도 유지

연구팀은 AI의 창의성을 높이는 설정값을 더 올린 상태에서도 추가 실험을 진행했다. 기존 방법의 다양성이 조금 나아지긴 했지만, 새 방법은 여전히 모든 측정 항목에서 앞섰다. 흥미롭게도 새 방법의 다양성 지표는 기본 설정 대비 약간 줄었는데, 이는 창의성 설정과 새 방법의 유도 장치가 서로 경쟁하기 때문이다.

답변 품질 측면에서도 중요한 발견이 있었다. 특정 단어를 피하는 규칙으로 만든 답변의 자연스러움을 분석한 결과, 창의성 설정을 높였을 때 기존 방법은 답변이 매우 부자연스러워졌지만, 새 방법은 기본 설정에서 다양성과 자연스러움의 더 나은 균형을 보여줬다.

각 구성 요소의 역할을 분석한 결과, 세 가지 핵심 장치(가산점, 감점, 자동 조절)가 모두 중요한 역할을 했다. 가산점을 제거하자 성능이 기존 방법보다 낮아졌고, 감점을 제거하면 답변 생성 과정이 불안정해져 제대로 된 답변을 거의 만들지 못했다.

실제 소프트웨어 테스트에서 검증 범위 최대 13% 확대

연구팀은 실제 활용 사례로 오픈소스 프로그램 라이브러리를 테스트하는 실험을 진행했다. 이메일 검증 프로그램과 웹 색상 변환 프로그램을 대상으로 생성된 테스트 데이터가 프로그램 코드를 얼마나 검증하는지 측정했다. 새 방법으로 만든 테스트 데이터는 이메일 검증 프로그램에서 46.19%에서 59.08%로 약 13%p 향상됐고, 웹 색상 변환 프로그램에서는 78.04%에서 83.18%로 약 5%p 상승했다.

이는 다양한 형태를 포함하는 테스트 데이터가 소프트웨어의 더 많은 부분을 실행하고 잠재적 오류를 발견하는 데 효과적임을 입증한다. 예를 들어 규칙상으로는 맞지만 프로그램의 기본 설정에서는 허용하지 않는 특별한 이메일 형식을 생성함으로써 예외 처리 기능을 테스트할 수 있었다.

FAQ ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. 정형화된 답변 생성이란 무엇이며 왜 중요한가요?

A: 정형화된 답변 생성은 AI가 JSON, XML 같은 정해진 형식을 따르는 답변을 만들도록 강제하는 기술입니다. 자율 AI 시스템이나 자동화 프로그램에서 AI 답변을 처리하려면 정확한 형식이 필수적이기 때문에 중요합니다.

Q2. 기존 방법의 답변이 비슷비슷한 이유는 무엇인가요?

A: AI는 학습한 데이터를 바탕으로 단어를 예측하므로 자연어에서 흔한 패턴을 선호합니다. 문법적으로는 맞지만 드문 형태는 학습 데이터에 적게 등장해 거의 생성되지 않습니다. 기존 방법은 문법만 검사할 뿐 다양성을 높이지 않습니다.

Q3. 이 새로운 방법을 실제로 어떻게 활용할 수 있나요?

A: 소프트웨어 테스트에서 다양한 특수 상황을 포함하는 테스트 데이터를 자동으로 만들거나, 자율 AI 시스템이 다양한 행동 계획을 수립하도록 돕는 데 활용할 수 있습니다. 또한 기계학습 학습용 데이터 확보에도 유용합니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: Automata-Based Steering of Large Language Models for Diverse Structured Generation

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

아쿠아맨 제이슨 모모아, 영화 '헬다이버즈' 주연으로	게임메카
'롬', 부스팅 서버 '실리드' 시즌2 오픈 실시	게임동아
‘대항해시대 오리진’, 신규 업데이트&설 명절 이벤트 실시	게임동아
넥슨의 야심작 ‘낙원’ 3월 글로벌 알파 테스트 참가자 모집	게임동아
넥슨, '2026년 NDC' 발표자 모집 개시	게임동아
'승리의 여신: 니케' × TV 애니메이션 '리코리스 리코일' 콜라보 업데이트	게임동아
"귀성길에서도 게임하자!" Xbox 설 맞이 새해 소망별 추천 게임 공개	게임동아
'400만 대 찍었다' 르노 부산 공장 글로벌 전략 허브로 자리매김	오토헤럴드
GM, 핵심 부품 협력사 ‘퍼스트 브랜드’ 파산으로 공급망 리스크 비상	오토헤럴드
'누적 6948대' 현대차 김기양 영업 이사 2025년 승용 부문 판매 1위	오토헤럴드
이름만 남긴 '토요타 하이랜더' 간판급 중형 순수 전기 SUV로 변신	오토헤럴드
'모터사이클 타고 영종도로' BMW, 모토라드 트랙 체험 참가자 모집	오토헤럴드
화물차 장거리·심야 운행 교통사고 예방하는 첨단 안전 사양에 주목	오토헤럴드
[EV 트렌드] 16개월 26만km 달린 '샤오미 SU7' 배터리 놀라운 잔존율	오토헤럴드
현대차, 인증중고차 이용 고객에 '더드림' 쿠폰 제공 프로모션 실시	오토헤럴드
'자꾸 이러면 문 닫는다' 테슬라, 獨 최대 노조 IG 메탈과 갈등 고조	오토헤럴드
현대차 아이오닉 5, 웨이모 5만대 공급설 '로보택시 대량 생산 기대'	오토헤럴드
“4 Million Units Produced” — Renault Busan Plant Establishes Itself as a Global Strategic Hub	오토헤럴드
'고전압 부품 체결 불량' 현대차 美 판매분 아이오닉 5·9 리콜	오토헤럴드
기아 역사 담긴 시흥서비스센터, 원스톱 복합 거점 플래그십 스토어 재탄생	오토헤럴드
[영상] 가성비 전기차의 진수, BYD 돌핀 시승기	글로벌오토뉴스
제네시스, 2027년 독자 플랫폼 시대 연다	글로벌오토뉴스
홍치 HS6 PHEV, 영하 20도 뚫고 1,131km 주행… 기네스 신기록 달성	글로벌오토뉴스
테슬라 주도 전기차 가격 인하에도 1월 미국 판매 30% 급락	글로벌오토뉴스
리비안 R2, 656마력의 압도적 성능… 테슬라 모델 Y 와 경쟁 예고	글로벌오토뉴스
현대차, 미국서 5년 연속 신기록… 2026년 미국산 하이브리드로 제2의 도약	글로벌오토뉴스
BYD, 800V 무장한 아토 3 에보 공개… 테슬라·현대차에 성능으로 도전장	글로벌오토뉴스
토요타, 2026년 미국산 전기차 하이랜더 EV 출시… 현지 생산 체제 대전환	글로벌오토뉴스
BYD, 맨체스터 시티와 글로벌 파트너십 체결	글로벌오토뉴스
HS효성더클래스, 설맞이 특별 프로모션 진행	글로벌오토뉴스
고속도로 화물차 사고 사망 비중 급증… 첨단 안전 시스템 중요성 부각	글로벌오토뉴스
BMW 모토라드, 영종도 서킷 열린다… 3월 1일 ‘모토라드 온 트랙’ 개최	글로벌오토뉴스
한성모터스, 설 맞이 ‘럭키 드라이브 2026’ 캠페인 개최	글로벌오토뉴스
콘티넨탈타이어, 신제품 ‘익스트림콘택트 XC7’ 소비자 체험단 모집	글로벌오토뉴스
지리자동차그룹, 1월 판매 27만 대 돌파… 해외 시장 121% ‘폭풍 성장’	글로벌오토뉴스
쉐보레, 2026 무상점검 캠페인 실시	글로벌오토뉴스
현대차, 2025년 전국 판매 우수자 명단 공개	글로벌오토뉴스
르노코리아 부산공장, 누적 생산 400만 대 돌파	글로벌오토뉴스
기아, 역사적 시흥공장 터에 ‘시흥 플래그십 스토어’ 공식 개관	글로벌오토뉴스
스텔란티스, 삼성SDI와 미국 배터리 합작사 철수 검토	글로벌오토뉴스
테슬라 세미, 98개월의 기다림 끝에 ‘양산형’ 최종 제원 공개	글로벌오토뉴스
볼보, 전용 플랫폼 ‘SPA3’로 전기 왜건 부활 예고	글로벌오토뉴스
브래드 피트의 ‘F1’, 오스카 노미네이트와 함께 속편 확정	글로벌오토뉴스
롤 사령탑은 강동훈, 2026 아시안게임 지도자 4인 선임	게임메카
붉은사막, 스팀 위시리스트 200만 건 돌파	게임메카
폴스타, 올해 판매 목표 4000대 이상…"신차 2종 투입 및 인프라 확충 추진"	IT동아
MSI 메인보드+라이젠 X3D 사면 ‘아크레이더스·붉은사막’ 둘 다 준다	뉴스탭
MSI RTX 50 시리즈 사면 ‘바이오하자드 레퀴엠’ 증정… 3월 16일까지 한정 이벤트	뉴스탭
에이서, 롯데하이마트 잠실점 전문 게이밍존 오픈…프레데터·니트로 직접 체험 및 최대 5년 보증 혜택	뉴스탭
“손바닥 크기에 AI 풀가속”… 에이수스, AMR 겨냥 초소형 엣지 컴퓨터 출격	뉴스탭
RTX 50 사면 ‘바이오하자드 레퀴엠’이 공짜…아이노비아 한정 프로모션	뉴스탭
“사랑 고백 뒤에 숨은 송금 요구”…밸런타인데이 노린 로맨스 스캠 경고	뉴스탭
“AM5 유저 주목”…애즈락, AGESA 1.3.0.0a 적용 베타 BIOS 전격 공개	뉴스탭
“정품 인증하면 경품까지”…인텔 코어 Ultra 빌드 자랑 프로모션 개시	뉴스탭
“월드컵 보러 갔다가 미국 일주?”…에어비앤비가 포착한 2026 여행 대이동	뉴스탭
“피스타치오 열풍 다시 분다”…메가MGC커피, 크런치 신메뉴로 설 연휴 공략	뉴스탭
“아시아 첫 선택은 한국”… 스웨덴 툴레 키즈, 패밀리 모빌리티 본격 상륙	뉴스탭
설 앞두고 한우 218% 급증…프리미엄·실속형 동반 강세에 소비 양극화 뚜렷	뉴스탭
“명절 설거지 공포 끝?” 58분 만에 끝내는 밀레 오토도스의 정체	뉴스탭
팀그룹 메모리 사면 ‘T-FORCE DELTA RGB’ 키링이 따라온다	뉴스탭
PNY RTX 50 사면 ‘바이오하자드 레퀴엠’이 공짜…STCOM, 한정 번들 프로모션	뉴스탭
XFX 라데온 RX 9070 사면 ‘붉은 사막’이 공짜…STCOM 한정 번들 시작	뉴스탭
설 연휴 앞두고 블랙박스 매출 2%↑…QHD·2채널·무료장착에 수요 몰렸다	뉴스탭
“설 선물, 홍삼 대신 ‘이것’?”…MZ가 선택한 간편 건강템 3종	뉴스탭
“딸기·초콜릿에 사랑을 담다”…발렌타인데이 ‘플레이버 메시지’ 마케팅 열전	뉴스탭
웹젠 뮤 온라인, ‘신비의 마스터리 이벤트’ 마련	게임동아
위메이드 '미르의 전설2' 2026년 로드맵 공개	게임동아
'아쿠아맨' 제이슨 모모아, 오는 11월 출시 예정인 헬다이버즈 영화에 출연한다	게임동아
블리자드 디아블로 30주년, 디아블로 시리즈에 업데이트 폭풍이 불어온다	게임동아
롤 '점멸' F와 D키 사용량 통계 공개, 의외로 D가 다수파	게임메카
펄어비스, 도깨비 출시 내후년으로 예상	게임메카
펄어비스, 2025년 영업손실 148억. 3월 붉은사막으로 반전 보인다	게임동아
넷마블 '킹 오브 파이터 AFK', ‘메탈 슬러그 3’ 컬래버 업데이트	게임동아
웹젠, 2025년 영업이익 297억 원...배당과 자사주 소각 등 주주 환원	게임동아
[순위분석] 클래식 불만 폭발, 기뻐하기엔 이른 리니지 (1)	게임메카
MSI, 지포스 RTX 50 시리즈 노트북 구매 시 '바이오하자드 레퀴엠' 게임 코드 증정	다나와
이엠텍, 지포스 그래픽카드 또는 PC 구매 시 '바이오하자드 레퀴엠' 번들 증정 (1)	다나와
NHN, ‘어비스디아’ 2월 내 출시… 日서 검증받은 서브컬처 콘텐츠 '투하'	게임동아
‘WWE 2K26’의 ‘2K 쇼케이스: 펑크드’ 상세 정보 공개	게임동아
‘아크 레이더스’ 신규 협동 PVE 이벤트 ‘공동 경계’ 업데이트	게임동아
드래곤 플라이트2, ‘무한의 성소’ 업데이트	게임동아
프라시아 전기, ‘광영의 전장: 셔플 렐름’ 업데이트	게임동아
PC, 콘솔 영역 넓히는 카카오게임즈, 핵심 타이틀 준비 상황은?	게임동아
엔씨(NC) ‘아이온2’, 신규 원정 ‘무의 요람’ 업데이트 ∙∙∙ 설날 이벤트 진행	게임동아
넷마블 'RF 온라인 넥스트', ‘무기형상’ 등 대규모 업데이트 실시	게임동아
위메이드, 4분기 영업이익 약 243억원...26년 글로벌 확대	게임동아
DN 수퍼스와 BNK 피어엑스, LCK컵 PO서 재격돌한다	게임메카
대원씨티에스, 펄어비스 기대작 ‘붉은 사막’ 게임 번들 프로모션 실시	다나와
[오늘의 스팀] 아이작 개발자의 뮤제닉스, 판매 1위 ‘압긍’	게임메카
'안전, 이제 볼보가 아니네' 제네시스, 가장 안전한 브랜드 톱 3 올라	오토헤럴드
오픈AI, 챗GPT에 광고 도입… 무료·저가 사용자 대상 테스트 시작	AI matters
커서, 강화학습 20배 확대한 'Composer 1.5' 공개… "속도와 성능 균형 맞췄다"	AI matters
협찬 Zero! 답나와 AI 홍보 영상 동영상 있음	다나와
엠게임 '귀혼M' 등 자사 게임 3종에서 설 명절 이벤트 개최	게임동아
드림에이지 ‘아키텍트’, ‘심연의 요새 점령전’ 업데이트	게임동아
크래프톤, ‘서브노티카’, ‘서브노티카 빌로우 제로’ 닌텐도 스위치 2로 출시	게임동아
AI뉴스 GPT5.3Codex, Opus 4.6, AI가 SW 기업 파괴, Kling 3.0, Seedance 2.0, openclaw 근황 등 동영상 있음	조코딩 JoCoding
'최악의 주가 폭락' 볼보자동차 4분기 영업이익 68% 급감	오토헤럴드
토요타, 소형 픽업 양산에 제동 '시장 규모와 관세가 발목'	오토헤럴드
영국 핵시설서 실전 투입된 로봇개 ‘스팟’, 원격 해체 작업 가속	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

챗GPT에 1,000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

챗GPT에 1,000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다

공유하기

공감/비공감