챗GPT에 1,000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다 : 다나와 DPG는 내맘을 디피지

대규모 AI 언어모델이 JSON 같은 정해진 형식으로 답변을 만들 때, 문법적으로는 맞지만 비슷비슷한 답변만 반복한다는 문제가 새로운 연구로 확인됐다. 중국 베이징대 연구팀은 이 문제를 해결하기 위해 AI가 답변을 만드는 과정을 추적하고, 덜 사용된 답변 방식을 선택하도록 유도하는 새로운 방법을 개발했다. 이 기술은 답변의 다양성을 크게 높이면서도 처리 속도는 기존의 약 88% 수준을 유지했다.

AI에게 1,000개 답변 요청했더니 전체 가능성의 20%만 사용

해당 논문에 따르면, 연구팀은 현재 가장 많이 쓰이는 '아웃라인스'라는 AI 도구를 테스트했다. 이메일 주소와 웹 색상 코드를 만드는 규칙을 정해주고 각각 1,000개씩 답변을 요청했다. 그 결과 놀라운 사실이 드러났다. 이메일 주소의 경우 AI가 사용할 수 있는 전체 답변 방식 중 겨우 18.60%만 활용했고, 웹 색상 코드는 더 심각해서 16.96%만 사용했다.

쉽게 말해 AI는 문법상 만들 수 있는 다양한 형태의 답변 중 극히 일부만 반복해서 생성했다는 의미다. 예를 들어 이메일 주소에서 큰따옴표를 사용하는 특별한 형식이나, 웹 색상에서 HSL이라는 표현 방식은 전혀 만들어지지 않았다. 연구팀이 AI의 창의성을 높이는 설정값을 조정해봤지만 상황은 크게 나아지지 않았다. 이메일 주소의 다양성이 23.26%로 약간 올랐을 뿐, 여전히 대부분의 가능한 형태는 사용되지 않았다.

AI가 지나간 길을 기록해서 새로운 답변 방향으로 유도

연구팀이 만든 새로운 방법의 핵심은 AI가 답변을 만드는 과정을 계속 기록하고, 이 기록을 바탕으로 AI가 덜 사용한 방식을 선택하도록 유도하는 것이다. 구체적으로 AI가 답변을 만들 때 거쳐 간 모든 단계를 전체적으로 추적한다. 그리고 상대적으로 덜 사용된 경로에는 가산점을 주어 AI가 새로운 형태의 답변을 탐색하도록 돕는다.

하지만 단순히 가산점만 주면 AI가 같은 곳을 계속 맴돌며 끝없이 반복하는 문제가 생길 수 있다. 이를 막기 위해 연구팀은 한 번의 답변 생성 과정에서 각 단계를 얼마나 방문했는지도 별도로 기록했다. 그리고 자주 방문한 단계로 다시 가려는 선택에는 감점을 부여했다. 또한 상황에 따라 가산점과 감점의 강도를 자동으로 조절하는 장치도 추가해 지나친 조정을 방지했다.

답변 다양성 최대 45% 향상, 처리 속도는 88% 유지

연구팀은 이메일 주소, 웹 색상 코드, JSON 형식 데이터, 그리고 특정 단어를 피하는 답변 등 네 가지 규칙으로 새 방법을 시험했다. 큐웬2.5 모델을 사용해 각 규칙 당 1,000개씩 답변을 만든 결과, 기존 방법과 비교해 평균적으로 AI가 활용하는 답변 단계가 45%, 단계 간 이동 방식이 12%, 전체 답변 경로가 40% 증가했다.

답변 내용의 다양성을 측정하는 '벤디 점수'라는 지표는 평균 90% 올랐다. 이메일 주소의 경우 활용 단계가 18.60%에서 95.35%로, 웹 색상 코드는 16.96%에서 62.49%로 대폭 증가했다. 특히 특정 단어를 피하는 규칙에서는 유효한 모든 답변 단계를 활용하는 데 성공했다. 이렇게 다양성이 크게 향상됐는데도 처리 속도는 기존 방법의 평균 88.8% 수준을 유지했다. 추가 계산 과정이 필요해 약간 느려졌지만, 다양성 향상을 고려하면 충분히 받아들일 만한 수준이다.

창의성 설정값 높여도 새 방법이 여전히 우수, 품질도 유지

연구팀은 AI의 창의성을 높이는 설정값을 더 올린 상태에서도 추가 실험을 진행했다. 기존 방법의 다양성이 조금 나아지긴 했지만, 새 방법은 여전히 모든 측정 항목에서 앞섰다. 흥미롭게도 새 방법의 다양성 지표는 기본 설정 대비 약간 줄었는데, 이는 창의성 설정과 새 방법의 유도 장치가 서로 경쟁하기 때문이다.

답변 품질 측면에서도 중요한 발견이 있었다. 특정 단어를 피하는 규칙으로 만든 답변의 자연스러움을 분석한 결과, 창의성 설정을 높였을 때 기존 방법은 답변이 매우 부자연스러워졌지만, 새 방법은 기본 설정에서 다양성과 자연스러움의 더 나은 균형을 보여줬다.

각 구성 요소의 역할을 분석한 결과, 세 가지 핵심 장치(가산점, 감점, 자동 조절)가 모두 중요한 역할을 했다. 가산점을 제거하자 성능이 기존 방법보다 낮아졌고, 감점을 제거하면 답변 생성 과정이 불안정해져 제대로 된 답변을 거의 만들지 못했다.

실제 소프트웨어 테스트에서 검증 범위 최대 13% 확대

연구팀은 실제 활용 사례로 오픈소스 프로그램 라이브러리를 테스트하는 실험을 진행했다. 이메일 검증 프로그램과 웹 색상 변환 프로그램을 대상으로 생성된 테스트 데이터가 프로그램 코드를 얼마나 검증하는지 측정했다. 새 방법으로 만든 테스트 데이터는 이메일 검증 프로그램에서 46.19%에서 59.08%로 약 13%p 향상됐고, 웹 색상 변환 프로그램에서는 78.04%에서 83.18%로 약 5%p 상승했다.

이는 다양한 형태를 포함하는 테스트 데이터가 소프트웨어의 더 많은 부분을 실행하고 잠재적 오류를 발견하는 데 효과적임을 입증한다. 예를 들어 규칙상으로는 맞지만 프로그램의 기본 설정에서는 허용하지 않는 특별한 이메일 형식을 생성함으로써 예외 처리 기능을 테스트할 수 있었다.

FAQ ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. 정형화된 답변 생성이란 무엇이며 왜 중요한가요?

A: 정형화된 답변 생성은 AI가 JSON, XML 같은 정해진 형식을 따르는 답변을 만들도록 강제하는 기술입니다. 자율 AI 시스템이나 자동화 프로그램에서 AI 답변을 처리하려면 정확한 형식이 필수적이기 때문에 중요합니다.

Q2. 기존 방법의 답변이 비슷비슷한 이유는 무엇인가요?

A: AI는 학습한 데이터를 바탕으로 단어를 예측하므로 자연어에서 흔한 패턴을 선호합니다. 문법적으로는 맞지만 드문 형태는 학습 데이터에 적게 등장해 거의 생성되지 않습니다. 기존 방법은 문법만 검사할 뿐 다양성을 높이지 않습니다.

Q3. 이 새로운 방법을 실제로 어떻게 활용할 수 있나요?

A: 소프트웨어 테스트에서 다양한 특수 상황을 포함하는 테스트 데이터를 자동으로 만들거나, 자율 AI 시스템이 다양한 행동 계획을 수립하도록 돕는 데 활용할 수 있습니다. 또한 기계학습 학습용 데이터 확보에도 유용합니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: Automata-Based Steering of Large Language Models for Diverse Structured Generation

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

이제 챗GPT가 고른 식당만 성공한다? 100곳 중 17곳만 추천받는 AI 시대 마케팅 전략 (1)	AI matters
AI는 답 모르면 무조건 "아니요"… 서울대 연구진, 챗GPT의 숨겨진 습관 발견	AI matters
챗GPT에 1,000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다	AI matters
한국 AI 스타트업, 개인정보보호법 규제로 혁신 난항… 데이터 활용 간극 여전	다나와
중국, ‘AI 플러스’ 전략으로 산업과 일상 전면 재편 추진	다나와
인간형 로봇 경쟁 본격화… 기술 진전 속 노동시장과 경제 구조 변화 우려 (2)	다나와
북한, AI 활용한 기상예측 시스템 구축… 자연재해 대응력 강화 노려	다나와
AWS, 문제 풀 때마다 학습하는 AI 개발... 경험 쌓을수록 저렴하고 정확해 (1)	AI matters
AI가 교수보다 더 깐깐해… AI한테 채점 맡겼더니, 학생 10명 중 4명 점수 떨어져 (1)	AI matters
"이전 답변 틀렸다" 한마디에 무너지는 AI... 같은 질문도 ‘대화 형식’으로 하면 답 달라져	AI matters
'불수능'이었다는 2026학년도 수능시험, 최신 AI들에게 풀게 한다면?	다나와
'최고의 아첨꾼AI' Grok, “엘론 머스크는 오타니를 제외하면 가장 뛰어나”	다나와
"AI가 버블이라고?ㅋㅋ" 엔비디아, 3분기 실적 '어닝 서프라이즈'...뉴욕증시 급등세로 마감 (2)	다나와
오픈AI, 장시간 코딩에 특화된 ‘GPT-5.1-Codex-Max’ 모델 공개 (1)	다나와
AI로 곰 출몰 위험 한눈에…日 조치대, 19개 지역 ‘곰 조우 예측 지도’ 공개	다나와
AI에 코딩 도구 주면 정답률 19%↑…풀이 과정은 41% 더 형편없어져	AI matters
챗GPT에게 "어느 나라가 더 나쁜가?" 물었더니... AI도 국가 차별한다 (4)	AI matters
긴 문서 속 숨은 해킹 명령어, 이제 AI가 스스로 찾아 차단한다	AI matters
디노티시아, SC25서 VDPU 기반 FPGA로 'AI 반도체' 성능 알린다	IT동아
AI 여러 개 쓰면 답 정확해진다더니... 토큰비용 5배에 정답률은 제자리	AI matters
챗GPT가 원전을 부른다… 데이터센터 전력 수요 폭증에 기업들 원전에 '올인'	AI matters
구글 CEO, “AI 맹신 금물”… 급격한 확산 속 과열 우려 제기	다나와
윈도우 11, AI 비서 기능 강화되지만… 새 악성코드 위협도 동반 (1)	다나와
폭스뉴스, 팔란티어와 손잡고 AI 기반 뉴스룸 구축… “미래 뉴스 절반은 AI가 만든다” 전망도	다나와
인도, AI 확산 영향으로 초보 개발자 일자리 최대 25퍼센트 감소	다나와
"AI가 CCTV 속 폭력 포착"... 제미나이가 ‘주먹 드는 순간’ 95% 정확도로 잡는다	AI matters
"챗GPT도 속았다"... AI에게 '답 없는 질문'하자 60% 이상 틀려	AI matters
'의학 드라마'로 AI 진단 실력 측정했더니... 희귀질환 진단 정확도 38% 그쳐	AI matters
AI 설득 실험, 챗GPT는 유연한 반면 제미나이는 상당한 고집불통	AI matters
구글 딥마인드 "AI도 사람처럼 소송 걸 수 있다"...중세 해양법 법에서 찾은 해법	AI matters
AI 과학자 '코스모스', 6개월 연구를 하루 만에 완료	AI matters
구글, AI 여행 도구 전면 확장…‘플라이트 딜스’ 글로벌 출시와 개인화 예약 기능 강화 (2)	다나와
마이크로소프트, 대기 예측용 AI ‘오로라’ 공개…극한 기상 대응 능력 높인다	다나와
AI 데이터센터 폭증 속 재생에너지 활용 가능성 주목… 지속가능성 논의 본격화 (1)	다나와
고어 버빈스키 감독, “생성형 AI가 영화 제작을 잠식 중”… 창작자 역할 약화 우려	다나와
미국서 성인·노년층 대상 AI 교육 프로그램 출범… 디지털 격차 완화 시도 본격화	다나와
중국, 2025 컴퓨팅 글로벌 컨퍼런스 개최… AI 생태계 중심 전략 부각	다나와
인도 기술 노동시장, AI 확산 속 구조 전환… 엔트리 직군 수요 20퍼센트 이상 감소	다나와
구글 딥마인드, 가상 3D 환경에서 협업·추론·학습하는 AI 에이전트 ‘SIMA 2’ 공개	다나와
유방암 치료와 연구에 AI 도입 가속… 디지털 헬스케어 혁신 본격화	다나와
챗GPT, 그룹 채팅 기능 시범 도입…함께 계획하고 결정하는 ‘공동 작업 공간’ 열린다	다나와
'쇼핑, 말로 합시다' 구글, AI 기반 ‘스마트 쇼핑’ 대규모 업그레이드 공개	다나와
한국, 국방 AI 고도화 필요성 제기… “더 빠르고 스마트한 시스템이 국가안보 핵심”	다나와
비자, AI 기반 커머스 확산 속 안전장치 필요성 강조… 아태 지역 중심으로 가드레일 구축 나서	다나와
Qualigen Therapeutics, AI와 Web3 중심의 AIxCrypto Holdings로 사명 변경… 사업 방향 대전환 선언	다나와
오라클 채권 매도 압력 확대… AI 투자 확대가 재무 리스크 우려로 번져	다나와
생성형 AI 사용자는 늘지만 클릭은 정체... 제로 클릭 시대 본격화	AI matters
"영업사원 절반이 사라진다"... AI가 바꾸는 세일즈의 미래 (6)	AI matters
"AI가 해킹 작업 80~90% 수행"… 앤트로픽, '최초 AI 자율 사이버 공격' 적발	AI matters
생성형 AI에 대한 사회적 인식 확대… 언론 신뢰와 윤리 논의도 가속	다나와
아마존, 운영 혁신 위한 에이전트형 AI와 로봇 기술 공개… 내부 프로세스 자동화 본격화	다나와
기업의 AI 스케일 확산, 여전히 느린 속도… 실제 적용은 4분의 1 수준	다나와
Moonshot AI, Kimi K2 Thinking 공개… GPT5 능가 주장으로 경쟁 구도 흔들다	다나와
Baidu, ERNIE 5.0 공개… GPT5와 Gemini 2.5 Pro 능가 주장	다나와
데이터 사일로가 AI 도입의 최대 걸림돌로 부상	다나와
인간 들어있냐는 평가 받던 로봇 샤오펑 아이언, 내부 기계 몸체 공개/ 25년 11월 2주차 / [주간 AI 뉴스] (1) 동영상 있음	AI matters
“SEO는 죽지 않았다” 시밀러웹이 말하는 구글 AI 모드 최적화 전략 10가지	AI matters
AI 도구 쓰는 마케터 82% "생산성 올랐다"… 2026 소셜 미디어 마케팅 지형도 (1)	AI matters
AI가 실험 없이 만든 가짜 논문, AI 심사위원에게 보여주자 최대 82% 통과 (4)	AI matters
작곡가도, 가수도 AI인 컨트리곡, 빌보드 컨트리 차트 정상 등극 (7)	다나와
LLM 탑재 로봇의 사회적 위험성 연구해 보니 “상상 이상으로 위험할 수도" (7)	다나와
오픈AI, 8가지 성격으로 한층 개인화된 버전 ‘ChatGPT 5.1’ 공개	다나와
'관상은 과학이야!' 펜실베니아대 연구팀, 얼굴로 성격과 성공 가능성 예측	다나와
'클랭커(Clanker)? 태스크매스킹(Taskmasking)?' 콜린스가 선정한 올해의 단어와 후보들	다나와
오픈AI, 미군 복무 전환자와 참전용사에게 ‘ChatGPT Plus’ 1년 무료 지원	다나와
하버드 의사 출신이 만든 ‘공감형 AI 동반자' 로빈(Robyn) 출시	다나와
공무원 10명 몫 하는 AI 비서 시대 온다... 공공기관이 지금 당장 해야 할 6가지 (1)	AI matters
맥킨지 "AI로 실질적 재무 성과 본 기업, 전체의 6%뿐"... 성공 기업의 비밀은?	AI matters
“AI가 아닌, 소비자가 주인공이어야 해”… 2026년 리테일 트렌드 5가지	AI matters
"챗GPT는 왜 배운 걸 금방 잊을까?" 구글이 밝힌 AI의 '기억상실' 비밀	AI matters
AI가 언어 습관까지 배운다? 치매 환자 소통 돕는 '맞춤형 대화 기술' 등장	AI matters
"URL만으로 충분하다"… AI, 정치 뉴스 판별 정확도 92% 돌파	AI matters
[11월 11일 AI 뉴스 브리핑] 스마일샤크, AI로 엠블록컴퍼니 뉴스레터 제작 시간 81% 단축 외	AI matters
AI뉴스 중국 AI 전세계 1등 달성, 생각 읽는 AI, GPT 5.1, 애플 제미나이 탑재, Grok 업데이트, 나노바나나2 유출 등 (9) 동영상 있음	조코딩 JoCoding
AI가 알츠하이머 조기 발견한다... 정확도 77% 진단 시스템 나왔다 (1)	AI matters
[11월 7일 AI 뉴스 브리핑] 이노디테크, AI 치아교정 솔루션으로 CES 2026 혁신상 수상 외	AI matters
작년에 학습한 AI, 올해엔 문제될 수도... ‘가치관 실시간 업데이트’ 기술 나왔다	AI matters
GPT-4o, 경제 전문가만큼 정확하게 미래 경제 예측... "복잡한 프롬프트 필요없다"	AI matters
“쇼핑, 검색말고 음성으로 해결한다”…네이버, 실행형 AI ‘에이전트N’으로 쇼핑 패러다임 대전환 예고	다나와
아마존, 초저가 전용 쇼핑앱 ‘아마존 바자( Amazon Bazaar)’ 출시… 텐무·쉬인 정조준	다나와
중국, 5G와 AI 융합 산업 본격화 — 글로벌 기술 표준 주도권 노린다	다나와
일본 NTT그룹, 자율주행 원격모니터링 영상 품질 평가 기술 국제표준으로 채택	다나와
AI가 드디어 '망각'을 배웠다... 효율적 메모리 관리로 성능 11% 향상	AI matters
AI, ‘덧셈’보다 ‘뺄셈’에서 훨씬 자주 틀린다?... “음수 앞에 ‘-‘부호 빼먹어” (1)	AI matters
"폴란드어 1위, 영어 6위, 한국어 22위"… AI 언어 이해력 테스트 결과 충격	AI matters
[11월 6일 AI 뉴스 브리핑] 뤼튼, 전 국민 AI 역량 강화 프로젝트 착수 외	AI matters
알리바바, 첫 스마트글라스 ‘Quark AI Glasses’ 12월 출시한다 (6)	다나와
구글, 브랜드의 ‘DNA’ 학습해 캠페인 제안하는 광고 이미지 자동 생성 툴 ‘포멜리’ 공개 (1)	다나와
메타, ‘Superintelligence Labs’ 인력 600명 무급 대기 조치 — 초거대 AI 부문 구조조정 본격화 (1)	다나와
IAC, “구글 AI 요약 검색이 광고수익 감소 초래” — 생성형 검색 시대의 미디어 위기 (1)	다나와
아시아 증시, 기술·반도체주 일제 하락 — AI 붐 과열에 따른 ‘냉각 신호’	다나와
Stability AI, Getty Images 상대 저작권 소송서 부분 승소 — 생성형 AI의 저작권 논쟁 새 국면	다나와
AI 도입으로 직원 한 주치 업무량 절감 가능하지만, 대부분은 AI 교육 받지 못해 (5)	다나와
AI 도입이 최근 감원의 새로운 변수로 부상 — 자동화 효율화 속 인력 재편 가속	다나와
신경·기호 결합 AI, 차세대 기업형 인공지능 인프라로 부상 — 스타트업 2천만 달러 투자 유치	다나와
AI 기업 밸류에이션, “거품 논란 수준” — 일부 스타트업 수조 달러 평가에 시장 경계감 확산 (1)	다나와
SK그룹, ‘AI 서밋’ 통해 글로벌 협력 강화 선언 — 미·중 갈등 완화 흐름 속 AI 생태계 전략 부각	다나와
AI 관련 주식·ETF, 상승세 이어가지만 ‘고평가 리스크’ 경고음 공존	다나와
오픈AI가 투자한 스타트업, 가정용 휴머노이드 ‘NEO’ 공개 (5)	다나와
맥킨지 "3번째 벤처부터 대박 난다"... 반복 구축 기업, AI 활용해 투자 대비 수익 1.9배	AI matters

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

챗GPT에 1,000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

챗GPT에 1,000번 물어봐도 비슷한 답변뿐... 베이징대 연구진이 해결책 찾았다

공유하기

공감/비공감