로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    AI 여러 개 쓰면 답 정확해진다더니... 토큰비용 5배에 정답률은 제자리

    2025.11.20. 10:13:24
    읽음231

    여러 AI가 함께 문제를 풀면 더 정확한 답을 낼 수 있다는 아이디어가 주목받고 있다. 하지만 미국 버지니아공대 연구진이 발표한 논문에 따르면, 모든 질문에 AI끼리 토론을 시키면 연산 비용만 폭증하고 오히려 정답률이 떨어질 수 있다. 이에 연구진은 'iMAD'라는 시스템을 개발했다. iMAD는 토론이 실제로 도움이 될 때만 선택적으로 작동해서, 비용은 92%까지 줄이면서 정답률은 오히려 13.5%나 높였다.

    AI 여러 개 쓰면 좋다던데, 비용은 5배 정확도는 고작 5%

    요즘 대형 언어모델 기반 AI 시스템은 혼자서도 복잡한 문제를 단계별로 풀어낼 수 있다. 하지만 한 AI만 쓰면 생각의 폭이 좁아서 다른 해결 방법을 놓칠 수 있다. 그래서 등장한 게 '멀티 에이전트 토론' 방식이다. 여러 AI가 각자 답을 내고 서로 비판하면서 더 나은 답을 찾아가는 것이다.

    그런데 문제가 있었다. 연구진이 6개 데이터셋으로 실험해보니, 이 토론 방식은 혼자 푸는 것보다 토큰을 3배에서 5배나 더 많이 썼다. 토큰은 AI가 글자를 처리하는 단위인데, 많이 쓸수록 비용이 늘어난다. 특히 이미지가 포함된 질문에서는 비용이 더 컸다. 정답률은 1.5%에서 5.3% 정도 올랐지만, 비용 대비 효율이 떨어졌다.

    더 심각한 건 토론이 항상 도움이 되는 게 아니라는 점이다. 연구진이 분석해보니 토론으로 오답이 정답으로 바뀌는 경우는 전체의 5%에서 19%뿐이었다. 나머지는 이미 정답이거나, 토론해도 못 푸는 문제거나, 심지어 정답을 오답으로 바꿔버리는 경우도 있었다. 예를 들어 수학 문제 데이터에서는 19.1%가 토론으로 정답이 됐지만, 14%는 정답이 오답으로 뒤집혔다.


    "확신 있으면 혼자, 헷갈리면 토론" 판단하는 AI 분류기

    기존 방식은 AI가 내놓은 '확신도 점수'로 토론 여부를 결정했다. 확신도가 낮으면 토론시키고, 높으면 그냥 넘어가는 식이다. 하지만 연구진은 이 점수가 믿을 만하지 않다는 걸 발견했다. 오답인데도 확신도가 높게 나오는 경우가 많았고, 답변 내용이 불확실해 보여도 점수는 높게 나왔다.

    iMAD는 이 문제를 새로운 방식으로 해결했다. AI에게 답을 내게 한 뒤, 반드시 자기 답변을 반박하는 다른 의견도 내놓으라고 시킨다. "이렇게 생각하지만, 저렇게 볼 수도 있다"는 식이다. 양쪽 의견이 비슷하게 그럴듯하면 AI가 헷갈리고 있다는 뜻이니 토론이 도움이 될 수 있다. 반대로 한쪽이 명확하게 강하면 이미 답이 정해진 거라 토론할 필요가 없다.

    이 과정에서 연구진은 41가지 특징을 뽑아낸다. 답변이 얼마나 길고 복잡한지, "아마도" 같은 망설이는 표현은 얼마나 쓰는지, 문장 구조는 어떤지 등을 분석한다. 이 특징들을 작은 인공신경망에 넣어서 토론을 할지 말지 판단한다. 이 신경망은 'FocusCal'이라는 특별한 학습 방법으로 훈련됐는데, 과신하는 오류에 큰 벌점을 주고, 확신도 점수와 실제 내용의 불일치도 처벌한다.

    6개 실험에서 모두 1등, 비용은 10분의 1 수준으로

    연구진은 의료 시험 문제, 전문 자격증 문제, 초등 수학 문제, 이미지 보고 답하는 문제 등 6가지 종류로 실험했다. 비교 대상은 혼자 푸는 방식 2개, 무조건 토론하는 방식 2개, 확신도로 선택하는 방식 1개였다.

    결과는 놀라웠다. iMAD는 모든 실험에서 비용을 대폭 줄이면서도 정답률을 높였다. 의료 문제에서는 무조건 토론 방식보다 토큰을 68%에서 92%까지 줄였는데도 정답률이 가장 높았다. 수학 문제에서는 기존 토론 방식보다 정답률이 8.4%나 높았다. 전체적으로 혼자 푸는 것보다 최대 13.5% 정답률이 올랐다.

    확신도 기반 방식과 비교하면, 비슷한 비용으로 더 높은 정답률을 냈다. 확신도 방식은 평가 데이터로 기준값을 조정해야 하는데, iMAD는 그럴 필요 없이 새로운 문제에서도 잘 작동했다. 신경망을 단 2개 데이터로만 학습시켰는데도 6개 새로운 데이터에서 모두 효과가 있었다.

    토론 결정 95.9%가 적중, "쓸데없는 연산 안 했다"

    iMAD의 판단이 얼마나 정확한지 분석해봤더니, 최대 95.9%가 올바른 결정이었다. 토론을 건너뛴 경우 65%에서 80%는 이미 정답이었고, 최대 13%는 토론해도 못 푸는 문제라 연산 낭비를 피한 것이었다. 토론을 시킨 경우에는 수학 문제에서 16.2%, 의료 문제에서 7.1%의 오답을 정답으로 바꿨다.

    잘못된 결정, 즉 정답을 오답으로 바꾸거나 필요 없는 토론을 시킨 경우는 5%에서 10%에 불과했다. 연구진은 이 시스템을 구글의 Gemini뿐 아니라 OpenAI의 GPT-5, 중국의 Qwen 3.0에서도 테스트했는데 모두 비슷한 성과를 냈다.

    FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

    Q1. AI 토론 시스템이 뭔가요?

    A: 여러 AI가 같은 문제를 각자 풀고, 서로의 답을 비판하면서 더 나은 답을 찾아가는 방식입니다. 사람들이 회의에서 토론하듯이 AI끼리도 의견을 주고받으면 더 정확한 결론에 도달할 수 있다는 아이디어입니다.

    Q2. iMAD는 언제 토론을 시키나요?

    A: AI가 답변할 때 자기 의견과 반대 의견을 모두 내놓게 한 뒤, 둘 다 그럴듯하면 헷갈리고 있다고 판단해 토론을 시킵니다. 한쪽이 명확하게 강하면 이미 답이 정해진 거라 토론 없이 그냥 답을 냅니다.

    Q3. 어떤 문제에서 가장 효과가 좋나요?

    A: 복잡한 수학 문제나 의료 지식처럼 단계별로 생각해야 하는 문제에서 특히 효과적입니다. 반대로 사진을 보고 답하는 문제인데 중요한 단서가 없으면, 토론해도 답을 못 찾아서 효과가 적습니다.

    해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

    논문명: iMAD: Intelligent Multi-Agent Debate for Efficient and Accurate LLM Inference

    이미지 출처: 이디오그램 생성

    해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




    AI Matters 뉴스레터 구독하기
    태그
    AI
    안내 ?

    말 많은 뉴스

    • 1

      미니 PC, 노트북 싹 다 가짜였습니다. 쿠팡에 침투한 중국 사기단의 정체

      댓글10
      미니 PC, 노트북 싹 다 가짜였습니다. 쿠팡에 침투한 중국 사기단의 정체
    • 2

      최고 완성도를 한단계 더 끌어올린 X3D의 진화, AMD 라이젠 7 9850X3D

      댓글5
      최고 완성도를 한단계 더 끌어올린 X3D의 진화, AMD 라이젠 7 9850X3D
    • 3

      메르세데스-AMG, 4기통 버리고 6기통·V8 귀환… 브랜드 전략 전면 수정

      댓글5
      메르세데스-AMG, 4기통 버리고 6기통·V8 귀환… 브랜드 전략 전면 수정
    • 4

      뜨거운 물 틀었다가 찬물 섞는 사람들은 보세요

      댓글5
      뜨거운 물 틀었다가 찬물 섞는 사람들은 보세요
    • 5

      SFF PC 유행 예감! 근데... 문제는 파워 가격? feat. 메모리

      댓글4
      SFF PC 유행 예감! 근데... 문제는 파워 가격? feat. 메모리

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • 나 아직 살아있다! 위력 과시하는 '위저드리'와 '마이트앤매직'

      게임동아 15:08:28
      읽음 43 공감 1
    • 폭스바겐, 전기 구동장치 500만대 돌파 'APP550'로 전동화 가속

      오토헤럴드 13:54:15
      읽음 40
    • '보배도 당근도 넘지 못한 장벽' 독주하는 중고차 1위 플랫폼은 '요기요'

      오토헤럴드 13:54:09
      읽음 46 공감 1
    • 토요타의 전설 '하이랜더' 3열 전기 SUV로 복귀, 기존 네이밍 전략 수정

      오토헤럴드 13:54:07
      읽음 44 공감 1
    • 한국타이어, ‘2026 가장 존경받는 기업’ 타이어 부문 17년 연속 1위

      오토헤럴드 13:54:04
      읽음 43 공감 1
    • 벤틀리, 극한의 오프로드 퍼포먼스 극대화 ‘벤테이가 X 콘셉트’ 공개

      오토헤럴드 13:53:57
      읽음 43 공감 1
    • '뼈대부터 차별화' 제네시스, 전용 전동화 플랫폼으로 프리미엄 전략 재정렬

      오토헤럴드 13:53:51
      읽음 47 공감 1
    • 설 연휴 2780만명 대이동, 정부 통행료 면제 등 특별교통대책 시행

      오토헤럴드 13:53:45
      읽음 44 공감 1
    • '휴먼 에러 줄어들까' 고령 택시·화물차 ‘페달오조작 방지장치’ 보급

      오토헤럴드 13:53:42
      읽음 52 공감 2
    • 5등급차 조기폐차ㆍ매연저감장치 지원 올해 종료, 늦기전 신청해야

      오토헤럴드 13:53:39
      읽음 45 공감 1
    • 페라리, 조니 아이브와 협업한 첫 순수 전기차 '루체' 공개

      글로벌오토뉴스 13:53:29
      읽음 48 공감 1
    • 2026년 런던, 미국과 중국 자율주행 기술의 글로벌 격전지 된다

      글로벌오토뉴스 13:53:26
      읽음 42 공감 1
    • 발레오·안리츠, SDV 가상 검증 협력… 디지털 트윈으로 개발 주기 단축

      글로벌오토뉴스 13:53:23
      읽음 45 공감 1
    • 니오, 배터리 교환 누적 1억 건 돌파… 전기차 충전 패러다임 전환

      글로벌오토뉴스 13:53:20
      읽음 44 공감 1
    • 중국 전고체 배터리 연합(CASIP) 가동… 2026년 실험실 넘어 도로 위로

      글로벌오토뉴스 13:53:17
      읽음 45 공감 1
    • 테슬라, 중국 내 AI 교육 센터 본격 가동… FSD 현지화 공세 박차

      글로벌오토뉴스 13:53:14
      읽음 42 공감 1
    • 위라이드·우버, 중동 로보택시 대 공습… 2027년까지 1,200대 투입

      글로벌오토뉴스 13:53:11
      읽음 46 공감 1
    • LG엔솔, 스텔란티스 넥스트스타 에너지의 지분 100달러에 인수, 배터리 합작 종료

      글로벌오토뉴스 13:53:08
      읽음 43 공감 1
    • 미쉐린, 현대차 ‘더 뉴 엑시언트 수소전기트럭’에 신차용 타이어 공급

      글로벌오토뉴스 13:53:05
      읽음 41 공감 1
    • 벤틀리, 'FAT 아이스 레이스 2026'서 벤테이가 X 콘셉트 및 신차 공개

      글로벌오토뉴스 13:53:01
      읽음 42 공감 1
    • BYD코리아, 17개 전국 서비스센터에서 설 맞이 무상점검 서비스 캠페인 실시

      글로벌오토뉴스 13:52:58
      읽음 44 공감 1
    • KGM, ‘2026년 설 맞이 차량점검 서비스’ 시행

      글로벌오토뉴스 13:52:56
      읽음 44 공감 1
    • 쉐보레, 동남권 고객 접근성 강화 위한 '해운대 전시장' 공식 오픈

      글로벌오토뉴스 13:52:53
      읽음 42 공감 1
    • [컨슈머인사이트] 보배드림·당근마켓이 중고차에서 힘 못쓰는 이유는?

      글로벌오토뉴스 13:52:50
      읽음 43 공감 1
    • 캐딜락 F1 팀, 2026 시즌 데뷔 경주차 리버리 전격 공개

      글로벌오토뉴스 13:52:47
      읽음 48 공감 1
    • BYD, 미국 정부 상대 관세 환급 소송 제기…중국 자동차 제조사 중 처음

      글로벌오토뉴스 13:52:44
      읽음 41 공감 1
    • 스텔란티스, ‘전기차 과대평가’ 인정하며 38조 원대 손실 반영

      글로벌오토뉴스 13:52:41
      읽음 40 공감 1
    • 볼보 CEO, 한·미·유럽 관세 전쟁 속 '정면 돌파' 선언

      글로벌오토뉴스 13:52:38
      읽음 43
    • 메르세데스-벤츠 CEO, 유럽 EU 내연기관 금지 완화에 "불확실성만 가중" 경고

      글로벌오토뉴스 13:52:35
      읽음 39
    • 올리비아로렌, ‘타임 투 블룸’으로 봄을 깨우다…2026 봄 컬렉션 공개

      뉴스탭 13:02:26
      읽음 40
    • 오늘의집, 봄 신학기 맞아 ‘2026 새학기대전’…가구·디지털 한자리에

      뉴스탭 13:02:21
      읽음 39
    • “새 학기 몰입을 잡아라” 소니 WH-1000XM6 구매하면 전용 스탠드 증정

      뉴스탭 13:02:14
      읽음 41 공감 1
    • “고르는 재미까지 선물한다”… 포트넘 앤 메이슨, 설 맞이 맞춤형 기프트 박스 선봬

      뉴스탭 13:02:10
      읽음 40
    • 글로벌 TOP10 원작, 인도네시아 소설 『시가렛 걸』 드디어 한국 상륙

      뉴스탭 13:02:05
      읽음 40 공감 1
    • 숲(SOOP), 다가오는 명절 풍성하게 2026 설 특집 페이지 공개

      게임동아 13:02:02
      읽음 43 공감 1
    • 예스24, 아시아 최대 도서전서 ‘크레마 연필 리모컨’ 첫 해외 공개…글로벌 시장 가능성 확인

      뉴스탭 13:02:02
      읽음 47
    • 고향 대신 집, 설 선물도 달라졌다… ‘쉼을 주는 가전’이 뜬다

      뉴스탭 13:01:57
      읽음 48 공감 1
    • 한국인 F1 직관 어디로 떠나나…상하이·바르셀로나·스즈카 ‘톱3’

      뉴스탭 13:01:48
      읽음 41
    • 인텔 코어 Ultra, 게임부터 AI까지… ‘All-Play, All-AI’ 프로모션 진행

      뉴스탭 13:01:46
      읽음 46 공감 1
    • 게임리서치 ‘묵혼온라인’, 설 및 발렌타인데이 맞이 이벤트 진행!

      게임동아 13:01:38
      읽음 37
    • 데스윙, 성공했구나! 하스스톤 '대격변' 확장팩 공개

      게임메카 12:58:29
      읽음 44
    • “유니티·언리얼 비용 부담”... 자동차 회사 ‘토요타’가 직접 차량용 게임 엔진 만든다

      게임동아 12:56:22
      읽음 43
    • 호요버스 ‘붕괴: 스타레일’, '포트나이트'와 컬래버레이션

      게임동아 12:56:08
      읽음 35
    • ‘명조:워더링 웨이브’, 명조 X 컴포즈커피’ 전국 컬래버레이션 시작

      게임동아 12:55:30
      읽음 40
    • 카카오게임즈, SMTOWN 후쿠오카 콘서트에서 슴미니즈 홍보

      게임동아 12:55:11
      읽음 37
    • 에픽게임즈 스토어, ‘2026 겨울 세일’ 돌입

      게임동아 12:54:48
      읽음 44 공감 1
    • 넷마블, 신작 MMORPG '솔: 인챈트' 3월 5일 사전등록 돌입

      게임동아 12:53:00
      읽음 40
    • “33원정대의 성공 인정”... 프랑스 정부, 샌드폴 인터랙티브 개발진 28명에게 기사 작위 수여

      게임동아 12:52:40
      읽음 43 공감 1
    • ‘월드 오브 워쉽’, 15.1 업데이트 "신년 달맞이 이벤트 진행"

      게임동아 12:52:07
      읽음 38
    • 컴투스 메인넷 CONX, 순환형 RWA 프로젝트 ‘주재범 아레나’ 수상작 발표

      게임동아 12:51:42
      읽음 40
    • [2.10~2.23] 주연테크 Q27C15 IPS QHD USB-C 100

    • 경품이 99개! 2월 무~제한 포인트 룰렛

    • <2월 모바일 출석체크> 2월 출석하고 선물받기

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • 뉴런글로벌(안텍)(12월분까지 진행 : 4/16-26년 1/16)
    • 엔티스 배너
    • 다크플래쉬
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 7
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5924759 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.