로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    강화학습으로 똑똑해진 AI의 근자감… "모르겠다" 못하고 자신만만하게 틀린다

    2025.06.12. 10:31:08
    읽음242 댓글1

    The Hallucination Tax of Reinforcement Finetuning


    OpenAI o1처럼 똑똑해진 AI의 치명적 약점 발견

    강화학습 파인튜닝(Reinforcement Finetuning, RFT)이 대형언어모델(LLM)의 수학 추론 능력을 크게 향상시키지만, 동시에 모델이 답할 수 없는 문제에 대해 그럴듯한 거짓 답변을 생성하는 경향을 80% 이상 증가시킨다는 연구 결과가 발표됐다. 남가주대학교(USC) 연구팀이 발표한 이번 연구는 AI 모델의 성능 향상과 신뢰성 사이의 중요한 균형점을 제시한다.

    해당 연구팀이 공개한 논문에 따르면, 강화학습 파인튜닝은 최근 OpenAI의 o1 시리즈를 비롯해 여러 최신 AI 모델에서 수학적 추론 능력을 향상시키기 위해 널리 사용되는 기법이다. 이 방법은 검증 가능한 목표를 통해 강화학습을 적용함으로써 모델의 추론 능력을 크게 개선한다. 그러나 연구진은 이러한 성능 향상이 예상치 못한 부작용을 동반한다는 사실을 발견했다.

    Qwen2.5 모델, 파인튜닝 후 거부율 0.30에서 0.08로 급락

    연구진이 '환각 비용(hallucination tax)'이라고 명명한 이 현상은 강화학습 파인튜닝 후 모델이 답할 수 없는 문제에 대해 적절히 거부하는 능력이 급격히 저하되는 것을 의미한다. 실험 결과, 표준 강화학습 파인튜닝을 거친 모델들은 답변 불가능한 문제에 대한 거부율이 80% 이상 감소했다. 예를 들어, Qwen2.5-7B-Instruct 모델의 경우 UWMP 데이터셋에서 거부율이 파인튜닝 전 0.30에서 파인튜닝 후 0.08로 급격히 떨어졌다.

    이러한 현상은 모델이 정보가 부족하거나 모호한 상황에서도 확신에 찬 답변을 제공하려는 경향이 강화되기 때문이다. 연구진은 "강화학습 파인튜닝이 추론 집약적 벤치마크에서 성능을 향상시키는 동시에, 모호한 상황에서도 확정적인 답변을 생성하도록 모델을 암묵적으로 유도한다"고 설명했다. 이는 특히 신뢰성과 인식론적 겸손함이 필수적인 영역에서 심각한 위험을 초래할 수 있다.


    마법의 해결책: 가짜 문제 10%만 추가해도 거부율 0.01→0.73 극적 회복

    이 문제를 해결하기 위해 연구진은 합성 답변불가 수학(Synthetic Unanswerable Math, SUM) 데이터셋을 개발했다. 이 데이터셋은 겉보기에는 해결 가능해 보이지만 실제로는 핵심 정보가 누락되었거나 모호한 조건을 포함하여 근본적으로 답할 수 없는 수학 문제들로 구성되어 있다. 연구진은 DeepScaleR 데이터셋의 40,307개 문제를 기반으로 o3-mini 모델을 사용해 답변 불가능한 변형 문제들을 생성했다.

    놀랍게도 강화학습 파인튜닝 과정에서 단 10%의 SUM 데이터를 추가하는 것만으로도 모델의 적절한 거부 행동이 상당히 회복되었다. Qwen2.5-7B 모델의 경우 SUM 테스트 세트에서 거부율이 0.01에서 0.73으로, Llama-3.1-8B-Instruct 모델은 0.00에서 0.75로 극적으로 개선되었다. 더욱 중요한 것은 이러한 개선이 해결 가능한 작업의 정확도에는 최소한의 영향만 미쳤다는 점이다.

    수학 문제로 훈련했는데 사실 질문도 잘 거부: 0.01→0.94 놀라운 일반화

    특히 주목할 만한 발견은 수학 문제로만 구성된 SUM 데이터셋으로 훈련된 모델이 완전히 다른 영역의 작업에서도 개선된 거부 행동을 보인다는 것이다. SelfAware라는 사실적 질의응답 벤치마크에서 Qwen2.5-7B 모델의 거부율이 0.01에서 0.94로, Qwen2.5-7B-Instruct 모델은 0.09에서 0.99로 향상되었다. 이는 모델들이 단순히 표면적 휴리스틱을 학습하는 것이 아니라, 추론 시간 계산을 활용해 질문이 명시되지 않았거나 답변 불가능한지 평가하고 자신의 지식 경계를 인식하는 방법을 학습한다는 것을 시사한다.

    완벽한 균형점 찾기: 10% 혼합이 최적, 50%는 성능 저하 위험

    연구진은 SUM 데이터의 혼합 비율에 따른 성능 변화도 분석했다. 0%, 1%, 10%, 30%, 50%의 다양한 혼합 비율을 실험한 결과, 높은 비율일수록 답변 불가능한 작업에서의 거부율은 향상되지만 답변 가능한 작업의 정확도는 감소하는 트레이드오프 관계를 확인했다. 대부분의 모델에서 10% 혼합 비율이 거부 행동 개선과 작업 성능 유지 사이의 적절한 균형점을 제공하는 것으로 나타났다.

    연구진은 "높은 비율의 답변 불가능한 데이터(예: 50%)는 답변 가능한 벤치마크에서 성능을 저하시킬 수 있어 훈련 혼합의 신중한 조정이 필요하다"며 "미래 연구에서는 훈련 전반에 걸쳐 거부와 정확성을 동적으로 균형 맞추기 위한 커리큘럼 학습이나 적응적 보상 형성을 탐구할 수 있을 것"이라고 제안했다.

    FAQ

    Q: 강화학습 파인튜닝의 '환각 비용'이란 무엇인가요?

    A: 강화학습 파인튜닝 후 AI 모델이 답할 수 없는 문제에 대해 적절히 거부하는 능력이 80% 이상 감소하여, 대신 그럴듯하지만 틀린 답변을 자신 있게 제시하는 현상을 의미합니다.

    Q: SUM 데이터셋은 어떻게 AI 모델의 신뢰성을 향상시키나요?

    A: SUM 데이터셋은 겉보기에는 해결 가능해 보이지만 실제로는 핵심 정보가 누락된 수학 문제들로 구성되어, 모델이 자신의 지식 한계를 인식하고 적절한 상황에서 "모르겠다"고 답하는 능력을 학습하게 합니다.

    Q: 수학 문제로만 훈련해도 다른 영역에서 효과가 있나요?

    A: 네, 수학 문제로만 구성된 SUM 데이터셋으로 훈련된 모델도 사실적 질의응답 등 완전히 다른 영역에서 거부 능력이 크게 향상되어, 일반적인 불확실성 추론 능력을 습득한다는 것이 확인되었습니다.

    해당 기사에 인용한 논문 원문은 arxiv에서 확인 가능하다.

    이미지 출처: 이디오그램 생성

    이 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




    AI Matters 뉴스레터 구독하기
    안내 ?

    말 많은 뉴스

    • 1

      고정비·교통·구독·여행까지, 똑똑하게 고르는 2026 신용카드 계급도

      댓글5
      고정비·교통·구독·여행까지, 똑똑하게 고르는 2026 신용카드 계급도
    • 2

      5090달린 랩탑이 2kg이면 반칙이지! 거기에 240Hz 디스플레이까지 달린 레이저 블레이드 16 5090!

      댓글5
      5090달린 랩탑이 2kg이면 반칙이지! 거기에 240Hz 디스플레이까지 달린 레이저 블레이드 16 5090!
    • 3

      30년 전 모습 그대로, 흑백 도트 '뚱카츄' 인형 등장

      댓글4
      30년 전 모습 그대로, 흑백 도트 '뚱카츄' 인형 등장 3
    • 4

      우리나라에서 제일 싼 6천원짜리 무선 이어폰

      댓글4
      우리나라에서 제일 싼 6천원짜리 무선 이어폰
    • 5

      힘펠 휴젠뜨, 전기요금 얼마나 나올까?

      댓글4
      힘펠 휴젠뜨, 전기요금 얼마나 나올까?

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • [이구동성] 쇠더룬드 회장이 이끄는 넥슨 '7조' 원정대

      게임메카 26.02.27.
      읽음 148 공감 10
    • 김태곤 신작 MMO, 타이틀명 '임진왜란: 조선의 반격' 확정

      게임메카 26.02.27.
      읽음 177 공감 9 댓글 1
    • 100% 전기차 르노 세닉 E-테크, ‘2026 올해의 차' 주요 자동차 시상식 2관왕

      오토헤럴드 26.02.27.
      읽음 110 공감 9
    • '6년은 타야 본전' 기아 텔루라이드 하이브리드 연비·가격 공개 

      오토헤럴드 26.02.27.
      읽음 104 공감 9
    • BMW 올리버 집세 회장, ‘2026 월드 카 어워즈 올해의 인물' 선정

      오토헤럴드 26.02.27.
      읽음 93 공감 9
    • 값 내리자 일주일 만에 1000대…볼보 EX30 계약 급증

      오토헤럴드 26.02.27.
      읽음 120 공감 9
    • 푸조 올 뉴 3008 스마트 하이브리드, ‘2026 올해의 차 디자인’ 2관왕

      오토헤럴드 26.02.27.
      읽음 96 공감 9
    • 포르쉐 K1 전기차 계획 철회 'V6·V8 내연기관으로 2028년' 출시

      오토헤럴드 26.02.27.
      읽음 110 공감 9
    • 사이버캡 양산 직후 총괄 매니저 퇴사 '테슬라 리더십 공백 확대'

      오토헤럴드 26.02.27.
      읽음 109 공감 9
    • 'AI 수소 시티' 본격화, 현대차그룹 새만금 미래기술 기지 건설

      오토헤럴드 26.02.27.
      읽음 96 공감 9
    • 대한항공-영국 스카이포츠, 상용 eVTOL 운영 플랫폼 개발 파트너십 체결

      글로벌오토뉴스 26.02.27.
      읽음 154 공감 9
    • 애스톤 마틴, 실적 부진에 인력 20% 감축 및 EV 투자 축소

      글로벌오토뉴스 26.02.27.
      읽음 156 공감 9
    • 현대차그룹 대학생 교육봉사단 ‘현대점프스쿨’ 13기 발대식 개최

      글로벌오토뉴스 26.02.27.
      읽음 152 공감 9
    • 푸조, 2026 WEC 출격할 ‘9X8’ 신규 리버리 공개

      글로벌오토뉴스 26.02.27.
      읽음 141 공감 8
    • 익숙한 차가 지루해진 시대…’르노 필랑트’가 던진 변화의 신호

      글로벌오토뉴스 26.02.27.
      읽음 142 공감 8
    • 엔드게임 확 바뀐다, 패스 오브 엑자일 '허상' 3월 7일 시작

      게임메카 26.02.27.
      읽음 151 공감 9
    • 데브시스터즈, 삼성전자와 협업해 ‘갤럭시 S26 시리즈’ 스페셜 테마 선보인다

      게임동아 26.02.27.
      읽음 88 공감 1
    • 위메이드의 글로벌 e스포츠 토너먼트 ‘이미르컵 월드 챔피언십’, 오는 28일 개최!

      게임동아 26.02.27.
      읽음 86 공감 1
    • PvP 대전, 위메이드 이미르컵 월드 챔피언십 28일 개최

      게임메카 26.02.27.
      읽음 134 공감 1
    • 10주년 맞은 스타듀 밸리, 새 로맨스 대상 2인 공개

      게임메카 26.02.27.
      읽음 153 공감 2
    • 저커버그, 프라다 패션쇼 전면 착석…메타 AI 안경 명품 버전 나오나

      AI matters 26.02.27.
      읽음 74
    • 잭 도시, 직원 절반 잘랐다…"당신 회사도 곧 같은 길 걷게 될 것"

      AI matters 26.02.27.
      읽음 76
    • AI 데이터센터의 '친환경' 선언, 전력망을 들여다보면 허상이다

      AI matters 26.02.27.
      읽음 70
    • 현대차 아이오닉 9, 2026 대한민국 올해의 차(K-COTY) 선정

      글로벌오토뉴스 26.02.27.
      읽음 149
    • 현대차, 2028년 바디 온 프레임 중형 픽업 출시… 아이오닉 T7 명명 유력

      글로벌오토뉴스 26.02.27.
      읽음 148
    • 볼보 EX30, 3만 유로대 엔트리 트림 추가… 가성비로 전기차 시장 정조준

      글로벌오토뉴스 26.02.27.
      읽음 134
    • BYD, 파격 프로모션... 중국 내 판매 부진으로 다시 가격인하 불지펴

      글로벌오토뉴스 26.02.27.
      읽음 132
    • 토요타, 미국에서 트리하우스와 손잡고 홈 충전 원스톱 서비스 도입... 2026년형 전기차 공세

      글로벌오토뉴스 26.02.27.
      읽음 124
    • 중국, 자율주행 의무 안전 기준 초안 발표… 레벨3 차량 독자 위험 회피 의무화

      글로벌오토뉴스 26.02.27.
      읽음 124
    • 세계 최초 전기차 전용 포르쉐 클럽 탄생… 이탈리아서 73대 타이칸·마칸 집결

      글로벌오토뉴스 26.02.27.
      읽음 122
    • 폭스바겐그룹코리아, 폭스바겐 부문 신임 사장에 마이클 안트 임명

      글로벌오토뉴스 26.02.27.
      읽음 137
    • 한성자동차, 강릉 서비스센터 확장... 강원 영동 지역 정비 역량 2배 강화

      글로벌오토뉴스 26.02.27.
      읽음 137
    • 한국쉘석유, 남해고속도로서 ‘쉘 리무라’ 졸음운전 방지 캠페인 성료

      글로벌오토뉴스 26.02.27.
      읽음 132
    • BMW 그룹 코리아, 봄맞이 '스프링업 위크 2026' 캠페인 실시

      글로벌오토뉴스 26.02.27.
      읽음 137
    • 푸조 ‘올 뉴 3008 스마트 하이브리드’, 2026 올해의 차 디자인 부문 2관왕 석권

      글로벌오토뉴스 26.02.27.
      읽음 136
    • KGM, 독일서 대규모 딜러 콘퍼런스 개최

      글로벌오토뉴스 26.02.27.
      읽음 142 공감 1
    • BMW 모토라드, 전국 공식 딜러서 ‘2026 시즌 오프닝 행사’ 개최

      글로벌오토뉴스 26.02.27.
      읽음 135 공감 2
    • 볼보그룹코리아-한국해비타트, ‘볼보 뉴홈 프로젝트 4호’ 성료

      글로벌오토뉴스 26.02.27.
      읽음 123 공감 2
    • 볼보자동차 EX30, 가격 인하 1주일 만에 신규 계약 1,000대 돌파

      글로벌오토뉴스 26.02.27.
      읽음 968 공감 12 댓글 1
    • 한국앤컴퍼니그룹, 2026년 첫 ‘지식나눔회’ 개최

      글로벌오토뉴스 26.02.27.
      읽음 119 공감 2
    • 스카니아코리아, 누적판매 3만5천 대 돌파

      글로벌오토뉴스 26.02.27.
      읽음 121 공감 2
    • 디즈니·포뮬러1®, 글로벌 캠페인 ‘퓨얼 더 매직’으로 레이싱 문화 혁신

      글로벌오토뉴스 26.02.27.
      읽음 124 공감 2
    • 르노 세닉 E-Tech, ‘올해의 수입차’ 선정… 비독일 브랜드 최초 기록

      글로벌오토뉴스 26.02.27.
      읽음 126 공감 2
    • 올리버 집세 BMW 회장, 2026 세계 올해의 자동차 인물 선정… 기술 개방성 전략의 승리

      글로벌오토뉴스 26.02.27.
      읽음 118 공감 2
    • 일런 머스크는 축복이자 재앙이다.

      글로벌오토뉴스 26.02.27.
      읽음 125 공감 2
    • 두카티, 오프로드 성능 강화한 ‘2세대 데저트X’ 공개

      글로벌오토뉴스 26.02.27.
      읽음 122 공감 2
    • 현대차그룹, 새만금에 9조 원 투입… ‘로봇·AI·수소’ 혁신거점 조성

      글로벌오토뉴스 26.02.27.
      읽음 125 공감 2
    • MS에 인수되더니 싹 바뀌었네.. 초심으로 돌아온 블리자드 '게임할 맛 나네'

      게임동아 26.02.27.
      읽음 84 공감 3
    • NHN, 스퀘어에닉스의 ‘DISSIDIA DUELLUM FINAL FANTASY’ 사전 등록 시작

      게임동아 26.02.27.
      읽음 70 공감 2
    • 다시 달려보자! 웹젠 ‘R2’ 오리지널 리부트 서버 리부팅 기념 이벤트 진행

      게임동아 26.02.27.
      읽음 76 공감 2
    • 원하는 경품 나올 때까지~ 무제한 당첨 룰렛

    • <3월 모바일 출석체크> 3월 출석하고 선물받기

    • 답 안 나올 땐 답나와를 찾아주세요.

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • AMD
    • 뉴런글로벌(안텍)(12월분까지 진행 : 4/16-26년 1/16)
    • MICRONICS
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 2
    비공감
    댓글 1
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5828094 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.