"답할까, 거절할까, 추측할까"…애피어, AI 의사결정 신뢰성 높이는 연구 발표 : 다나와 DPG는 내맘을 디피지

애피어(Appier)가 에이전틱 AI 시스템의 신뢰성을 강화하는 새로운 연구 결과를 발표했다. 핵심은 AI가 스스로 판단을 내릴 때 얼마나 믿을 수 있느냐는 문제다.

이번 논문의 제목은 "답할 것인가, 거절할 것인가, 추측할 것인가? 언어모델의 리스크 인지 의사결정(Answer, Refuse, or Guess? Investigating Risk-Aware Decision Making in Language Models)"이다. 다양한 리스크 조건에서 거대언어모델(LLM)이 어떻게 의사결정을 내리는지 체계적으로 측정할 수 있는 평가 프레임워크를 제시한다.

기업들의 AI 도입이 단순 보조 도구에서 자율형 AI 에이전트로 진화하면서, 신뢰성은 도입을 결정짓는 핵심 장벽이 되고 있다. 2025년 맥킨지(McKinsey) 조사에 따르면 기업의 62%가 이미 AI 에이전트 도입을 시작했지만, '부정확성'은 여전히 엔터프라이즈 AI 도입 시 가장 많이 언급되는 리스크로 꼽힌다.

기존 LLM 평가 방식은 주로 답변의 정답 여부에만 초점을 맞췄다. 그러나 기업 환경에서는 오답에 따른 비용과 답변 거부에 따른 가치가 상황마다 다르다. 애피어는 이를 해결하기 위해 정답 보상, 오답 패널티, 답변 거부 비용 등 구조화된 리스크 파라미터(매개변수)를 도입해 다양한 시나리오를 시뮬레이션했다. 이 프레임워크에서 모델은 답변을 생성하기 전에 자신의 수행 능력, 확신 수준, 리스크 조건을 종합적으로 평가한 뒤 답변, 거부, 추측 중 하나를 선택하도록 설계된다.

연구 결과, 다수의 선도적 LLM들이 리스크 시나리오 전반에서 전략적 불균형을 보이는 것으로 나타났다. 고위험 환경에서는 잠재적 손실이 있음에도 과도하게 추측하는 경향을 보였고, 저위험 환경에서는 반대로 지나치게 보수적으로 작동해 답변을 과하게 거부하는 모습을 보였다. 연구진은 이 문제가 단순한 지식 부족이 아니라, 모델이 여러 역량을 하나의 안정적인 의사결정 전략으로 통합하는 데 어려움을 겪기 때문이라고 분석했다.

애피어는 이를 해결하기 위해 의사결정 과정을 세 단계로 나누는 '스킬 분해(Skill Decomposition)' 접근법을 제안했다. 먼저 문제를 해결해 초기 답변을 생성하는 과업 실행(Task Execution), 이어 해당 답변에 대한 확신 수준을 평가하는 확신도 추정(Confidence Estimation), 마지막으로 리스크 조건에서의 결과를 기반으로 기대값을 추론하는 기대 가치 추론(Expected-Value Reasoning) 단계로 구성된다. 이 구조화된 추론 과정을 통해 모델은 답변을 제시할지, 거부하는 것이 더 나은 결과를 가져오는지를 스스로 판단할 수 있다.

치한 위(Chih-Han Yu) 애피어 최고경영자는 "에이전틱 AI가 기업의 핵심 업무에 도입되기 위해서는 AI를 더 똑똑하게 만드는 것뿐 아니라, 자율적 의사결정의 신뢰도를 높이는 것이 중요하다"며 "LLM의 리스크 인지 능력을 수치화된 방법론으로 구현한 이번 연구는 신뢰할 수 있는 엔터프라이즈 AI의 기반을 강화하고, 에이전틱 AI가 실제 비즈니스 가치와 ROI로 연결되도록 지원할 것"이라고 밝혔다.

이번 연구 결과는 애피어의 에이전틱 AI 기반 플랫폼인 애드 클라우드, 개인화 클라우드, 데이터 클라우드에 통합되어 기업들이 보다 신뢰 가능하고 안정적인 방식으로 자율형 워크플로우를 고도화할 수 있도록 지원하고 있다.

자세한 내용은 애피어 코리아 공식 홈페이지에서 확인할 수 있다.

이미지 출처: 에피어

AI Matters 뉴스레터 구독하기

[오늘의 스팀] 컨커러스 블레이드: 삼국, 압도적으로 부정적	게임메카
요시다 슈헤이가 ‘블러드본 PC판 미출시'에 대해 언급했다 (1)	게임메카
라인게임즈, ‘창세기전 모바일’에 시즈 대장 ‘벨제부르’ 추가	게임동아
넷마블 '스톤에이지 키우기'에 '부족전' 추가	게임동아
엔비디아, 카이스트와 국내 AI 혁신 가속화 위한 공동 AI 연구소 설립	다나와
랜드로버, 브랜드의 문턱을 낮춰준 '디스커버리 스포츠' 단종 결정	오토헤럴드
BMW, 중국 전용 iX5 롱휠베이스 공개 '1회 충전 1000km 이상'	오토헤럴드
자동차도 '시들시들 열사병'에 걸린다... 노후차량일수록 '폭염' 대비해야	오토헤럴드
KGM, 내수 19% 증가에도 영업이익 개선은 제한적…4년 연속 흑자	오토헤럴드
넷마블 ‘블레이드&소울 레볼루션’, 랭킹 던전 1인 콘텐츠로 개편	게임동아
더 파이널스 APAC 리그서 한국팀 '하이부' 2연승 기록	게임메카
테슬라, 단종한 모델 S·X '오픈소스' 추진…로드스터식 공개 실효성 의문	오토헤럴드
제네시스, 마그마보다 강력한 고성능 모델 검토 'AMG 블랙 시리즈 겨냥'	오토헤럴드
제네시스, 마릴린 먼로 100주년 기념 단편 영화 '플레시 임팩트' 첫 공개	오토헤럴드
포르쉐, 직원 5명 중 1명 줄인다... 中 판매 급락에 구조조정 폭 확대	오토헤럴드
현대차, '제1차 한·중앙아시아 정상회의'에 제네시스 의전 차량 33대 지원	글로벌오토뉴스
CATL 2026년 2분기 순이익 36.5% 증가… 에너지 저장 사업이 실적 견인	글로벌오토뉴스
현대차그룹, 청년 인재 육성 프로그램 'HINT' 1기 입교식 개최	글로벌오토뉴스
BYD, 글로벌 수출 폭발에 셴산 공장서 9,000명 대규모 채용… 연간 수출 150만 대 겨냥	글로벌오토뉴스
테슬라 로보택시 확장 지연… 시장 기대치 미달에 주가 급락	글로벌오토뉴스
태국, 최대 8만 대 노후 상용차 전기차 전환 추진	글로벌오토뉴스
전기차 만족도, 내연기관 압도…JD파워 조사서 가장 높은 소비자 만족도 기록	글로벌오토뉴스
AI 데이터센터 전력 난에 청정기술 투자 폭증	글로벌오토뉴스
MSI 챔피언과 EWC 챔피언이 만난다… LCK 3라운드 빅매치 예고	게임동아
테슬라 FSD 이용 차량 148만 대 돌파	글로벌오토뉴스
NHTSA, 전자식 도어 핸들 안전기준 검토 착수… 업계 전반 규제 가능성	글로벌오토뉴스
유럽 잠수함도 배터리 시대... 샤프트, 리튬이온 배터리로 세대교체	글로벌오토뉴스
정부, 중대형 상용차 온실가스 2030년까지 30% 감축 의무화	글로벌오토뉴스
이탈리아의 거장과 자동차 디자인, 그리고 인공지능	글로벌오토뉴스
메르세데스-벤츠, 4도어 탑재한 G클래스 카브리올레 공식 티저 공개	글로벌오토뉴스
현대차·토요타·혼다, 미국 하이브리드 시장 86% 차지	글로벌오토뉴스
422. 중국차의 멀티 브랜드 전략, 세계시장에서 통할까?	글로벌오토뉴스
BYD, 1,000km 주행거리 갖춘 플래그십 전기 세단 '그레이트 한 EV' 8월 공개	글로벌오토뉴스
전기차 재구매 의향 94%… CDK 조사로 본 '전기차 이탈 불가' 현상	글로벌오토뉴스
KGM, 상반기 매출 2조 3,188억 원 기록… 4년 연속 흑자 달성	글로벌오토뉴스
벤틀리, 첫 순수전기 SUV '토르칼' 디자인 시그니처 공개… 다이아몬드 디테일 적용	글로벌오토뉴스
게임위, 경찰 공조 강화로 불법게임물 대응체계 고도화	게임동아
SOOP 2026 LCK 3라운드 중계, 선수단 콘텐츠도 선보인다	게임메카
벤츠, 생산비 70% 낮은 헝가리로 'C클래스·GLC·소형 G클래스' 집결	오토헤럴드
미래 모빌리티 전시 하나로...코엑스, 국내 첫 '퓨처 모빌리티 위크' 개최	오토헤럴드
벤틀리 첫 전기차 '토르칼' 실내 공개... 곡면 디스플레이·수작업 크리스털	오토헤럴드
한국타이어, 롯데웰푸드와 '졸음번쩍 껌' 출시	글로벌오토뉴스
현대차, 서산시에 임산부 특화 'PBV ST1' 기증 '현대 유니버설 솔루션' 시작	오토헤럴드
대림대학교, 2026 대학생 자작자동차대회 바하 부문 우승	글로벌오토뉴스
BMW 모토라드, 'F 900 GS 엔듀로 프로 에디션' 국내 6대 한정 판매	글로벌오토뉴스
픽업트럭 브랜드 램(Ram), 성남 대왕판교로에 국내 첫 공식 전시장 '램 트럭 서울' 오픈	글로벌오토뉴스
현대차, ST1 기반 임산부 특화차량 개발	글로벌오토뉴스
서울 코엑스서 '2026 퓨처 모빌리티 위크' 개최	글로벌오토뉴스
포르쉐, 2035년까지 전체 인력의 20% 수준인 9,000명 감원 계획 발표	글로벌오토뉴스
트럼프 미 대통령, GM 시험시설 방문해 대선 공약 및 경계 성과 강조	글로벌오토뉴스
“엑스박스판 샀다면 PC판 무료”…유비소프트·엑스박스 협력 확대	게임동아
아우디, 실적 둔화 속 폭스바겐그룹 연계 고강도 구조조정 추진	글로벌오토뉴스
BYD, 첫 일본 전용 경형 EV '라코' 출시	글로벌오토뉴스
토요타, 다임러 트럭·볼보그룹 수소연료전지 합작사 '셀센트릭' 지분 33.3% 인수	글로벌오토뉴스
BMW, 노이어 클라쎄 기반 전기 컨버터블 'i4 컨버터블' 2028년 출시 추진	글로벌오토뉴스
새롭게 도약하는 GALAX (갤럭시) Launch Event 2026 - 클릭나라 및 팔릿, 갤럭시 그래픽카드 C/S 라운지 (1)	브레인박스
“갤럭시 그래픽카드, 한국서 새 출발”…클릭나라 단독 유통·이엠텍 A/S로 승부 (1)	뉴스탭
넥슨, 웹소설 원작 MMO 타이틀명 '템빨: 오버기어드' 확정	게임메카
스타듀 밸리, 나만의 상점 운영하는 대규모 모드 등장	게임메카
2026 LCK 3라운드, T1 대 KT 통신사 더비로 시작한다 (1)	게임메카
‘되팔이’ 방지 위해, 포켓몬 카드 스토어 얼굴인식 도입	게임메카
中 CXMT, 상장 첫날 466% 상승…중국 본토 시총 1위 올라	AI matters
MS, 연산 부족에 자사 AI 제품 우선…애저 고객은 뒤로	AI matters
이스라엘 에니그마, 1,051억원 시드로 스텔스 종료…로봇 100대 온라인 공개	AI matters
갤럭시 S27 울트라, 드디어 5000mAh 넘나… 한주간 IT 기기 루머 총정리 (1)	다나와
DDR5-6000·CL30 조합 돌아왔다…클레브 CRAS V RGB 재입고 (1)	뉴스탭
창조공작소, 총 1,745만 원 규모 ‘AI 게임사운드디자인 챌린지’ 개최	게임동아
콩 스튜디오 차기작 '가디언 메이든' 카카오게임즈가 글로벌 퍼블리싱	게임동아
“이용자 제작 맵 받았더니 악성코드가”… ‘메챠 카멜레온’ 보안 논란 (1)	게임동아
딜레마 해결 완료, 여름철 물놀이 용품 6 (1)	트래비
벤큐 조위, QHD·360Hz 배틀로얄 특화 모니터 ‘XQ2566X’ 첫 공개 (1)	뉴스탭
벤틀리, 크루 신규 페인트 공장 가동…첫 전기 SUV ‘토르칼’ 생산 기반 구축	뉴스탭
일룸 프리미엄샵 송파점, 가락동 로데오거리로 확장 이전 (1)	뉴스탭
엔비디아, ‘오픈 시큐어 AI 얼라이언스’ 출범…AI 에이전트 방어 기술 공유	뉴스탭
미래 이동산업 한자리에 모인다…코엑스서 모빌리티 전시회 3개 동시 개최	뉴스탭
마이크로닉스 ‘ASTRO II PT’ 구매 이벤트 진행	다나와
AMD, 에이전틱 AI 시대를 위한 풀스택 컴퓨팅 포트폴리오 공개	다나와
인텍앤컴퍼니, T1 베이스캠프 부산점 NVIDIA 인증 PC방 실버 공식 획득	다나와
배틀그라운드 모바일, 이용자 창작 모드 공모전 개최	게임동아
소문난 '로스트아크' 성수 팝업스토어 가보니.. 관람객들 '함박웃음'	게임동아
넥슨, AI 시대 게임 인재 발굴 위한 2026 대학생 게임잼 ‘재밌넥’ 개최	게임동아
[롤짤] KeSPA컵 시기 변경에, 더 빡빡해진 상위팀 일정	게임메카
[오늘의 스팀] 확장팩으로 제 2의 전성기 맞은 '그림 던'	게임메카
[숨신소] 회심의 도트 패링 액션 돋보이는 ‘루비나이트’	게임메카
8급 공무원 승진한 진안 마스코트 빠망. 역대급 보물찾기 '트레저헌터 in 진안' 행사 앞두고 열일중 (1)	게임동아
[LCK] '우승을 향한 여정의 시작' 3라운드 돌입하는 LCK (1)	게임동아
호요버스 ‘젠레스 존 제로’ 반올림피자와 컬래버레이션 세트 2종 공개	게임동아
핫플레이스 성수, 로블록스로 가득 차다.. 4군데 팝업스토어 운영	게임동아
여름 무더위, 공포 게임으로 날려보자 (1)	게임동아
다이슨코리아, 취약계층 아동에 공기청정기 후원…폭염 속 건강한 여름 지원	뉴스탭
슈퍼마이크로, 256코어 AMD EPYC 기반 H15 서버 공개…에이전틱 AI 정조준	뉴스탭
로지텍, 토스 신사옥 100여 개 회의실에 AI 화상회의 환경 구축	뉴스탭
벤틀리, 영국 크루 본사에 최첨단 페인트 공장 개관	글로벌오토뉴스
BYD코리아, '워터밤 서울 2026' 공식 스폰서 참여… MZ세대 접점 확대	글로벌오토뉴스
렉서스코리아, 전동화 시승과 농장 체험 결합한 '렉서스 영파머스 팜 투 드라이브' 성료	글로벌오토뉴스
기아, 브랜드 라이프스타일 컬렉션 'Kia Collection 2026' 출시	글로벌오토뉴스
이베코코리아, 브랜드 체험 행사 ‘이베코 데이’ 개최… 올 뉴 S-Way 및 국내 라인업 전시	글로벌오토뉴스
폭스바겐그룹 2026년 상반기 실적 발표	글로벌오토뉴스
볼보그룹코리아 대학생 봉사단 '볼보 뉴홈 빌더즈' 3기 모집 시작	글로벌오토뉴스
한국타이어, 포르쉐 '911 카레라'에 '벤투스 S1 에보 Z' 신차용 타이어 공급	글로벌오토뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"답할까, 거절할까, 추측할까"…애피어, AI 의사결정 신뢰성 높이는 연구 발표

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"답할까, 거절할까, 추측할까"…애피어, AI 의사결정 신뢰성 높이는 연구 발표

공유하기

공감/비공감