비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

[IT강의실] 생성형 AI의 최대 난제, '할루시네이션'

2024.04.01. 10:25:27
조회 수
726
2
댓글 수
2

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기
[IT동아 남시현 기자] 지난 3월 17일에서 21일 사이 미국 캘리포니아주 세너제이에서 엔비디아의 연례 개발자 회의 ‘GTC 2024’가 열렸다. 젠슨 황 엔비디아 최고경영자는 기자간담회에서 5년 내에 인간 수준의 인공지능(이하 AI)이 현실화할 것이라고 말해 주목을 받았고, AI의 할루시네이션(환각)에 대해서도 개발자의 코딩 문제이기 때문에 검색 강화 생성 절차로 해결될 것이라고 말했다.


‘인공지능의 모습과 AI 할루시네이션을 형상화’라는 프롬프트를 넣은 생성형 AI 이미지 결과 / 출처=MS 코파일럿, 어도비 파이어플라이 복합 사용
‘인공지능의 모습과 AI 할루시네이션을 형상화’라는 프롬프트를 넣은 생성형 AI 이미지 결과 / 출처=MS 코파일럿, 어도비 파이어플라이 복합 사용


앞서 GTC 2023에서 젠슨 황과 일리야 서츠케버 오픈AI 공동창업자는 대담에서 ‘환각 문제가 2년 안에 크게 줄어들 것’이라고 얘기했는데, 1년이 지난 지금은 많이 나아졌지만 여전히 해결의 실마리는 잡지 못한 상태다. 오늘날 AI 개발의 최대 난제로 떠오른 ‘할루시네이션’이란 무엇이며, 왜 AI는 환각을 일으킬까?

‘환각’ 의미하는 할루시네이션, 어떤 형태로 나타날까

할루시네이션은 환각 또는 망상 등으로 불리며, AI가 생성한 정보에 허위 또는 날조된 정보가 포함되는 현상이다. 할루시네이션은 실제 사실과 AI를 거친 정보가 다른 내재성 환각과 실제로 존재하지 않는 사실을 창작해서 제공하는 외재적 환각으로 나뉜다. 챗GPT에 질문을 했는데 역사적 사실을 왜곡하거나, 이미지 생성 시 현실 법칙에 위배된 이미지 등을 제공하는 게 할루시네이션의 영향이다.


빙 AI에 의류기업 갭(Gap)의 실적 보고서 요약을 부탁했으나, 할루시네이션으로 인해 사실과 다른 결과를 도출하는 사고가 있었다 / 출처=마이크로소프트
빙 AI에 의류기업 갭(Gap)의 실적 보고서 요약을 부탁했으나, 할루시네이션으로 인해 사실과 다른 결과를 도출하는 사고가 있었다 / 출처=마이크로소프트


예를 들어 지난해 2월 마이크로소프트가 빙 AI를 공개할 당시, 빙 AI에게 의류기업 갭(Gap)의 수익 보고서를 분석하라고 요청했다. 빙 AI는 갭의 영업이익률이 5.9%라고 답했는데, 보고서에 5.9%라는 수치는 없으며 실제 이익률은 4.6%였다. 또한 희석 주당 순이익도 0.42달러라고 말하고, 매출도 두 자릿수 증가할 수 있다고 말했다. 실제 보고서에는 0.42달러라는 단어가 없었고, 매출도 한 자릿수 중반으로 감소할 것이라는 내용이었다.

자연어 처리에서 할루시네이션이 발생하는 주된 이유는 데이터의 문제다. 수집한 데이터 자체가 잘못된 사실을 다루고 있거나, 데이터를 혼합하는 과정에서 문제가 생긴다. 대다수 생성형 AI는 사전에 훈련된 데이터를 바탕으로 응답하지만, 통계적으로 불완전한 모델이 생성되면서 할루시네이션이 나타날 수 있다. 이외에도 문장의 상관관계를 잘못 학습하면서 생기기도 하고, 내장된 지식 중 앞서 사용된 정보를 중복 사용하다가 꼬여서 생기기도 한다.

자연어 처리 넘어 어떤 분야든 발생하는 문제

할루시네이션은 자연어 처리를 넘어 거의 모든 AI 분야에서 발생한다. 예를 들어 사람이나 물체를 감지하는 AI가 사람을 전혀 다른 사물로 인지하거나, 제3의 사물을 사람으로 인식할 수 있다. 이런 문제는 단순히 오류에 가깝다. 반면 할루시네이션이 개입하면 존재하지 않는 객체를 인식한다거나, 피사체를 전혀 다른 물체로 판단해 오작동을 일으킬 수 있다.

최근 공개된 오픈AI의 텍스트-비디오 생성 AI ‘소라’에서도 할루시네이션이 관측된다. 해당 영상은 2층 지붕 위 1층을 내려다보며 등장인물들을 조명한다. 하지만 영상 초반에 원근법으로 층 수를 나눠놨지만, 물리적으로 구분되지 않아 주요 인물들이 시장 상인들보다 몇 배나 큰 거인이어야 가능한 영상이 만들어졌다. 아래 영상 역시 좌측 강변의 도로가 최소 네 번 이상 바뀌고, 주요 인물들 앞에 걷다가 가게로 들어가는 사람들과의 원근법도 맞지 않는다.

아직 오픈AI가 소라를 개발하는 단계라서 원근법 계산의 오류일 수 있으나, 지금 상황으로는 할루시네이션에 가깝다. 최근에는 동영상 생성형 AI로 학습 데이터를 만들어 비전 인식 AI를 고도화하려는 시도도 시작됐는데, 여기에 할루시네이션이 개입하면 오류 데이터로 학습될 여지도 있다. 그 자체로 예측할 수 없는 결과를 낳는 셈이다.

AI 처리 과정에서 발생, 앞으로도 큰 난제

안타깝게도 아직까지 AI에서 할루시네이션이 발생하는 원인은 완전히 파악되지 않았다. 심지어는 AI가 결과를 도출하는 과정도 미지수다. 우리가 AI에 주문을 내리면, 컴퓨터가 학습한 데이터로 연산을 처리한 뒤 결론을 도출한다. 문제는 어떤 데이터가 어떻게 상호 영향을 미쳤는지 인과관계를 파악하기 어렵고, 이 과정에서 할루시네이션이 발생한다.

제약 회사에서 AI를 활용해 혁신적인 신약 후보물질을 만들었다고 가정하자. 이때 신약 물질을 만드는 수식을 명령으로 내렸고, 신약 후보 물질의 구조를 만드는 것까지는 확인할 수 있다. 하지만 AI 내부에서 어떤 데이터를 활용하고 조합했을지까지는 완벽하게 분석할 수 없다. 이 문제를 블랙박스 현상이라고 하며, 최근에는 도출 과정까지 명확하게 확인할 수 있는 설명 가능한 AI(Explainable AI)에 대한 연구가 이어지고 있다.


엔비디아가 오픈소스로 공개한 ‘네모 가드레일’은 할루시네이션을 줄이기 위해 신뢰할 수 있는 출처만 결과에 쓸 수 있도록 하는 기능이 있다 / 출처=엔비디아
엔비디아가 오픈소스로 공개한 ‘네모 가드레일’은 할루시네이션을 줄이기 위해 신뢰할 수 있는 출처만 결과에 쓸 수 있도록 하는 기능이 있다 / 출처=엔비디아


할루시네이션은 AI를 신뢰하고 활용하기 위해 반드시 해결해야 할 과제다. 업계에서는 검증된 데이터만 사용해 정확하게 상황을 인식하고 응답하는 검색 증강 생성(RAG)이 답이 될 것으로 보며, 또 엔비디아 네모 가드레일처럼 부정확한 결과를 제외해 정확성을 끌어올리는 방식도 주목한다

할루시네이션은 AI의 구조적 문제이므로 해결되지 않을 것이라는 시각도 있고, 데이터 정렬과 수집을 통해 차츰 나아질 것이라는 시각도 있다. 확실한 것은 설명 가능한 AI가 발전해야 할루시네이션도 해결될 수 있다.

글 / IT동아 남시현 (sh@itdonga.com)

]]>

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 기획뉴스 전체 둘러보기
1/1
[정보/루머] AMD가 주춤하는 사이 빈집털이 준비하는 인텔 및 뭔가 대단한 것을 공개할 예정인 엔비디아ㆍ애플 등 (1) 다나와
[기승전결] 해양 탐험의 로망이 살아있는 '렘넌트의 바다' 게임메카
메모리 확보 전쟁 시대에 비싼 메모리에 대처하는 시장 이야기 램버스 [PC흥망사 171] 동영상 있음 보드나라
AI는 영어만 편애한다, 전 세계 6,003개 언어 중 AI가 외면하는 언어들의 현실 AI matters
AI 코미디언이 인간보다 더 웃기다고? ‘기계다움’이 유머의 새 무기가 된다 AI matters
한국타이어, 설원ㆍ빙판 혹한의 WRC 2라운드 ‘스웨덴 랠리’ 성료 오토헤럴드
[황성진의 '고대 사상가, AI를 만나다'] 플라톤의 동굴을 빠져나오면 우리를 기다리는 건 'AI' IT동아
WRC 랠리 스웨덴, 도요타 1~4위 독점…현대차, 총체적 난조 드러내 오토헤럴드
F1 복귀 선언한 포드, 2026 시즌 레드불 차세대 파워유닛 개발 오토헤럴드
[기자수첩] 연간 50만대를 생산하는 공장, 그걸 포기할 바보는 없다 오토헤럴드
'모두를 위한 퍼포먼스' 폭스바겐 골프 GTI, 성능과 경제성 최적 밸런스 오토헤럴드
창신메모리(CXMT)는 메모리 가격 안정화에 도움이 될 수 있을까? [메모리 가격 폭등 5부] (1) 동영상 있음 보드나라
애플은 가격을 낮추고, 샤오미는 배터리를 키웠다…요즘 IT 루머 총정리 (7) 다나와
[정보/루머] 화끈한 다이 사이즈로 승부 보는 인텔 및 최상급 RTX 50 계열 준비하는 엔비디아 등 다나와
PS/2에서 SATA 케이블까지, PC에서 사라져가는 아재들의 추억 (5) 다나와
출시된 지 5년 된 구닥다리가 "가격이 깡패?" 어이가 없네! 동영상 있음 오토기어
매번 비슷하다면서... 사람들은 왜? 용과 같이를 계속하는 걸까 (20년 동안 이 게임이 생존한 이유) 동영상 있음 집마 홀릭TV
스페이스XㆍxAI 합병 “일론 머스크의 비전 실현일까? 과잉 욕심일까?” IT동아
[순정남] 이 할머니는 손주 살 찌우지 않습니다 TOP 5 (1) 게임메카
산자부, 'K-온디바이스 AI 반도체 사업'으로 국산 AI 반도체 업계 지원 IT동아
이 시간 HOT 댓글!
1/4