비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

[생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까?

2024.05.17. 13:33:26
조회 수
540
7
댓글 수
3

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기
※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.

[IT동아 권택경 기자] 오픈AI가 지난 13일(현지시각) 최신 대형언어모델(LLM)인 ‘GPT-4o’를 발표했습니다. 구글 ‘제미나이’, 앤트로픽 ‘클로드’, 메타 ‘라마’ 등 수많은 LLM이 등장해 경쟁이 치열해지는 와중에 오픈AI가 이번 업데이트로 다시 한 번 기술 격차를 벌리고, 생성 AI 업계 대표이자 선두라는 걸 입증하는 모양새입니다.

GPT-4o의 o는 옴니(Omni)를 뜻합니다. ‘모든’을 뜻하는 라틴어 접두사입니다. 이 말에 걸맞게 글뿐만 아니라 사진, 영상, 음성 등 여러 종류 데이터를 처리할 수 있는 능력인 ‘멀티 모달리티(Multimodality)를 극한까지 밀어붙였습니다. 하나의 AI 모델로 모든 게 가능한 ‘옴니 모델(Omni Model)’이라는 의미가 담긴 이름입니다. 그야말로 만능인 셈입니다.


지난 13일 열린 오픈AI의 GPT-4o의 발표 행사 / 출처=오픈AI
지난 13일 열린 오픈AI의 GPT-4o의 발표 행사 / 출처=오픈AI


이번 발표의 하이라이트라고 할 수 있는 음성 모드가 옴니모델의 특장점을 잘 보여줍니다. 음성 모드는 사람과 대화하듯 챗GPT와 음성으로 대화하는 기능입니다. 이번 GPT-4o의 적용으로 반응 속도가 최소 232밀리초, 평균 320밀리초 수준으로 개선됐습니다. 2~5초 수준이었던 이전 버전들과는 비교하면 환골탈태 수준입니다.

오픈AI의 시연을 보면 마치 인간과 대화하는 듯한 자연스러움을 느낄 수 있는데, 실제로 250밀리초 수준으로 알려진 인간만큼 반응 속도가 빠르기 때문입니다. 이렇게 음성 모드가 빨라진 건 음성을 음성 그 자체로 인식하고 처리할 수 있게 됐기 때문입니다. 이전에는 음성을 텍스트로 바꿔 인식하고, 답변도 텍스트로 생성한 다음 이를 단순 음성 합성으로 읊는 방식이었다고 합니다.


실시간 영상 인식과 음성 기능으로 마치 AI와 영상통화를 하듯 대화할 수 있다 / 출처=오픈AI
실시간 영상 인식과 음성 기능으로 마치 AI와 영상통화를 하듯 대화할 수 있다 / 출처=오픈AI


처리 방식이 바뀌면서 반응 속도만 빨라진 게 아니라 음성에 담긴 톤이나 배경에 섞인 소리도 인식할 수 있게 됐습니다. 반대로 AI가 목소리에 감정을 담거나, 웃거나, 노래를 부르는 일도 가능해졌습니다. 오픈AI가 공개한 시연 영상을 보면 챗GPT가 사용자의 농담에 반응해 웃거나, 자장가를 부릅니다. 두 챗GPT가 서로 자연스럽게 대화를 이어가기도 합니다.

샘 올트먼 오픈AI CEO는 AI와 사랑에 빠지는 영화 ‘그녀(Her)’를 언급하기도 했는데, 영화에나 나올 법한 사람 같은 수준의 AI가 현실이 됐다는 평가도 그리 과장은 아닌 것처럼 느껴질 정도입니다. 이 모든 게 GPT-4o가 텍스트, 화상, 오디오 등 여러 형태의 데이터를 하나의 신경망으로 처리하는 옴니모델이기에 가능한 일입니다.


챗GPT에 태블릿 화면 속 수학 문제를 공유해 AI 과외 선생님처럼 활용할 수도 있다 / 출처=오픈AI
챗GPT에 태블릿 화면 속 수학 문제를 공유해 AI 과외 선생님처럼 활용할 수도 있다 / 출처=오픈AI


속도와 바용도 개선됐습니다. 특히 영어 외 언어에서 토큰(AI 데이터 처리의 최소 단위) 효율이 대폭 개선되면서 처리 능력이 올랐습니다. 한국어도 토큰 효율이 1.7배 개선됐습니다. 같은 양의 한국어 텍스트를 더 적은 토큰으로 처리할 수 있게 됐다는 의미입니다. 그만큼 GPT-4o를 활용하는 앱이나 서비스들의 속도가 빨라지고, 비용도 저렴해집니다. 오픈AI에서는 GPT-4o의 응용 프로그램 인터페이스(API)가 이전 버전인 GPT4-터보와 같은 성능을 더 빠르고 50% 저렴하게 제공한다고 설명합니다.


음성 모드를 사용 중인 오픈AI 개발자/ 출처=오픈AI
음성 모드를 사용 중인 오픈AI 개발자/ 출처=오픈AI


발표와 함께 오픈AI는 우선 GPT-4o의 텍스트와 이미지 기능을 먼저 출시했습니다. 월 20달러(약 2만 7100원)의 유료 서비스 ‘챗GPT 플러스’ 이용자에게만 제공됐던 GPT-4, GPT-4 터보 등과 달리 무료 이용자들도 현재 이용이 가능합니다. 다만 이용 가능한 메시지 수에 제한이 있습니다. 사용량과 수요에 따라 유동적으로 결정됩니다. 유료 이용자는 무료 이용자보다 5배 더 많은 메시지를 이용할 수 있습니다.

다만 아쉽게도 음성 모드는 아직 출시되지 않았습니다. 오픈AI는 앞으로 몇 주 내에 음성 모드 알파 버전을 일부 유료 이용자를 대상으로 순차 출시할 예정이라고 밝혔습니다.

글 / IT동아 권택경 (tk@itdonga.com)

]]>

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 기획뉴스 전체 둘러보기
1/1
[숨신소] 먼지 닦으며 힐링하는 감성게임 '언더스티드' (1) 게임메카
‘하코다테’ 여행 기자 추천 4분기 일본 소도시 여행지 (1) 트래비
이탈디자인, 전설의 '혼다 NSX' 현대적으로 해석한 트리뷰트 버전 예고 오토헤럴드
로반페라, 중앙유럽 랠리 우승…도요타, WRC 제조사 시즌 챔피언 확정 오토헤럴드
애스턴마틴 밴티지 GT3, GT 월드 챌린지 유럽 골드컵 클래스 챔피언 등극 오토헤럴드
현대차, 국내 최초 개최 '2025 TCR 월드투어' 6라운드 한국 레이스 우승 (1) 오토헤럴드
[넥스트 모빌리티] 마하 1.5로 날며 수증기만 배출하는 날개없는 비행기 (1) 오토헤럴드
에디터가 선택한 푸껫 필수 여행 스폿 4 (1) 트래비
[인디言] 탄막 속에서 시간을 멈춘다면? 타임 스내쳐 핸디 게임메카
"자살 언급 한 번이면 끝?" 부모-전문가, AI 챗봇 위험 판단 기준 정반대 AI matters
AI가 지진·홍수 예측한다... 인프라 재난 대응 정확도 90% 시대 온다 AI matters
거의 40년 넘는 골뱅이 전쟁, 원조의 품격이냐! 마케팅의 승리냐! [라이벌열전] (5) 다나와
KT 소액결제 사고 전수조사 결과 발표 “불법 펨토셀 16개 추가 확인” IT동아
"K-AI의 미래를 말하다" 프렌들리AI, 선도기업 4사 초청 밋업 개최 IT동아
[기승전결] 엔젤우몬! '디지몬 스토리' 신작에 팬덤 대만족 게임메카
테슬라에 칼 빼든 국토부와 환경부 "강제 리콜, 보조금 중지 고려 중" 동영상 있음 오토기어
아키텍트, 목표는 “모두에게 사랑 받는 MMORPG“ 게임메카
토요타 브랜드 가치 부동의 세계 1위…벤츠·BMW 부진 속 BYD 첫 진입 오토헤럴드
애플·삼성·DJI의 신제품 총공세가 이어진다... 이 주의 IT 루머 총정리 다나와
[AI 써봄] 영상 만들어 공유하는 소셜 플랫폼, iOS용 소라 IT동아
이 시간 HOT 댓글!
1/4