생성형AI를 발전시키는 ‘거대 언어 모델’ : 다나와 DPG는 내맘을 디피지

미국 인공지능 전문기업 오픈AI가 지난 2022년 선보인 대화형 인공지능(AI) 챗봇 ‘챗GPT’에 대한 관심이 식을 줄 모르고 있다. 출시 후 5일 만에 사용자 100만명을 넘기며 생성형 AI 붐을 일으키자 국내외 빅테크 기업들도 서둘러 제미나이, 클로바X 등을 선보였다. 특히 구글은 AI 챗봇으로 인해 검색 엔진 이용률이 줄어들 것으로 전망되자 내부 위기 경보인 ‘적색경보(코드 레드)’를 발령하며 향후 테크 업계가 생성형 AI를 중심으로 재편될 것임을 시사했다.

생성형 AI는 요구 사항에 맞는 텍스트, 이미지, 오디오 등을 만들어내는 인공지능을 총칭한다. 챗GPT 같은 대화형 AI 챗봇은 텍스트에 특화된 생성형 AI로, 거대 언어 모델(Large Language Model, LLM)을 기반으로 만들어진다. 거대 언어 모델은 말 그대로 거대한 양의 텍스트 데이터를 학습해 답변, 요약, 번역 등을 수행하는, 인공신경망으로 구성된 언어 모델이다. 거대 언어 모델이 작동하기 위해 어떤 것들이 필요한지 자세히 알아보자.

그림 1. 생성형 인공지능은 거대 언어 모델을 기반으로 만들어 진다. ⓒshutterstock

시냅스 역할하는 ‘파라미터’ 수천억개 있어야

우선 언어 모델(Language Model)은 입력된 단어나 문장에 대해 통계적으로 가장 적절한 단어 혹은 문장을 출력하도록 훈련된 인공지능이다. 네이버나 구글 같은 검색 엔진의 연관 검색어 기능이 대표적인 예시다. 예컨대 검색창에 ‘아이’를 입력하면 ‘아이유’, ‘아이패드’, ‘아이폰’ 같은 연관 검색어가 표시되는데 이는 언어 모델이 입력값인 ‘아이’와 연관 있는 단어를 확률에 따라 보여주는 것이다. 확률은 학습한 검색 데이터를 기반으로 하는 만큼 많은 데이터를 학습할수록 정확한, 즉 사용자가 원하는 답변을 내놓는다.

거대 언어 모델은 수천억 개의 파라미터를 활용해 방대한 텍스트 데이터를 학습한 언어 모델이다. 파라미터는 언어 모델을 구성하는 신경망에 가중치를 부여한다. 언어 모델이 데이터를 학습하는 과정에서 파라미터는 요구 사항에 대해 정확한 답변을 산출하는 방향으로 값이 바뀐다.

예컨대 일차함수 f(x)=c*x로 짜인 언어 모델은 x에 어떤 값을 입력하면 파라미터 c에 x를 곱한 값을 내놓는다. 이 모델이 연관 검색어를 보여주는 언어 모델이라면 ‘아이’와 ‘아이패드’에 각각 숫자를 부여(예: 아이=3, 아이패드=9)한 후 데이터를 학습하면서 적합한 c를 찾아 나선다. 초기에는 c를 무작위로 부여(예: c=2)하는데 2*3이 9보다 작은 걸 인식해 c를 늘려가며 10을 내놓는 값(3)에 다가선다.

그림 2. 파라미터가 많을수록 AI의 성능이 좋아진다. ⓒshutterstock

로봇팔의 관절이 많아야 섬세한 동작을 할 수 있는 것처럼 파라미터가 많을수록 미세한 조정이 가능하다. 즉 파라미터가 많을수록 입력값의 세부적인 특성까지 파악할 수 있다는 뜻이다. 이런 이유로 파라미터는 시냅스(뉴런과 뉴런 사이에서 신경전달물질이 오가는 틈)에 비유되는 동시에 언어 모델의 성능을 판단하는 지표 중 하나로 여겨진다.

거대 언어 모델은 일반적으로 1,000억 개 이상의 파라미터를 가진다. 대표적으로 챗GPT 초기 버전에 쓰인 GPT-3의 파라미터는 1,750억 개로 알려졌고, 구글이 개발한 거대 언어 모델 PaLM은 5,400억 개의 파라미터를 갖고 있다. 파라미터가 1,000억 개 미만이면 ‘경량 거대 언어 모델(small Large Language Model, sLLM)’, ‘소형 언어 모델(Small Language Model, SLM)’ 등으로 따로 구분한다.

우리 삶과 밀접한 거대언어모델

생성형 AI가 산업계의 트렌드가 되면서, 구글, 네이버 등 다양한 국내외 기업에서 대규모 언어 모델 개발에 박차를 가하고 있다. 자체 보유한 데이터를 활용해 대규모 언어 모델을 개발하는 기업도 있지만, 메타 LLaMA2처럼 오픈 소스를 기반으로 제작한 대규모 언어 모델도 개발되고 있다. 다만 한글에 특화돼 있고, 과학 기술 정보 제공을 목적으로 한 대규모 언어 모델은 존재하지 않았다. 이에 한국과학기술정보연구원(KISTI)은 논문, 보고서 등 연구데이터를 대상으로 한 대규모 언어 모델 'KONI'를 개발해냈다. KONI는 올해 7월 중 오픈 소스로 공개될 예정이다.

이렇게 만들어진 거대 언어 모델은 이미 다양한 형태로 우리 삶에 침투하고 있다. 구글은 지난 5월 14일 제미나이와 음성 모델을 기반으로 만들어진, 사람처럼 보고 들을 수 있고 음성으로 대화하는 기능을 선보이면서 SF영화에서 나오는 AI 비서가 출시될 날이 머지않았음을 알렸다. 앞으로 AI 생태계가 우리의 삶을 어떻게 바꿔 놓을지 지켜보자.

글 : 김우현 과학칼럼니스트 / 일러스트 : 유진성 작가

“밥 먹었어?” 어르신들이 AI에게 던진 질문 feat. 김덕진 동영상 있음	AI matters
AI가 내 컴퓨터를 직접 쓰기 시작했다, 오픈클로와 몰트북의 정체 동영상 있음	AI matters
호시노 리조트가 제안하는 4가지 봄의 방식	트래비
"김선호·고윤정의 로키 로맨스"알버타주 촬영지 따라잡기	트래비
태국의 숨은 별빛, 북동부 사껀나콘&나콘파놈 여행기	트래비
오라클 “데이터베이스 기업에서 AIㆍ데이터 잘 다루는 기업으로”	IT동아
[기자 수첩] 1월 수입차 시장의 미세한 변화 '럭셔리보다 합리적 선택'	오토헤럴드
풍경사진, 예술이 되는 순간은 언제일까? 동영상 있음	Hakbong Kwon
자율형 로봇, 1㎜보다 작은 세계에서 움직이다	과학향기
올해 뉴욕 여행하면 가봐야 할 히든 스팟 4	트래비
‘에어로미늄’ 소재 적용으로 가벼움은 그대로, 기준은 높아졌다, 2026년형 LG 그램 프로가 달라진 이유 (2)	다나와
특허 AI에 국산 AI 반도체 얹었다··· 워트인텔리전스-리벨리온 협업 나서	IT동아
“울트라는 밀고, 기본형은 흔든다?” 삼성·애플·엔비디아 최신 IT 루머 총정리	다나와
알파고, 챗GPT를 이을 ‘특이점’, AGI란 무엇?	IT동아
“데이터팩토리 구축ㆍ인재양성에 속도” 한국피지컬AI협회의 2026년 전략은?	IT동아
[황성진의 '고대 사상가, AI를 만나다'] 한비자가 챗GPT를 쓴다면 절대 하지 않을 세 가지 (1)	IT동아
노타·퓨리오사AI, AI 최적화 기술 협력으로 공동 사업화 나선다	IT동아
[뉴스줌인] "우리만의 AI 필수"... 세계 각국이 '소버린 AI'에 꽂힌 이유	IT동아
이통3사, AI 기본법 시행 맞춰 거버넌스 강화	IT동아
[정석희의 기후 에너지 인사이트] 3. AI 시대의 에너지 해법	IT동아
비오는 날 가기 좋은 캐나다 밴쿠버 스폿 6	트래비
달력에 체크하면 냉장고가 행복해진다, 2026 마시는 캘린더	마시즘
[기승전결] 하이가드, 많이 바뀌지 않으면 콘코드 엔딩	게임메카
[숨신소] 페이퍼 마리오 느낌, 해피엔딩 주식회사 탈출기	게임메카
[EV 트렌드] 유럽 전기차 '테슬라 밀어내고 토종과 중국산' 대결로 압축 (1)	오토헤럴드
현대모비스, 차세대 車 디스플레이 판 흔들 '쿼드 얼라이언스' 출범	오토헤럴드
테슬라 어쩌나, 中 정부 강수 '매립형 도어핸들' 2027년부터 완전 금지	오토헤럴드
램값이 미쳤는데 X3D CPU에 극단적으로 적은 메모리 용량을 써보면 어떨까요? 동영상 있음	민티저
미니밴·픽업·오프로더까지…제네시스 디자인 전략 '전천후'로 확장	오토헤럴드
테슬라 오토파일럿 중단 선언! 모델S 모델X도 완전 단종! 대체 무슨 이유로? 동영상 있음	오토기어
올해 경험해야 할 스위스 알프스 걷기 여행길 4	트래비
[에너지 인사이트] 찜질방 맥반석처럼 전기로 달궈 모래에 저장하는 '열'	오토헤럴드
한국타이어, 예측 불가능 접전 포뮬러 E ‘2026 마이애미 E-PRIX’ 성료	오토헤럴드
[기자 수첩] '최초의 자동차'라는 착각에서 출발하는 벤츠의 월드 투어	오토헤럴드
수직 도시, 뉴욕을 관찰하기 좋은 전망대 7	트래비
[매장탐방] 스위치에 이어 스위치 2도, ‘모동숲’이 캐리했다	게임메카
[인디言] 유령신부 느낌에 단간론파 추리 더한 ‘그릴드’	게임메카
[신년특집] 생성형 AI와의 공존 ⑥ 테일즈샵 한준 대표	게임메카
[정보/루머] XeSS 3 MFG로 떡상 준비 마친 아크 및 메모리 가격 상승에 따른 혼돈의 일상 등	다나와
S26 미리보기! One UI 8.5 베타 3차, 갤럭시 아이폰 닮아간다? (1) 동영상 있음	주연 ZUYONI
스위스 여름 여행 필수 대자연 스포츠 액티비티 가이드 (1)	트래비
섬 여행 고수가 알려주는 백패킹 꿀팁 모음집	트래비
기대와 우려 공존한 “AI 기본법 시행에 따른 산업 생태계 육성전략 세미나”	IT동아
AI 협업툴로 성장성 증명한 플로우, AI 융합과 글로벌 확장에 속도낼 것	IT동아
[모빌리티 인사이트] 자동차를 호화롭게 장식했던 '스크린 터치'의 역설	오토헤럴드
[기자 수첩] 테슬라, 모델 S·X 단종의 의미 '자동차 제조사' 생존 분기점	오토헤럴드
[순정남] 게임사들이 잘 모르는 것 같은 단어 TOP 5 (1)	게임메카
2026 Q1 ASRock 파워서플라이 런칭 세미나 탐방기 (1)	쿨엔조이
온보드와 SO-DIMM의 경계가 무너진다, LPCAMM2가 바꾸는 노트북 메모리의 미래	다나와
메모리 가격 폭등 부추기는 공포 마케팅과 대형 PC 제조사들 [메모리 가격 폭등 3부] 동영상 있음	보드나라
로터스 정체성 '미드십 스포츠카' 헤리티지, 유로파에서 에미라까지	오토헤럴드
인텔 코어 울트라 시리즈 3 AI PC의 새로운 이정표, 인텔 2026 AI PC 쇼케이스	블루프레임
차세대 PCIe 5.0 SSD...'키오시아'가 제시하는 미래 스토리지	미디어픽
알프스를 곁에 둔 스위스 골프 여행	트래비
우주로 확장되는 전쟁터, 스타링크 위성통신 역할은	IT동아
인텔 코어 울트라 시리즈 3 등판··· '성능·배터리·무게 다 갖춘 노트북 현실로' (1)	IT동아
퓨리오사AI, NPU 'RNGD' 양산 돌입··· '한국 넘어 세계시장 향한다'	IT동아
“사람을 연결하는 미래 교육, AI와 에듀테크를 만나다”...제5회 링크(LINK)에서 엿본 미래 교육 현장	IT동아
"인간은 쓸모없어질 것" 머스크의 경고가 현실로? '피지컬 AI'가 바꾸는 충격적 미래 (ft. 젠슨 황, 현대차 아틀라스) 동영상 있음	AI matters
한국타이어, 포뮬러 E 시즌 12 도심 서킷 ‘2026 마이애미 E-PRIX’ 후원	오토헤럴드
LLM 넘어 기술 패권 기업으로 성장한 '딥시크', 쇼크 이후 1년 톺아보니	IT동아
[겜ㅊㅊ] 고난은 나누면 절반이 된다, 협동 소울라이크 5선	게임메카
[위클리AI] 마이크로소프트, 마이아200으로 경쟁력 강화···아마존도 의료용 서비스 대열 합류	IT동아
AI로 10시간 걸릴 일 1시간으로 줄였는데... 왜 우리는 더 바빠질까? (2026 AI 트렌드) 동영상 있음	AI matters
아이폰부터 라이카, 스위치2까지…지금 가장 뜨거운 IT 루머 한눈 정리 (4)	다나와
[자동차와 法] 교통사고 과실비율 판단의 변수들	IT동아
[김흥식 칼럼] "기계는 살았다" 방직기와 컴퓨터 그리고 AI 로봇의 공통점	오토헤럴드
충청남도 서산의 보물: 웅도, 개심사, 간월암 완벽 코스	트래비
잘 던지고, 잘 받기! 우주의 투수, 빛의 속도로 던지다	과학향기
[성지순례] 한국보다 최신식이네, 태국 방콕 게임센터 탐방	게임메카
[뉴스줌인] '울트라'모델 부활한 갤럭시북6, 400만원대 몸값의 가치는?	IT동아
[정보/루머] 메모리 자린고비 모드에 돌입한 AMDㆍ엔비디아 및 x86 본진 털기 시작한 애플 실리콘 등	다나와
도요타, 2026 WRC 개막전 포디엄 장악... 현대차, 또 운영 리스크 노출	오토헤럴드
전동화 시대 럭셔리 스포츠카, 소리 사라진 스피드보다 존재감 보여 줄 때	오토헤럴드
[숨신소] 전설의 검을 직접 만드는 쾌감 '블레이드송' (1)	게임메카
현대 기아 경영진께 간곡하게 부탁 드립니다! 동영상 있음	오토기어
2026 Q1 애즈락 오프라인 세미나. 마이크로닉스와 함께 국내 파워 시장 진출	기글하드웨어
게임기 전쟁은 끝났다 (2026)… 하지만 진짜 승자는 따로 있다 동영상 있음	집마 홀릭TV
한국만 바이크 X 같이 타는 이유 \| 오토바이 안타는 사람들은 모르는 비밀 동영상 있음	포켓매거진
EV5 경우 280만원 인하? 아직 사태의 심각성을 모르네! 동영상 있음	오토기어
ASRock PSU의 한국 시장 첫 도전!, 2026 ASRock 파워서플라이 공식 출시 발표 세미나 (1)	블루프레임
Mac 컬러 최적화 튜닝으로 사용 경험 확장, 벤큐 Mac 모니터 신제품 출시 간담회	블루프레임
[순정남] 트럼프도 탐내는 게임 속 '그린란드' TOP 5	게임메카
“맥북ㆍ맥미니ㆍ아이패드 모두 OK” 벤큐, 애플 생태계 맞춤형 모니터 MA 시리즈 공개	IT동아
‘기술 굴기’냐 ‘실용주의’냐…휴머노이드, 3국 3색 전략	IT동아
AI와 클라우드 단절이 유발하는 문제, 운영 구조 개선으로 푼다	IT동아
[현장] HP, 게이밍 브랜드 ‘하이퍼엑스’로 통합…‘오멘’은 어찌되나?	IT동아
카스텔라부터 일식 백반까지 ‘나가사키’에서 꼭 먹어야 할 맛 4	트래비
PC 게이밍의 미래는 더 빠른 GPU가 아니라 DLSS가 될 것. 젠슨황 PC 게이밍 관련 발언 공개 모음 [엔비디아 젠슨 황 CES Q&A 분석] 동영상 있음	보드나라
독자 AI 파운데이션 1차 결과 발표: 네이버 하이퍼클로바X가 중국 모델을 썼다? (LG, SKT, 업스테이지 생존) 동영상 있음	AI matters
[EV 트렌드] 전기차 배터리 무게중심, 2025년 삼원계에서 LFP로 재편	오토헤럴드
현대차 노조가 식겁할 현장... 로봇 2000대 6분 만에 굴착기 한 대 뚝딱	오토헤럴드
[써니모모의 '육십 먹고 생성AI'] 4. 구글 '노트북LM'으로 기억을 확장하기	IT동아
PCIe 5.0 및 최신 고성능 저전력 8세대 BiCS Flash 기술, 키오시아 2026 소비자용 SSD 신제품 공개	블루프레임
구멍난 날개로 하늘을 누빈다?	과학향기
국내 최초 1000조 기업 탄생하나? "황금 알"을 품은 현대 동영상 있음	오토기어
중국 시장을 지키기 위해 한국 시장을 버리는 카드로? 동영상 있음	오토기어
테슬라가 갑자기 미쳤나? 왜 이렇게 다 퍼주나? 동영상 있음	오토기어
[신년특집] 생성형 AI와의 공존 ⑤ 에이버튼 김대훤 대표	게임메카
[겜ㅊㅊ] 한국어 패치로 언어 장벽 사라진 스팀 '갓겜' 10선 (1)	게임메카

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

생성형AI를 발전시키는 ‘거대 언어 모델’

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

생성형AI를 발전시키는 ‘거대 언어 모델’

공유하기

공감/비공감