* 출처는 안랩입니다.
생성형 인공지능(AI)이 우리 생활 곳곳에서 빠르게 확산되고 발전하고 있다. 하지만 제대로 활용하려면 먼저 AI와 관련된 기본 개념부터 이해할 필요가 있습니다. 결국 AI를 얼마나 잘 이해하느냐가 활용의 성패를 가른다. 그 시작은 바로 용어를 아는 것에서 출발한다. 중요한 개념을 정확히 알아야 실제로 어떻게 활용할지도 떠올릴 수 있다. 이번 글에서는 최근 가장 많이 회자되는 AI 핵심 용어들을 쉽게 정리해 소개한다.
대규모 언어 모델(LLM)과 소규모 언어 모델(SLM)
LLM은 수십 억에서 수천 억 개 이상의 파라미터를 가진 파운데이션 모델로, 복잡한 텍스트 생성과 분석에 활용된다. 대표적인 예시로 메타의 라마(Liama)와 오픈 AI(Open AI)의 GPT-4가 있다. 라마 3.1은 4,050억 개의 파라미터를, 오픈AI(Open AI)의 GPT-4는 1조 개 이상의 파라미터를 탑재한 것으로 알려져 있다. LLM은 고객 상담 챗봇, 자동 번역, 법률 문서 분석 등 방대한 지식을 필요로 하는 분야에 활용된다. 예컨대, 금융권에서는 내부 규제 문서를 분석해 준법감시 효율성을 높이는 데 적용되고 있다.
- 파라미터(Parameter): AI 모델이 학습 과정에서 최적의 결과를 내기 위해 조정하는 내부 변수로, 입력 데이터를 출력으로 변환하는 데 핵심적인 역할을 한다.
이에 비해 소규모 언어 모델(Small Language Model)은 약 70억~80억 개의 파라미터를 갖는다. 정확도나 범용성은 대형 모델보다 다소 떨어질 수 있지만, 특정 작업에서는 비용 효율성과 처리 속도에서 강점을 보인다. 예를 들어, 의료 현장의 음성 기록 정리나 IoT 기기의 음성 명령 처리처럼 특정 목적에 최적화된 환경에서는 비용 절감 효과까지 기대할 수 있어 널리 활용된다.
CoT와 CoD
AI 추론 기법에는 Chain of Thought(CoT)와 Chain of Draft(CoD)가 있다.
CoT는 문제 해결 과정에서 단계별 논리 전개를 포함해 LLM의 정밀성과 일관성을 높이는 방법이다. 수학 문제 풀이, 법률 추론, 복잡한 의료 진단 지원 등 정밀한 사고를 필요로 하는 영역에 주로 활용된다.
반면, CoD는 핵심적인 응답을 빠르게 생성한 뒤 필요한 경우 보완하는 방식으로, 속도와 비용 효율성에 강점이 있다. 정밀성은 CoT보다 낮을 수 있으며, 고객 응대에 특화된 챗봇처럼 즉각적인 반응이 중요한 환경에 유리하다.
에이전틱 AI와 AI 정렬
에이전틱 시스템(Agentic AI)은 자율적으로 판단하고 행동하는 여러 AI 에이전트가 협력해 특정 목표를 달성하는 구조다. 아직 안전성과 보안성 측면에서 해결해야 할 과제가 많지만, 이미 소프트웨어 개발 분야에서는 코드 생성·테스트·배포 등 일련의 과정을 여러 에이전트가 역할을 나눠 수행하는 실험적 적요이 시도되고 있다.
AI 정렬(AI Alignment)은 모델이 일정한 가치와 윤리를 지키도록 설계하고 훈련하는 과정이다. 다만, 기업과 개발사마다 가치 기준이 다르기 때문에 신뢰성 논란이 발생하기도 한다. AI 정렬은 금융·의료와 같은 고위험 산업군에서 특히 주목된다. 실제로 글로벌 은행들은 ‘윤리적 AI’ 가이드라인을 적용해 모델 정렬을 강화하고 있다.
블랙박스와 컨텍스트 창
AI 모델의 내부 동작 원리를 파악하기 어려운 상태를 흔히 블랙박스(Black Box)라고 부른다. 이는 투명성과 책임성 논의로 이어진다. 특히 블랙박스 문제는 AI 채용 시스템에서 지원자 차별 의혹을 낳으며 사회적으로 논란이 되기도 했다. 이에 따라 설명 가능한 AI(XAI)에 대한 연구가 확대되고 있다.
또한, 컨텍스트 창(Context Windows)은 모델이 한 번에 처리할 수 있는 텍스트 입력량을 의미한다. GPT-4는 최대 12만8,000토큰을, 구글 제미나이 1.5 프로(Gemini 1.5 Pro)는 200만 토큰까지 지원한다. 컨텍스트 창이 클수록 더 긴 문맥을 이해할 수 있고, 그만큼 세밀하고 일관된 응답을 생성할 수 있다. 이런 확장 기능은 법률·특허 분석처럼 수천 페이지에 달하는 대규모 문서를 다루는 분야에서 특히 유용하다.
- 토큰(Token): AI 모델이 텍스트를 이해하고 처리하기 위해 분할한 기본 단위로, 짧은 단어의 일부, 단어 전체, 문장 부호를 의미한다.
* 전체내용은 아래에서 확인하세요.