비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

딥러닝, 똑똑한 인공지능을 만든 비밀

2024.06.04. 09:58:09
조회 수
517
6
댓글 수
3

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기
사람처럼 지능을 가진 기계에 대한 꿈은 컴퓨터가 없던 시대까지 거슬러 올라갈 수 있을 정도로 그 역사가 오래되었다. 그러다 1950년, 영국 수학자 앨런 튜링이 기계 역시 생각할 수 있다고 제안한다. 그가 제안한 가상의 기계 ‘튜링 머신’은 테이프에 쓰인 기호를 읽어 특정 행동을 출력하는 등 현대적인 컴퓨터의 원형이 됐다. 기술이 급속히 발전하면서, 현대 컴퓨터는 인간 대신 많은 일을 맡게 됐다. 그로 인해 SF소설이나 영화에서 컴퓨터가 인간을 지배할지도 모른다는 두려움이 표출됐다. 특히 ‘알파고’의 등장으로 SF 속 이야기가 현실로 한 발짝 다가왔다.
그림 1. 머신러닝 기술의 발달로 인공지능의 처리 능력이 사람과 점점 비슷해지고 있다. ⓒshutterstock
딥러닝, 스스로 학습하는 기계의 출현
기계가 사람을 이길 수 없다고 생각한 ‘바둑’에서 알파고는 어떻게 인간을 제압했을까? 그 해답에는 바로 ‘머신러닝’에 있다. 기계학습이라는 뜻을 가진 머신러닝은 말 그대로, 교사가 학생을 가르치듯 인공지능을 학습시켜 스스로 규칙을 찾게 만든다.
고전적인 머신러닝은 사람이 직접 학습 데이터를 제공했다. 이를 ‘지도학습’이라고 한다. 지도학습은 정답이 있다. 예시로 인공지능이 동물 이미지를 분류하게 만들려면, 각 사진 데이터에 개, 고양이, 햄스터로 미리 정답을 지정해야 한다. 이후 각 동물을 구분하기 위해선 귀, 입, 코 등 특정 요소에 주목해야 한다는 사실을 학습시킨다. 그리고 학습한 동물의 새로운 이미지를 집어넣어, 얼마나 정확하게 구별하는지 평가한다.
초기 인공지능은 이러한 학습을 거쳐도 개와 고양이를 정확히 구별하지 못했다. 또 배운 것만 할 수 있다는 한계를 가졌다. 하지만, 사람들은 능동적으로 문제를 해결할 수 있는 인공지능을 원했다. 이에 인공신경망, ‘딥러닝’에 대한 관심이 커지기 시작한 것이다. 딥러닝은 인간의 신경 구조를 본떠 만든 기계학습 알고리즘으로, 수많은 노드의 네트워크로 이뤄져 있다.
그림 2. 인공신경망은 마치 뉴런처럼 연결돼 데이터를 전달한다. ⓒshutterstock
즉 정답을 알려주지 않은 이미지를 구역별로 쪼개 신경망에 입력하면, 인공신경망의 노드는 마치 뉴런처럼 데이터를 다음 층으로 전달한다. 이러한 과정을 최종 출력값을 도출할 때까지 반복한다. 이때 각 노드에는 수행 작업을 기준으로 입력값의 ‘중요도’를 나타내는 가중치가 할당되며, 그 가중치를 모두 합해 출력한다. 또한 출력값이 실제 값과 얼마나 차이 나는지 확인하고 가중치를 조정해 실제 값과 근접한 답을 내도록 학습한다. 이를 딥러닝의 역전파 알고리즘(Backpropagation)이라고 한다.
이러한 딥러닝을 이용해 사람처럼 생각하는 기계를 만들기 위해선 다량의 데이터, 즉 ‘빅데이터’를 입력값으로 넣고 충분한 학습이 필요하다. 다만 불필요한 데이터가 쌓여 예측 오차가 커진다는 문제를 안고 있다. 이에 과학자와 공학자들은 데이터 과적합을 막고, 예측 정확도를 높이기 위한 알고리즘을 만들어 내고 있다.
대표적으로 합성곱 신경망(Convolutional Neural Network, CNN)은 인간의 시신경을 분석해서 만든 딥러닝 방식이다. CNN은 마치 사람이 물체를 전체적으로 인지하고 그 특성을 기억하듯 이미지에서 주요 요소를 뽑아낸다. 이에 자율 주행 자동차의 오토파일럿 시스템 등 시각적 이미지를 분석하는 데 활용된다.
순환 신경망(Recurrent neural network, RNN)은 순서에 맞게 반복 학습하는 알고리즘으로, 인간의 뉴런이 출력에서 다시 입력으로 피드백하는 재귀적 연결 구조를 모방한다. 즉 합성곱 신경망처럼 입력과 출력이 단방향으로 이어져 과거의 정보를 기억하지 못하는 단점을 보완할 수 있다. 이에 문맥을 기억해 앞서 어떤 단어가 나왔는지에 따라 다음에 나올 단어를 예측하는 문제에 적합하며, 구글 번역기와 같은 기계 번역 혹은 언어 생성 인공지능의 자연어 처리에 주로 쓰인다.
최근에는 트랜스포머(transfomer)라는 알고리즘이 대세가 되었다. 트랜스포머는 ‘중요한 것은 어텐션(Attention)이다’라는 전제하에, 해당 시점에서 예측해야 할 단어와 가장 연관 있는 단어에 집중한다. 특히 단어를 번역할 때도 순차적으로 처리하지 않고 병렬적으로 처리하므로 순환 신경망의 한계를 극복할 수 있다. 주로 이미지 분석과 언어 번역 기능, 자연어 처리에 광범위하게 쓰이고 있으며 오픈 AI의 GPT-4가 대표적이다.
인간의 데이터 없이 인공지능은 있을 수 없다
양질의 데이터는 곧 인간과 근접한 인공지능을 만드는 토대가 된다. 사람과 비슷한 수준의 이미지 분류, 음성 인식, 필기 인식, 자율 주행 능력, 자연스러운 번역, 이미지 생성, 인간처럼 자연어 문장을 생성하는 능력 모두 엄청난 수의, 높은 질의 데이터가 필수다. 잘못된 데이터나 편향된 데이터는 인종차별적인 답변을 산출하거나 세종대왕이 노트북을 던진 사건처럼 엉뚱한 답변을 내놓는다.
현재 인공지능 연구자들은 올바르고 정확한 데이터를 확보하고 학습시키기 위해 각고의 노력을 기울이고 있다. 이에 한국과학기술정보연구원(KISTI)에서는 ‘인공지능 데이터 공유·활용 서비스(AIDA)’를 운영한다. AIDA는 연구자들이 과학 기술 분야의 인공지능 데이터에 원하는 방식으로 자유롭게 접근하여 처리 및 분석하고 연구 결과 도출을 지원하기 위해 인공지능 데이터를 검색하고 공유하는 서비스다.
그림 3. KISTI는 연구원들이 인공지능 데이터를 자유롭게 이용할 수 있도록 인공지능 데이터 공유·활용 서비스를 제공한다.
AIDA에선 과학기술 분야의 다양한 인공지능 데이터셋을 제공하고 있으며, 업로드된 데이터셋을 활용한 AI 모델과 데이터 분석 사례도 찾아볼 수 있다. 또 원하는 인공지능 데이터를 불러와서 처리하고 사전학습모델을 기반으로 필요한 모델을 직접 만들 수 있는 프로그래밍 환경도 지원하고 있다.
또한 KISTI는 지속적으로 ‘DATA・AI 분석 경진대회’를 개최하여 양질의 데이터에 기반한 인공지능으로 사회 현안을 해결하고 과학적 질문에 답하는 활동을 지원하고 있다. 경진대회 참가자들은 KISTI가 수집하고 구축한 연구데이터와 AI 학습 데이터를 활용할 수 있다. 그 결과 역시 AIDA 홈페이지를 통해 제공하고 있다.
인공지능 시대로 발 디딘 지금, 인공지능 학습을 위한 데이터 확보 역시 중요성도 커질 수밖에 없다. 그만큼 KISTI의 역할도 중요해질 것이다. 앞으로 인공지능 시대를 함께 이끌어 나갈 KISTI의 활약을 기대해 본다.

글 : 권오현 과학칼럼니스트 / 그림 : 이명헌 작가




<저작권자 ⓒ 과학향기(http://scent.ndsl.kr) 무단전재 및 재배포금지>

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 기획뉴스 전체 둘러보기
1/1
“이게 진짜 나와요?”…후지 X-E5부터 픽셀10까지, 쏟아지는 신제품 루머 총정리 다나와
신빙성 낮지만, 기대가 되는 라데온 RX 9080 XT 출시설 및 인공지능 가속기 생산 증가를 위한 RTX 50 감산설 등 다나와
철원의 멋과 맛을 느낄 수 있는 곳을 찾아라 (3) 트래비
제네시스 마그마 레이싱 'GMR-001 하이퍼카' 르망 24시서 실전 경험 (1) 오토헤럴드
[매장탐방] 가정의 달 특수 없앤 스위치 2의 폭풍전야 (3) 게임메카
닌텐도 스위치 2, 기대되는 성능과 걱정되는 키 카드 (1) 게임메카
Okm 중고차가 쏟아지는 중국 "결국 BYD 폭탄 할인 선언!" 동영상 있음 오토기어
에이서, AI PC 전면에 내세운 컴퓨텍스 2025 전략… Copilot+로 전 라인업 무장 (1) 뉴스탭
“증명사진 위조 여부 판별” 생성 AI 딥페이크 탐지 서비스 샌즈랩 ‘페이크체크 2.0’ (1) IT동아
크리에이터에게 가장 중요한 건 스토리지, SanDisk CREATOR SERIES 발표회 (1) 브레인박스
크리에이터를 위한 선택, 샌디스크 크리에이터 시리즈 발표 (1) 블루프레임
대만 국내용 메시지에 불과한 엔비디아와 대만의 AI 중심기지 전략 '팀타이완' 전략 동영상 있음 보드나라
로컬 친구 같은 호텔, OMO5 구마모토 (1) 트래비
[BOOK] 로컬 맛집에서 당황하지 않기 (1) 트래비
전설의 100만뷰 아이폰 꿀팁,, 2025년 최신 버전 동영상 있음 THE EDIT
시즈오카 여행을 계획한다면 반드시 저장해야 할 맛집 5 (1) 트래비
질병코드∙심의∙확률 규제 등, 대선 후보별 게임 공약은? 게임메카
[순정남] 아차! 대선 정치색을 드러낸 롤 챔피언 TOP 5 (1) 게임메카
남들과 다른 겜돌이를 위한 겜디아스 컴퓨텍스 2025 부스를 가다. (1) 브레인박스
새로운 나스 DS1825+, DS 1525+ 및 NVMe 스토리지 솔루션 PAS7700 등을 전시한 시놀로지 컴퓨텍스 2025 부스에 가다. (2) 브레인박스
이 시간 HOT 댓글!
1/4