비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

565만 개 위키피디아 학습한 AI, 그림만 봐도 작가·시대 배경·비화까지 알려준다

2025.08.05. 14:23:58
조회 수
293
14

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

이탈리아 바리 알도 모로 대학교(University of Bari Aldo Moro) 컴퓨터과학과 연구팀이 개발한 'ArtSeek'이라는 인공지능이 화제다. 이 AI는 그림 사진 한 장만 봐도 누가 그렸는지, 언제 그려졌는지, 그림 속에 담긴 의미까지 설명해 준다. 마치 전문가가 옆에서 친절하게 작품을 해설해 주는 것과 같다.

지금까지 나온 미술 분석 AI들은 미리 입력된 정보에 의존해야 했다. 하지만 ArtSeek은 다르다. 그림만 보고도 스스로 판단할 수 있다. 연구진이 조사해보니 실제로 온라인에 있는 미술 작품 11만 6천여 점 중에서 제대로 된 정보가 연결된 건 1만 3천여 점뿐이었다. 나머지는 제목이나 작가 정보 없이 그냥 사진만 떠돌고 있었던 것이다.

560만 개 위키피디아 자료로 똑똑해진 AI의 비밀

ArtSeek이 이렇게 똑똑한 이유는 위키피디아의 방대한 자료를 학습했기 때문이다. 연구진은 전체 영어 위키피디아 5000만 개 조각 중에서 미술과 관련된 내용만 골라내는 특별한 방법을 개발했다. 그 결과 탄생한 '위키프래그먼츠(WikiFragments)'는 565만 1060개의 미술 관련 자료로 구성되어 있다. 이 중 523만 개는 텍스트만 있고, 41만 개는 사진과 글이 함께 들어있다.

연구진은 위키피디아의 카테고리를 따라가면서 미술 관련 정보만 골라내는 특별한 방법을 개발했다. 각 자료 조각은 위키피디아 한 문단과 그 위에 있는 모든 사진들로 이루어져 있다. 이렇게 모인 자료들이 AI가 그림을 분석할 때 백과사전 역할을 하는 것이다.


기존 AI보다 8.4% 더 정확해진 놀라운 성능

ArtSeek은 세 가지 주요 기능으로 작동한다. 첫 번째는 필요한 정보를 척척 찾아내는 검색 기능이다. 두 번째는 화가, 화풍, 장르, 재료, 특징을 알아내는 분류 기능이다. 세 번째는 복잡한 질문에도 단계별로 추리해서 답하는 추론 기능이다.

성능 테스트 결과가 놀라웠다. 화풍을 맞히는 능력에서 기존 최고 AI인 'GraphCLIP'보다 8.4%나 더 정확했다. 그림 설명을 쓰는 능력도 기존보다 7.1점이나 높았다. 더 놀라운 건 속도다. 2단계 검색 방식을 써서 기존보다 93%나 빨라졌다. 먼저 100개 후보를 빠르게 찾고, 그중에서 가장 관련성 높은 10개만 골라내는 방식이다. 구체적으로 보면 화가 맞히기에서 71.75%, 장르 맞히기에서 78.54%, 화풍 맞히기에서 69.80%의 정확도를 보였다. 이는 현재까지 나온 AI 중 가장 뛰어난 성능이다.

"이 그림 속 남자는 왜 다람쥐를 가리킬까?" 복잡한 질문도 척척 해결

ArtSeek의 가장 인상적인 능력은 복잡한 질문에 답하는 것이다. 예를 들어 "이 초상화 속 남자가 왜 다람쥐를 가리키고 있을까?"라는 질문을 받으면, AI는 단계별로 생각한다. 먼저 관련 자료를 찾고, 여러 정보를 종합해서 설득력 있는 답변을 만들어낸다. 마치 미술사 전문가가 연구하는 과정과 비슷하다.

실제 테스트에서 ArtSeek은 르누아르의 그림을 분석할 때 화가와 화풍을 정확히 알아맞혔다. 그리고 비슷한 다른 작품들을 찾아서 그림의 배경과 의미를 설명했다. 심지어 잘 알려지지 않은 작품도 관련 정보를 찾아내어 해석할 수 있었다. 요하네스 베르메르의 작품을 분석할 때는 그림 속 여성의 정체까지 추측해서 설명했다.

특히 주목할 점은 ChatGPT와의 차이점이다. ChatGPT는 종종 잘못된 작가 이름이나 작품 제목을 지어내는 '환각' 현상을 보인다. 하지만 ArtSeek은 자신이 어떤 자료를 보고 판단했는지 단계별로 보여준다. <think> 라는 특별한 기호를 사용해서 추론 과정을 투명하게 공개하는 것이다.

FAQ

Q: ArtSeek은 어떤 그림들을 분석할 수 있나요?

A: 회화, 조각, 드로잉 등 거의 모든 종류의 미술 작품을 분석할 수 있습니다. 작품에 대한 사전 정보 없이도 사진만 있으면 화가, 화풍, 시대적 배경 등을 알아낼 수 있어서 온라인에 떠도는 대부분의 미술 작품에 활용할 수 있습니다.

Q: 기존 미술 분석 AI와 뭐가 다른가요?

A: 기존 AI들은 미리 입력된 정보에 의존했지만, ArtSeek은 그림만 보고도 분석합니다. 560만 개의 위키피디아 자료를 바탕으로 더 깊이 있는 해석을 제공하고, 복잡한 질문에도 단계별로 추리해서 답변할 수 있습니다.

Q: 일반인도 사용할 수 있나요?

A: 연구진은 데이터셋과 소스코드를 모두 공개할 예정이라고 밝혔습니다. 이를 통해 다른 연구자들이나 개발자들이 자유롭게 활용할 수 있을 것으로 보입니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: ArtSeek: Deep artwork understanding via multimodal in-context reasoning and late interaction retrieval

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.





AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
'아이폰 자동차' 애플 카플레이 새 버전에 영상 스트리밍 기능 추가 오토헤럴드
현대차·기아 전기차 ICCU 결함 글로벌 시장 확산, 신뢰도에 ‘빨간불’ 오토헤럴드
'3000만원대 프리미엄 전기차' 볼보 EX30 파격 인하, 아이오닉 5보다 저렴 오토헤럴드
포르쉐코리아, 미래 세대 ‘꿈’ 실현 ‘포르쉐 두 드림’ 10주년 사회공헌 강화 오토헤럴드
독일 프리미엄3사 중국시장에서 판매 하락과 가격 인하 글로벌오토뉴스
토털에너지스-구글, 텍사스서 1GW 규모 태양광 전력 공급 계약 체결 글로벌오토뉴스
포드 CEO 짐 팔리, 트럼프 행정부에 중국과 합작 파격 제안 글로벌오토뉴스
프랑스, 사회적 임대 열풍에 전기차 점유율 25% 돌파 글로벌오토뉴스
테슬라 FSD, 이번엔 호수로 돌진, 무감독 주행 아직 멀었나 글로벌오토뉴스
아우디, 디젤 엔진 부활과 물리 버튼의 귀환 글로벌오토뉴스
샤오펑, VLA 2.0 앞세워 로보택시 출사표 글로벌오토뉴스
중국 장청자동차, 유럽 시장 재 도전 선언… 2030년 연 30만 대 생산 공장 건설 글로벌오토뉴스
폭스바겐코리아, 2026년 ‘Feel & Drive’ 시승 캠페인 전개 글로벌오토뉴스
페라리, 엔초 페라리 박물관서 “최고의 걸작 – 전설적인 뮤지션과 그들의 페라리” 전시 개최 글로벌오토뉴스
볼보자동차코리아, 순수 전기 SUV ‘EX30’ 및 ‘EX30CC’ 가격 파격 인하 글로벌오토뉴스
한국타이어 후원, 월드 랠리 챔피언십 ‘스웨덴 랠리’ 성료 글로벌오토뉴스
포르쉐코리아, ‘포르쉐 두 드림’ 10년차 맞아 사회공헌 캠페인 강화 글로벌오토뉴스
뉴욕주 로보택시 도입 제안 철회, 웨이모 사업 확장 제동 글로벌오토뉴스
르노그룹, 2025년 영업이익 15% 감소 글로벌오토뉴스
폴스타, 차세대 전기차에 물리 버튼 다시 살린다 글로벌오토뉴스
이 시간 HOT 댓글!
1/4