비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI들의 IQ와 정치 성향까지 비교해 주는 'AI계의 다나와', 트래킹AI(TrackingAI)

다나와
2025.08.25. 14:48:48
조회 수
1,350
5

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

출처 : TrackingAI


 미국 저널리스트인 맥심 로트(Maxim Lott)가 만든 AI 모델 비교 사이트 'Tracking AI'의 대중적 인지도가 높아지고 있다. 이 사이트는 독자적으로 만든 비공개 IQ 테스트와 Mensa Norway가 온라인으로 공개하고 있는 도형 퍼즐형 IQ 테스트를 이용하여 GPT-5 Pro 등 ChatGPT, Claude 4 Opus, Gemini 2.5 Pro, Llama, Mistral 등 대표적인 AI 모델들의 성능을 비교해 보여준다.


IQ 테스트를 통한 성능 비교


Tracking AI에서는 각 모델의 IQ 스코어를 분포도나 랭킹 형식으로 표시한다.

사용된 테스트는 두 종류로 하나는 제작자 로트가 직접 작성한 오프라인 자작 테스트로, AI의 학습 데이터에 포함되어 있지 않은 부분을 강조한다. 다른 하나는 멘사(Mensa Norway)가 제공하는 온라인 IQ 테스트로, 35문의 도형추리 문제를 25분 이내에 푸는 형식이다. 모두 AI의 '추론력'을 가시화하는 지표로 활용되고 있다. 모든 스코어는 최근 7번의 테스트들의 평균으로 채점된다.



출처 : TrackingAI


 8월 22일자 랭킹에서는 OpenAI의 GPT-5 Pro(Vision)와 구글의 제미나이 2.5 Pro가 최상위에 위치해 있으며 Claude나 DeepSeek 등도 포함한 스코어의 추이를 시계열로 쫓을 수 있다. 결과는 멘사 온라인 IQ 테스트와 트래킹AI 자작 테스트를 구분해 볼 수도 있으며 각 문제별 정답률과 AI별 해답 이유까지 공개돼 모델 사고 과정을 상세하게 비교할 수 있다.



정치적, 사회적 질문 비교


출처 : TrackingAI


 트래킹 AI의 또 다른 특징은 AI모델에 정치적·사회적 테마의 질문을 던져 모델 간 응답을 비교할 수 있다는 점이다. 매일 27개의 질문을 각 AI들에게 던져 그 응답내용을 비교해 보여주며 AI는 '매우 동의/동의/반대/매우 반대' 중 하나를 골라 그에 대한 이유를 설명해야 한다. 또, AI별 응답 결과는 월평균과 당일 응답을 구분해서 볼 수도 있다.


 예를 들어 8월 20일 기준 '토지는 사고 팔 수 있는 상품이 되어선 안된다'라는 질문에 대해 GPT-5, 딥시크V3, 빙 코파일럿은 '동의(Agree)'라고 대답한 반면 그록4, 클로드4, 제미나이2.5플래시는 '동의하지 않음(Not Agree)'라는 입장을 나타냈다. 


출처 : TrackingAI



이 테스트는 단편적이지만 각 AI의 바이어스(bias)나 사상 경향을 파악할 수 있는 실마리를 제공한다.


 또한 사이트에서는 「IQ TEST OF THE DAY」라는 제목의 일일 문제도 제공되고 있다. 각 AI의 답변과 이유가 나란히 게재되고 있어 단순한 스코어 비교에 그치지 않고 추론의 특징을 파악할 수 있는 것이 특징이다.


 FAQ를 통해 자신의 본업을 '스토셀 TV(Stossel TV)의 총괄 프로듀서'라고 소개한 맥심 로트는 사이트 제작 이유에 대해 '누구나 AI 챗봇의 최신 정치적 의견과 편견을 즉시 확인할 수 있도록 이 웹사이트를 만들었다'며 트래킹AI가 '사용자에게 사용하는 AI의 이념을 알려주어 우리 모두가 편향성이 덜한 AI, 또는 자신의 철학과 더 가까운 AI로 전환하는 데 도움을 준다'고 밝혔다.



[트래킹AI 바로 가기]



글 / 김지훈 news@cowave.kr

(c) 비교하고 잘 사는, 다나와 www.danawa.com

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
저작권 안내
크리에이트 커먼즈 저작자 표시 필수 상업성 이용 불가 컨텐츠 변경 불가
저작권 안내
저작권 표시 필수
상업성 이용 불가
컨텐츠 변경 불가
* 본 내용은 위의 조건을 충족할 시, 별도의 허가 없이 사용이 가능합니다.
최신 일반뉴스 전체 둘러보기
1/1
BYD, '휘발유와 에탄올' 세계 최초 바이오 연료 슈퍼 하이브리드 공개 오토헤럴드
포르쉐 전기차 돌풍… 마칸 18% 급등, 한국 전동화 비중 59.4% ‘역대 최고’ 오토헤럴드
"자칫하면 수천만 원" 보증기간 끝난 테슬라 중고차 가격 큰 폭 하락 오토헤럴드
현대차ㆍ테이트 미술관, '현대 커미션: 마렛 안네 사라: Goavve-Geabbil' 개막 오토헤럴드
지엠, 수소연료전지 개발 중단 선언 "전기차 등 명확한 기술에 집중" 오토헤럴드
확률 공개 포함, 해외 게임사 국내대리인제도 23일 시행 게임메카
대학생이라면 누구나! 캐논코리아, ‘2025 미래작가상’ 참가자 모집 시작 (1) 뉴스탭
AMD, 파트너와 함께 성장한다… 글로벌 채널 프로그램 ‘APN’ 공개 (1) 뉴스탭
세레니끄, 2007년부터 ‘데이터 기반 맞춤 피부 관리’ 선도… 과학적 진단으로 고객 신뢰 구축 뉴스탭
‘하이트제로 0.00’이 연 무알코올 맥주의 시대… MZ세대 건강 트렌드 타고 시장 ‘폭발 성장’ (1) 뉴스탭
OpenAI–브로드컴, 10GW급 맞춤형 AI 가속기 동맹…설계부터 네트워킹까지 ‘풀스택’ 내재화 (1) 다나와
EU, ‘Apply AI’로 11억 달러 투입…현장 도입 가속해 기술 주권 겨냥 다나와
글로벌 스마트폰 출하량 2.6%↑…프리미엄·AI폰 수요가 반등 견인 다나와
Gitex 2025, UAE ‘AI 순찰차’ 첫 공개…비자·체류 위반 실시간 탐지 시연 다나와
Deloitte, ‘클로드(Claude)’ 전사 확장…오류 보고서 환불 사과와 함께 규제 산업 공략 속도 다나와
기아, 'PV5' 기부 사회공헌 사업 'Kia Move & Connect' 시작 글로벌오토뉴스
미국 NHTSA, 테슬라 FSD 시스템 안전성 조사 착수…총 288만 대 대상 글로벌오토뉴스
포르쉐, 2025년 3분기 전동화 비중 35% 돌파…전세계 21만대 인도 글로벌오토뉴스
기아 유럽, EV 배터리 투명성 혁신 시동…셀 수준 배터리 여권 최초 시험 글로벌오토뉴스
중국 전기차, 출혈 경쟁 피해 해외로 눈 돌린다…BYD·샤오펑 등 수출 전략 가속 글로벌오토뉴스
이 시간 HOT 댓글!
1/4