AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발 : 다나와 DPG는 내맘을 디피지

Leveraging Explainable AI for LLM Text Attribution
: Differentiating Human-Written and Multiple LLMs-Generated Text

텍사스 A&M 대학교 연구팀이 발표한 연구에 따르면, 설명가능한 AI(XAI) 기술을 활용해 챗GPT(ChatGPT)나 클로드(Claude) 등 AI 언어모델이 생성한 텍스트를 높은 정확도로 식별해낼 수 있게 되었다. 연구진은 2023년 11월에 600개의 텍스트 샘플을 수집하여 분석을 진행했다.

AI가 쓴 글과 사람이 쓴 글 98.5% 구분하는 기술 공개

연구진은 인공지능 대형언어모델(LLM)이 생성한 텍스트와 사람이 작성한 텍스트를 구분하는 데 머신러닝과 딥러닝 알고리즘을 활용했다. 랜덤 포레스트(Random Forest)와 순환신경망(RNN) 등의 기술을 적용한 결과, 이진 분류에서 98.5%의 높은 정확도를 달성했다. 이는 기존의 AI 텍스트 탐지 도구인 GPT제로(GPTZero)의 78.3% 정확도를 크게 앞지른 수준이다. 특히 GPT제로가 전체 샘플의 4.2%를 식별하지 못한 반면, 새로운 모델은 모든 테스트 데이터셋을 성공적으로 분석했다.

다양한 AI 도구별 특징 파악하는 데 성공

연구팀은 챗GPT, 라마(LLaMA), 구글 바드(Google Bard), 클로드, 퍼플렉시티(Perplexity) 등 5개 주요 AI 언어모델이 생성한 텍스트를 각각 구분하는 데도 성공했다. 데이터 전처리와 TF-IDF 벡터화 기법을 활용한 다중 분류에서 랜덤 포레스트는 97%의 정확도와 93%의 정밀도, 94%의 재현율을 기록했다. XGBoost는 94%의 정확도와 90%의 정밀도 및 재현율을 보였으며, RNN은 88%의 정확도, 90%의 정밀도, 72%의 재현율을 달성했다.

특히 RNN의 경우 'claude' 클래스에서는 12.5%의 진양성률을 보여 'human', 'chatgpt', 'bard' 클래스와의 구분에 어려움을 겪었고, 'llama' 클래스에서는 62.5%의 진양성률을 보여 'human', 'chatgpt', 'perplexity' 클래스와의 구분에 한계를 드러냈다.

AI별(바드, 챗GPT, 클로드, 라마, 퍼플렉시티) 텍스트 특징 분석

연구진은 LIME(Local Interpretable Model-agnostic Explanations) 기술을 활용해 각 AI 도구별로 독특한 텍스트 생성 패턴을 발견했다.

구글 바드는 '초점', '운송', '투표', '자동차', '범위', '보장', '우려', '시스템' 등 체계적이고 구조적인 요소와 관련된 단어를 자주 사용했다.

챗GPT는 '좋은', '찾기', '수용', '고려', '신뢰', '시민', '도시', '제한', '편지', '사용' 등 질적 평가와 실용적 적용을 혼합한 표현을 특징적으로 사용했다.

클로드는 '도시', '국가', '과도한', '사람들', '감사합니다', '진심으로', '투표', '합리적', '부탁 드립니다' 등 공손하고 시민 참여적인 표현을 주로 사용했다.

라마는 '선거', '사용', '과정', '평등', '제한', '의견', '대안', '또한', '보장', '진심으로' 등 절차적이고 민주적인 요소를 강조하는 단어를 사용했다.

퍼플렉시티는 '감소', '시스템', '압력', '보장', '도움', '운전', '덜', '상원의원', '개인', '친애하는' 등 효율성과 개인적 중요성을 강조하는 단어를 특징적으로 사용했다.

반면 사람이 작성한 텍스트는 '하다', '것', '많은', '말하다', '방법', '얻다', '가다', '사람들', '아니다' 등 일상적인 동사와 대명사를 자주 사용하는 것으로 나타났다. 이러한 단어 사용 패턴은 실제 인간의 자연스러운 의사소통 방식을 반영하는 것으로 분석되었다.

학술적 표절 방지에 새로운 돌파구 될까?

이번 연구 결과는 특히 교육계에서 문제가 되고 있는 AI 표절 문제 해결에 큰 도움이 될 것으로 기대된다. 연구진은 이 기술이 학생들의 과제나 에세이에서 AI 사용 여부를 정확하게 판별할 수 있을 뿐만 아니라, 미묘하게 수정되거나 바꿔 쓴 텍스트도 감지할 수 있다고 밝혔다. 더불어 이 기술은 사이버보안, 학문적 진실성, 비즈니스 운영 등 다양한 분야에서 콘텐츠의 신뢰성을 검증하는 데 활용될 수 있을 것으로 전망된다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

[모빌리티 넥스트] “진짜 트랜스포머?”…날아서 착지하고 바퀴로 질주 (2)	오토헤럴드
[겜ㅊㅊ] ‘수저린’ 끝내고 해볼 만한 정치 시뮬 4선 (3)	게임메카
연초록 물결, 가파도 청보리 캠핑 (1)	트래비
혹시 가전주부라는 유튜버 아세요...? 동영상 있음	THE EDIT
“이게 진짜 나와요?”…후지 X-E5부터 픽셀10까지, 쏟아지는 신제품 루머 총정리 (4)	다나와
신빙성 낮지만, 기대가 되는 라데온 RX 9080 XT 출시설 및 인공지능 가속기 생산 증가를 위한 RTX 50 감산설 등 (5)	다나와
철원의 멋과 맛을 느낄 수 있는 곳을 찾아라 (4)	트래비
제네시스 마그마 레이싱 'GMR-001 하이퍼카' 르망 24시서 실전 경험 (1)	오토헤럴드
[매장탐방] 가정의 달 특수 없앤 스위치 2의 폭풍전야 (3)	게임메카
닌텐도 스위치 2, 기대되는 성능과 걱정되는 키 카드 (1)	게임메카
Okm 중고차가 쏟아지는 중국 "결국 BYD 폭탄 할인 선언!" 동영상 있음	오토기어
에이서, AI PC 전면에 내세운 컴퓨텍스 2025 전략… Copilot+로 전 라인업 무장 (1)	뉴스탭
“증명사진 위조 여부 판별” 생성 AI 딥페이크 탐지 서비스 샌즈랩 ‘페이크체크 2.0’ (1)	IT동아
크리에이터에게 가장 중요한 건 스토리지, SanDisk CREATOR SERIES 발표회 (1)	브레인박스
크리에이터를 위한 선택, 샌디스크 크리에이터 시리즈 발표 (1)	블루프레임
대만 국내용 메시지에 불과한 엔비디아와 대만의 AI 중심기지 전략 '팀타이완' 전략 동영상 있음	보드나라
로컬 친구 같은 호텔, OMO5 구마모토 (2)	트래비
[BOOK] 로컬 맛집에서 당황하지 않기 (2)	트래비
전설의 100만뷰 아이폰 꿀팁,, 2025년 최신 버전 (1) 동영상 있음	THE EDIT
시즈오카 여행을 계획한다면 반드시 저장해야 할 맛집 5 (2)	트래비
질병코드∙심의∙확률 규제 등, 대선 후보별 게임 공약은?	게임메카
[순정남] 아차! 대선 정치색을 드러낸 롤 챔피언 TOP 5 (1)	게임메카
남들과 다른 겜돌이를 위한 겜디아스 컴퓨텍스 2025 부스를 가다. (2)	브레인박스
새로운 나스 DS1825+, DS 1525+ 및 NVMe 스토리지 솔루션 PAS7700 등을 전시한 시놀로지 컴퓨텍스 2025 부스에 가다. (2)	브레인박스
20년 넘게 부침 없는, 국산 장수 MMORPG 근황 (4)	게임메카
[겜덕연구소] 왕년의 디즈니는 짱이었지! 디즈니 레트로 게임도 짱이었어! (5)	게임동아
딥 리서치에 대한 모든 것: 경쟁 지형도부터 모델 별 장단점, 가격 비교까지 (2)	AI matters
[KOBA 2025] 8K 영상 실시간 편집이 가능한 NAS? 해답은 QNAP (3)	위클리포스트
폭스바겐 "전기차 힘드네!" 다시 내연차에 93조원 쏟아붓겠다! (1) 동영상 있음	오토기어
컴퓨텍스2025에서 커세어-엘가토 부스에서 "스트림덱 에브리웨어" 직접 체험해 보다. (2)	브레인박스
퇴근 후 술자리는 본능일까? 침팬지에게 물어보라 (3)	과학향기
[단독] 구글 CEO 직접 만나 AI 시대 개발자, 교육, 구글 검색의 미래에 대해 물어봤습니다 동영상 있음	조코딩 JoCoding
걷기 좋은 다카마쓰, 도보로 여행하기 좋은 곳 5 (2)	트래비
서서히 침몰하는 포르쉐 (1) 동영상 있음	오토기어
Acer와 함께 하는 발로란트 챔피언스 투어 퍼시픽 스테이지 1 결승전 탐방기 (3)	쿨엔조이
뻔한 호주여행 말고 chill한 호주 여행 5 (4)	트래비
대만 타이베이 중산&완화 호텔 2 (4)	트래비
일본 오타루 1박 2일 추천 여행지 5 (4)	트래비
음악·아이돌과 게임의 결합, 소니 긴자 파크 展 탐방기 (2)	게임메카
[컴퓨텍스 2025] 유럽을 넘어 아시아로...게이밍PC 시장의 강자 '쿠거' (4)	미디어픽
[컴퓨텍스 2025] 여기가 바로 쿨러 맛집 '아틱' (2)	미디어픽
[컴퓨텍스 2025] 탄탄한 기본기와 차별화된 디자인 '비콰이어트' (2)	미디어픽
[컴퓨텍스 2025] 개성 넘치는 디자인으로 시선 집중 '1STPLAYER' (2)	미디어픽
[컴퓨텍스 2025] 감성 게이밍 기어의 정점 '겜디아스' (2)	미디어픽
中 진출 앞둔 님블뉴런 “이터널 리턴 글로벌 IP 만든다” (1)	게임메카
[AI야 소녀를 그려줘] 미스터 프레퍼, 핵 벙커를 짓는 소녀 (1)	게임메카
코카콜라와 펩시, 치열했던 100년 전쟁의 끝은? [라이벌 열전] (27)	다나와
‘메모리만 증설’한 지포스 RTX 5080 슈퍼 사양 유출 및 인텔 아크 B770 ‘2025년 4분기’ 출시설 등 (19)	다나와
추위보다 고온에 약한 자동차, 폭염 오기전 반드시 살펴봐야 할 목록 (2)	오토헤럴드
애플, 판을 다시 짠다! OS부터 디자인까지 대대적 변화 예고...요즘 뜨거운 IT 루머 총정리 (5)	다나와
AI 때문에 국산차 미래는 없다! "깡통만 잘 만들면 뭐하나?" 과연 진실은? (1) 동영상 있음	오토기어
조텍, COMPUTEX 2025에서 GPU 서버 및 DEEPX와 협력으로 AI 혁신 선도 (1)	뉴스탭
조텍, COMPUTEX 2025서 차세대 핸드헬드 PC 'ZONE White Edition' 프로토타입 공개 (1)	뉴스탭
조텍, 컴퓨텍스 2025서 초소형 데스크톱급 미니PC 전격 공개 (3)	뉴스탭
MSI, COMPUTEX 2025에서 차세대 노트북 비전 공개…AI·예술·게이밍을 아우른 종합 전시 선보여 (1)	뉴스탭
다크플래쉬, 컴퓨텍스 2025서 '우주 탐사' 테마로 신제품 전 라인업 공개 (2)	뉴스탭
[컴퓨텍스 2025] 여기가 바로 쿨러 맛집 '아틱' (4)	미디어픽
[컴퓨텍스 2025] PC 업계의 트렌드를 이끌다 '리안리' (3)	미디어픽
[컴퓨텍스 2025] 혁신에 혁신을 더하다 'HYTE' (3)	미디어픽
[컴퓨텍스 2025] 메모리계의 엄친아 '팀그룹' 성능부터 디자인까지 모두 만족 (4)	미디어픽
[컴퓨텍스 2025] 우주 여행을 떠나보자...독창적인 케이스 / 주변기기 선보인 '다크플래쉬' (2)	미디어픽
[컴퓨텍스 2025] 조텍이 만들면 다르다...혁신적인 VGA / 헨드핼드PC 선보인 'ZOTAC' (1)	미디어픽
[컴퓨텍스 2025] 팔릿 x 이엠텍, 왜 지금, 왜 PALIT인가? 에 답하다. (4)	위클리포스트
[컴퓨텍스 2025] 애즈락(ASRock)의 투(鬪)트랙 “게임의 한계를 넘고, AI 상상을 구현하다” (1)	위클리포스트
[컴퓨텍스 2025] 커세어, DIY 키보드 시장에 던지는 실질적 제안 (1)	위클리포스트
[컴퓨텍스 2025] 숫자 대신 설계로 증명한 커세어 ‘RTX 50 세대’ 청사진 공개 (1)	위클리포스트
[컴퓨텍스 2025] 해븐(HAVN) “소음을 줄이면, 존재감은 커진다” (3)	위클리포스트
[컴퓨텍스 2025] 히트 메이커 뉴젠씨앤티 × 수퍼플라워, 세계 최초 3300와트 고출력 파워 공개 (2)	위클리포스트
[컴퓨텍스 2025] 산업용 섀시 맛집 실버스톤 “LED 대신 공기 경로를 이야기할 때” (1)	위클리포스트
[컴퓨텍스 2025] 한미마이크로닉스, 기술과 감성 사이 한국적인 미를 탐했다 (2)	위클리포스트
[컴퓨텍스 2025] 프라이빗 룸에서 마주한 GAMDIAS (2)	위클리포스트
[컴퓨텍스 2025] 1STPLAYER, ‘타협 없는 가성비’로 LCD 쿨러·케이스 완성 (2)	위클리포스트
[컴퓨텍스 2025] 시소닉, Opti-tech 플랫폼으로 3200 W 고출력 PSU 시대 개막 (2)	위클리포스트
[컴퓨텍스 2025] 기가바이트의 리딩 엣지, 방향은 사용자 체감 강화한 AI 종합 솔루션 (2)	위클리포스트
[컴퓨텍스 2025] 커세어, 사용자의 취향에 날개를 달다 (3)	위클리포스트
[컴퓨텍스 2025] 애즈락, 스펙을 넘어 AI 경험의 혁신으로 (1)	위클리포스트
[컴퓨텍스 2025] QNAP Jack Yang VP에게 듣다. '기술의 방향, 아시아 시장 전략, 그리고 데이터의 미래' (1)	위클리포스트
박규승, 도요타 가주 레이싱 첫 승…슈퍼레이스 6000 클래스 새 역사	오토헤럴드
쏠라이트 인디고 레이싱 박준성, 2025 TCR 유럽 시즌 첫 포디엄 달성	오토헤럴드
[컴퓨텍스 2025] 조텍, 그래픽 카드 명가를 넘어 프리미엄 브랜드를 향한다 (1)	위클리포스트
[컴퓨텍스 2025] 이엠텍 사파이어, 성능이라는 본질에 집중하다 (1)	위클리포스트
[컴퓨텍스 2025] AI 시대를 선도할 씨게이트의 데이터 스토리지 전략은? (1)	위클리포스트
[QNAP Tech Summit 2025] “진화한 고가용성·AI 스토리지” 차세대 NAS 비전 제시	위클리포스트
[컴퓨텍스 2025] 에이서 '혁신과 가성비를 모두 잡다' 웨인 지사장, 김홍철 부장 인터뷰	위클리포스트
[컴퓨텍스 2025] 브랜드 출범 10주년 다크플래쉬, 황인성 부장에게 들어본 성장 동력 (1)	위클리포스트
[컴퓨텍스 2025] 만리 패트릭 맨 CEO 인터뷰 "대원씨티에스 손잡고 한국 그래픽카드 시장에 도전장"	위클리포스트
[컴퓨텍스 2025] 조텍, 제품 본질과 사용자 신뢰 중심의 전략 강화	위클리포스트
AI 를 넘어선 노트북, 메인보드, 그래픽카드 들을 전시한 기가바이트 컴퓨텍스 2025 VIP 부스에 가다. (1)	브레인박스
In-Side SK하이닉스, Out-Side 한국의 영혼을 에센코어-클레브 컴퓨텍스 2025 부스를 가다. (1)	브레인박스
예전 지포스, 라데온 그래픽카드를 찾는다면, 여기 액슬 컴퓨텍스 2025 부스 (1)	브레인박스
뼈속까지 원조 빨강맛, 컴퓨텍스 2025 사파이어 부스를 가다. (1)	브레인박스
AI 유료로 쓰면 큰일나는 이유;;; 동영상 있음	THE EDIT
파워, 케이스 그리고 세계로 컴퓨터텍스 2025 마이크로닉스-위즈맥스 부스에 가다. (2)	브레인박스
P의 거짓과 스텔라 블레이드는 넘었지만 왜 넥슨의 카잔은 넘지 못했을까 동영상 있음	집마 홀릭TV
한국인 입맛에 딱 맞는 사이판 맛집 5 (2)	트래비
TeamGroup, COMPUTEX 2025서 AI와 게이밍 시대 아우르는 차세대 메모리·스토리지 전격 공개 [컴퓨텍스 2025] (53)	다나와
31년, 하지만 스스로 꾸준하게 진화하고 있는 토탈 컴퓨터 커세어 컴퓨텍스 2025 부스에 가다. (3)	브레인박스
MSI 최신 제품을 직접 체험할 수 있는 절호의 기회, 2025 플레이 엑스포 (4)	노트포럼
애니 기반 타이틀 모았다, 웹게임 포털 G123 한국 상륙 (2)	게임메카
[기자 수첩] "美 2035년 내연기관 금지 무력화"... 국산차에 미칠 영향은 (4)	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

공유하기

공감/비공감