AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발 : 다나와 DPG는 내맘을 디피지

Leveraging Explainable AI for LLM Text Attribution
: Differentiating Human-Written and Multiple LLMs-Generated Text

텍사스 A&M 대학교 연구팀이 발표한 연구에 따르면, 설명가능한 AI(XAI) 기술을 활용해 챗GPT(ChatGPT)나 클로드(Claude) 등 AI 언어모델이 생성한 텍스트를 높은 정확도로 식별해낼 수 있게 되었다. 연구진은 2023년 11월에 600개의 텍스트 샘플을 수집하여 분석을 진행했다.

AI가 쓴 글과 사람이 쓴 글 98.5% 구분하는 기술 공개

연구진은 인공지능 대형언어모델(LLM)이 생성한 텍스트와 사람이 작성한 텍스트를 구분하는 데 머신러닝과 딥러닝 알고리즘을 활용했다. 랜덤 포레스트(Random Forest)와 순환신경망(RNN) 등의 기술을 적용한 결과, 이진 분류에서 98.5%의 높은 정확도를 달성했다. 이는 기존의 AI 텍스트 탐지 도구인 GPT제로(GPTZero)의 78.3% 정확도를 크게 앞지른 수준이다. 특히 GPT제로가 전체 샘플의 4.2%를 식별하지 못한 반면, 새로운 모델은 모든 테스트 데이터셋을 성공적으로 분석했다.

다양한 AI 도구별 특징 파악하는 데 성공

연구팀은 챗GPT, 라마(LLaMA), 구글 바드(Google Bard), 클로드, 퍼플렉시티(Perplexity) 등 5개 주요 AI 언어모델이 생성한 텍스트를 각각 구분하는 데도 성공했다. 데이터 전처리와 TF-IDF 벡터화 기법을 활용한 다중 분류에서 랜덤 포레스트는 97%의 정확도와 93%의 정밀도, 94%의 재현율을 기록했다. XGBoost는 94%의 정확도와 90%의 정밀도 및 재현율을 보였으며, RNN은 88%의 정확도, 90%의 정밀도, 72%의 재현율을 달성했다.

특히 RNN의 경우 'claude' 클래스에서는 12.5%의 진양성률을 보여 'human', 'chatgpt', 'bard' 클래스와의 구분에 어려움을 겪었고, 'llama' 클래스에서는 62.5%의 진양성률을 보여 'human', 'chatgpt', 'perplexity' 클래스와의 구분에 한계를 드러냈다.

AI별(바드, 챗GPT, 클로드, 라마, 퍼플렉시티) 텍스트 특징 분석

연구진은 LIME(Local Interpretable Model-agnostic Explanations) 기술을 활용해 각 AI 도구별로 독특한 텍스트 생성 패턴을 발견했다.

구글 바드는 '초점', '운송', '투표', '자동차', '범위', '보장', '우려', '시스템' 등 체계적이고 구조적인 요소와 관련된 단어를 자주 사용했다.

챗GPT는 '좋은', '찾기', '수용', '고려', '신뢰', '시민', '도시', '제한', '편지', '사용' 등 질적 평가와 실용적 적용을 혼합한 표현을 특징적으로 사용했다.

클로드는 '도시', '국가', '과도한', '사람들', '감사합니다', '진심으로', '투표', '합리적', '부탁 드립니다' 등 공손하고 시민 참여적인 표현을 주로 사용했다.

라마는 '선거', '사용', '과정', '평등', '제한', '의견', '대안', '또한', '보장', '진심으로' 등 절차적이고 민주적인 요소를 강조하는 단어를 사용했다.

퍼플렉시티는 '감소', '시스템', '압력', '보장', '도움', '운전', '덜', '상원의원', '개인', '친애하는' 등 효율성과 개인적 중요성을 강조하는 단어를 특징적으로 사용했다.

반면 사람이 작성한 텍스트는 '하다', '것', '많은', '말하다', '방법', '얻다', '가다', '사람들', '아니다' 등 일상적인 동사와 대명사를 자주 사용하는 것으로 나타났다. 이러한 단어 사용 패턴은 실제 인간의 자연스러운 의사소통 방식을 반영하는 것으로 분석되었다.

학술적 표절 방지에 새로운 돌파구 될까?

이번 연구 결과는 특히 교육계에서 문제가 되고 있는 AI 표절 문제 해결에 큰 도움이 될 것으로 기대된다. 연구진은 이 기술이 학생들의 과제나 에세이에서 AI 사용 여부를 정확하게 판별할 수 있을 뿐만 아니라, 미묘하게 수정되거나 바꿔 쓴 텍스트도 감지할 수 있다고 밝혔다. 더불어 이 기술은 사이버보안, 학문적 진실성, 비즈니스 운영 등 다양한 분야에서 콘텐츠의 신뢰성을 검증하는 데 활용될 수 있을 것으로 전망된다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

에디터가 광저우에서 경험한 현지인의 4가지 일상 (1)	트래비
니스에서 반나절로 다녀오기 좋은 근교 소도시 3 (1)	트래비
APEC 그 후, 경주 여행	트래비
블루 아카이브 '미연시 콘텐츠 개발은 비싸다'	게임메카
'마의 10분 벽 깬다' 현대차 아이오닉 5 N '구름위의 레이스' 도전 (1)	오토헤럴드
혼다·르노 베끼고 이름만 슬쩍? BYD DM-i '혁신' 아닌 '독창적 짜깁기' (1)	오토헤럴드
[EV 트렌드] '중국 주춤, 유럽은 질주' 글로벌 전기차 시장 다시 성장세	오토헤럴드
[김훈기 칼럼] 'RAV4의 진화' 전기차도 하이브리드도 아닌 새로운 선택	오토헤럴드
추억의 게임 살려내는 '넥슨 리플레이' 원동력은 AI 기술	게임메카
[취재] 전자랜드도 서브컬처 플랫폼으로. 4층에 ‘명조 Night Tales’ 팝업 오픈	게임동아
[계약자 필청!] 스타리아EV 풀옵션 출고 계약 "근데 보조금이 이상해?" 동영상 있음	오토기어
림월드 디렉터 "가장 복잡하기에, 나는 인간을 사랑한다"	게임메카
바늘구멍 같은 스팀 슈팅 뚫기, ‘부정적’ 의견에 답 있다	게임메카
접히고 얇아지고 비싸진다…애플·삼성·테슬라까지 뒤흔든 최신 IT 루머	다나와
후처리 비용 줄이는 엔씨 AI의 '얼굴 애니메이션' 기술	게임메카
구글 딥마인드 성장 기반에는 '게임 DNA'가 있었다	게임메카
매일 30TB 데이터 수집하는 '아크 레이더스'가 무사한 이유	게임메카
26일 개막 앞둔 부산모빌리티쇼 '자동차 넘어 하늘과 바다까지'	오토헤럴드
전기차 주행거리 거짓말 순위 '현대차 아이오닉 9' 2위...1위는? (1)	오토헤럴드
외장 그래픽카드를 장착할 수 있는 모둘형 노트북 ㄷㄷㄷ 【컴퓨텍스 2026 #2】 동영상 있음	뻘짓연구소
대체 이 게임은… 올해 마지막 캡콤 대작 '귀무자: 웨이 오브 더 소드' 동영상 있음	집마 홀릭TV
김지훈 대표 “서브컬처 유저, 창작자 착즙한 ‘고통’ 원한다”	게임메카
게임 내러티브에서 AI는 보조 수단일 뿐, 한계 뚜렷하다	게임메카
[주간보안동향] 앤트로픽 페이블 5 차단…보안 업계 반발 外	IT동아
업스테이지, 다음ㆍ타임리ㆍ스튜디오 등 플랫폼 총동원 “모두를 위한 AI 시대 연다”	IT동아
[위클리AI] 앤트로픽, 클로드 미토스5·페이블5 출시···미 정부 수출 통제에 서비스 중단 외	IT동아
쉽지 않았습니다, 메이플 월드 자체 LLM ‘단풍’ 개발기	게임메카
교통사고 호의 동승 감액의 역설과 딜레마 (1)	IT동아
장마철 타이어 점검 '선택 아닌 필수'...빗길 사고 막는 첫 번째 조건	오토헤럴드
[EV 트렌드] CATL 회장, 꿈의 전고체 배터리 "이제 절반 왔을 뿐"	오토헤럴드
[컴퓨텍스 2026] AI부터 게이밍까지 아우르는 전력 솔루션 공개한 'CWT'	미디어픽
[인터뷰] 디아블로 이모탈, 신규 직업 ‘악마술사’ 출시 D-1.. '기대감 폭증' (1)	게임동아
레이 SOH는 왜 안 속이나? 진짜 사기 행각은 따로 있다! 동영상 있음	오토기어
제미나이에게 너구리 게임을 만들어 달라고 했더니 벌어진 일 동영상 있음	AI matters
[겜ㅊㅊ] 스팀 넥스트 페스트, 찜 상위권 오른 추천작 5선	게임메카
2.5주년 맞는 창세기전 모바일, 7월 7일 ‘철가면’ 선보인다	게임메카
블리자드 "디아블로 이모탈만의 악마술사 기대해주시길"	게임메카
[숨신소] 로그라이크와 토탈워의 만남 '테이블탑 태번'	게임메카
MSI 창립 40주년 기념 전시회	기글하드웨어
컴퓨텍스 2026 @ MSI 그래픽카드, 주변기기, 40주년 기념 제품	기글하드웨어
컴퓨텍스 2026 @ AMD 커넥트	기글하드웨어
[정석희의 기후 에너지 인사이트] 12. 과학은 왜 "100퍼센트 안전하다"고 말하지 못하는가	IT동아
난립하는 ‘X탠바이미’ 시장, 원조 LG의 승부수	IT동아
‘599달러’에 주목한 노트북 PC 시장, 경쟁은 시작됐다	IT동아
[기고] 빠른 영업 응대로 고객사 이탈을 막는 법	IT동아
엔비디아 방한으로 불붙은 AI 인프라 동맹…2027년 첫 가동될 ‘AI 팩토리’ 뭐길래	IT동아
K-치킨 성지순례 대구 동구&남구 '치킨 로드' (1)	트래비
[모빌리티 인사이트] 유럽의 역설, 중국 전기차 막았더니 더 깊숙이	오토헤럴드
천하무적 토요타, 르망 24시 정상 탈환... 가능성 확인한 제네시스	오토헤럴드
[EV 트렌드] 샤오미의 또 다른 도전, 주행거리 연장형 SUV 개발	오토헤럴드
[기자 수첩] 완주 가능성 '제로', 불가능에 도전한 현대차의 기적	오토헤럴드
[정보/루머] 서서히 시동 거는 인텔 노바 레이크와 RTX 50 슈퍼, 치열한 서버 CPU 경쟁 속 AMD의 행보 등	다나와
스트라드비젼 'Vision AI로 자율주행 대중화 이끌 것'… IPO 간담회서 성장 전략 공개	케이벤치
이건 그냥 뇌절 아닌가요? 【컴퓨텍스 2026 #1】 동영상 있음	뻘짓연구소
(컴퓨텍스 2026)대만 컴퓨터 축제에서 별의 별 희한한 컴퓨터 다 보고 왔습니다 동영상 있음	민티저
하루 수천 건 경보에 지친 보안팀... AI 에이전트가 보안 환경의 판을 바꾼다	IT동아
AI 만난 에어컨, 삼성·LG·캐리어는 무엇이 다른가? (1)	다나와
Now Bangkok, 방콕의 현재를 볼 수 있는 2곳	트래비
소록도, 고립의 땅에서 인권의 기록으로	트래비
[컴퓨텍스 2026] 데이터센터부터 데스크톱까지 아우르는 AI 플랫폼 공개 '알토스'	미디어픽
[컴퓨텍스 2026] 차세대 AI 서버부터 워크스테이션까지 '실버스톤'	미디어픽
[컴퓨텍스 2026] '보는 재미' 더한 신제품 총출동 '리안리'	미디어픽
[컴퓨텍스 2026] '보여주는 PC' 시대 겨냥한 튜닝 액세서리 공개 'EZDIY-FAB'	미디어픽
[컴퓨텍스 2026] 파노라믹 디자인의 진화 '겜디아스'	미디어픽
[EV 트렌드] 토요타·렉서스, 첫 3열 전기 SUV 동반 출격 "늦었지만 크게"	오토헤럴드
[모빌리티 인사이트] "포드는 이미 넘었다" BYD 진짜 목표는 '토요타'	오토헤럴드
'이제 24시간 남았다' 제네시스, 르망의 기적 마지막 관문 통과	오토헤럴드
전기차 캐즘은?, 벤츠 청라 화재 이후에도 10명 중 7명 선택	오토헤럴드
신권과 함께, '솔: 인챈트'에는 '대박'의 재미가 있다	게임메카
소규모 인디 개발자들이 소개하는 ‘현실적인 홍보 전략’	게임메카
젠슨황 QNA서 언급된 엔비디아의 다음 혁신은? 키노트가 어려운 분들을 위한 쉬운 해설 그리고 컴퓨텍스의 위기 동영상 있음	보드나라
현대가 SOH로 사기 친다? 배터리 게이트 터지나? 동영상 있음	오토기어
[순정남] 정체가 뭐야? 비정상적으로 가벼운 포켓몬 TOP 5 (1)	게임메카
[동아게임백과사전] 등장은 기본! 게임에 투자까지 했던 마이클 잭슨 (1)	게임동아
[기자간담회] eG이노베이션스 '한국은 아시아 확장의 청사진'... AI 옵저버빌리티·SAP PCE 시장 공략 강화	케이벤치
[취재] 원재호 앵커노드 대표 "AI는 글로벌 경쟁 위한 ‘신무기’, 100억으로 1000억 게임과 경쟁해야"	게임동아
[취재] 나규봉 엔씨 AI 사업팀장 “게임사는 AI를 끝까지 써볼 환경 만들어줘야 한다”	게임동아
[취재] 이승호 딜사이트미디어 의장 “게임 제작비 세액공제 논의할 시점 왔다”	게임동아
제네시스 마그마, 르망 하이퍼폴 무난하게 진출... 본선 기대감 높여	오토헤럴드
[생활 속 IT] 만날 장소 설정부터 도착 알림까지, 카카오맵 ‘친구위치’	IT동아
토큰 맥스 아닌 AI 에이전트의 실전 가치 알린 세일즈포스	IT동아
한국이 더 싸다? 이상하게 혜자인 스튜디오 장비 동영상 있음	Hakbong Kwon
매일 뭐 볼까 헤매던 넷플릭스, ‘맞춤형 추천’ 강화로 탐색 고민 끝낸다 (1)	IT동아
[순위분석] 입문하기 좋은 신규 캐릭터, 던파 TOP 10 눈앞	게임메카
“나도 모르는 사이 중고차 광고?”…이달부터 소유자 동의 없으면 못 올린다	IT동아
[컴퓨텍스 2026] AI 시대 데이터 흐름 책임질 차세대 솔루션 선보인 '트랜센드'	미디어픽
[컴퓨텍스 2026] 화려한 튜닝과 강력한 냉각 성능의 조화 '1stplayer'	미디어픽
800만대 팔린 BYD 신병기 'DM-i'... 전기차 같은 하이브리드 온다	오토헤럴드
나트륨 배터리에 꽂힌 GM '자동차 중심에서 에너지 기업으로 진화'	오토헤럴드
아이폰 사용자들아 그만 울어......(WWDC 2026 총정리) 동영상 있음	THE EDIT
DGX 아닌 RTX 스파크 꺼낸 엔비디아, 반도체 변수 뚫고 성공할까?	IT동아
3년을 기다린 애플 AI의 실체?? 동영상 있음	UnderKG
역대 최악이라던 WWDC26, 저는 생각이 좀 다릅니다 동영상 있음	주연 ZUYONI
[보드게임] 테이블 위 존(Zone)도 위험! 스토커 더 보드게임	게임메카
[겜ㅊㅊ] 멈출 수 없는 빌드 짜는 재미, 뱀서류 수작 5선	게임메카
AI 시대의 애플의 미래를 보는 WWDC26 핵심 총 정리 리뷰 동영상 있음	조코딩 JoCoding
[WWDC 2026] 가장 개인적인 범용 AI의 탄생	AI matters
[김훈기 칼럼] "상반기보다 더 어렵다" 자동차 시장 흔드는 삼중 악재 (1)	오토헤럴드
캐나다 워킹홀리데이, 토론토에서 제대로 여름나기	트래비
반짝이는 섬의 시간, 가야 아일랜드 리조트 (1)	트래비

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

공유하기

공감/비공감