AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발 : 다나와 DPG는 내맘을 디피지

Leveraging Explainable AI for LLM Text Attribution
: Differentiating Human-Written and Multiple LLMs-Generated Text

텍사스 A&M 대학교 연구팀이 발표한 연구에 따르면, 설명가능한 AI(XAI) 기술을 활용해 챗GPT(ChatGPT)나 클로드(Claude) 등 AI 언어모델이 생성한 텍스트를 높은 정확도로 식별해낼 수 있게 되었다. 연구진은 2023년 11월에 600개의 텍스트 샘플을 수집하여 분석을 진행했다.

AI가 쓴 글과 사람이 쓴 글 98.5% 구분하는 기술 공개

연구진은 인공지능 대형언어모델(LLM)이 생성한 텍스트와 사람이 작성한 텍스트를 구분하는 데 머신러닝과 딥러닝 알고리즘을 활용했다. 랜덤 포레스트(Random Forest)와 순환신경망(RNN) 등의 기술을 적용한 결과, 이진 분류에서 98.5%의 높은 정확도를 달성했다. 이는 기존의 AI 텍스트 탐지 도구인 GPT제로(GPTZero)의 78.3% 정확도를 크게 앞지른 수준이다. 특히 GPT제로가 전체 샘플의 4.2%를 식별하지 못한 반면, 새로운 모델은 모든 테스트 데이터셋을 성공적으로 분석했다.

다양한 AI 도구별 특징 파악하는 데 성공

연구팀은 챗GPT, 라마(LLaMA), 구글 바드(Google Bard), 클로드, 퍼플렉시티(Perplexity) 등 5개 주요 AI 언어모델이 생성한 텍스트를 각각 구분하는 데도 성공했다. 데이터 전처리와 TF-IDF 벡터화 기법을 활용한 다중 분류에서 랜덤 포레스트는 97%의 정확도와 93%의 정밀도, 94%의 재현율을 기록했다. XGBoost는 94%의 정확도와 90%의 정밀도 및 재현율을 보였으며, RNN은 88%의 정확도, 90%의 정밀도, 72%의 재현율을 달성했다.

특히 RNN의 경우 'claude' 클래스에서는 12.5%의 진양성률을 보여 'human', 'chatgpt', 'bard' 클래스와의 구분에 어려움을 겪었고, 'llama' 클래스에서는 62.5%의 진양성률을 보여 'human', 'chatgpt', 'perplexity' 클래스와의 구분에 한계를 드러냈다.

AI별(바드, 챗GPT, 클로드, 라마, 퍼플렉시티) 텍스트 특징 분석

연구진은 LIME(Local Interpretable Model-agnostic Explanations) 기술을 활용해 각 AI 도구별로 독특한 텍스트 생성 패턴을 발견했다.

구글 바드는 '초점', '운송', '투표', '자동차', '범위', '보장', '우려', '시스템' 등 체계적이고 구조적인 요소와 관련된 단어를 자주 사용했다.

챗GPT는 '좋은', '찾기', '수용', '고려', '신뢰', '시민', '도시', '제한', '편지', '사용' 등 질적 평가와 실용적 적용을 혼합한 표현을 특징적으로 사용했다.

클로드는 '도시', '국가', '과도한', '사람들', '감사합니다', '진심으로', '투표', '합리적', '부탁 드립니다' 등 공손하고 시민 참여적인 표현을 주로 사용했다.

라마는 '선거', '사용', '과정', '평등', '제한', '의견', '대안', '또한', '보장', '진심으로' 등 절차적이고 민주적인 요소를 강조하는 단어를 사용했다.

퍼플렉시티는 '감소', '시스템', '압력', '보장', '도움', '운전', '덜', '상원의원', '개인', '친애하는' 등 효율성과 개인적 중요성을 강조하는 단어를 특징적으로 사용했다.

반면 사람이 작성한 텍스트는 '하다', '것', '많은', '말하다', '방법', '얻다', '가다', '사람들', '아니다' 등 일상적인 동사와 대명사를 자주 사용하는 것으로 나타났다. 이러한 단어 사용 패턴은 실제 인간의 자연스러운 의사소통 방식을 반영하는 것으로 분석되었다.

학술적 표절 방지에 새로운 돌파구 될까?

이번 연구 결과는 특히 교육계에서 문제가 되고 있는 AI 표절 문제 해결에 큰 도움이 될 것으로 기대된다. 연구진은 이 기술이 학생들의 과제나 에세이에서 AI 사용 여부를 정확하게 판별할 수 있을 뿐만 아니라, 미묘하게 수정되거나 바꿔 쓴 텍스트도 감지할 수 있다고 밝혔다. 더불어 이 기술은 사이버보안, 학문적 진실성, 비즈니스 운영 등 다양한 분야에서 콘텐츠의 신뢰성을 검증하는 데 활용될 수 있을 것으로 전망된다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

[공수전환] 쏘렌토 · 싼타페 · 그랑 콜레오스 Vs 액티언 '가성비 하이브리드 대결'	오토헤럴드
현대차 아이오닉 5 N, 파이크스 피크 인터내셔널 힐 클라임 신기록 도전 (1)	오토헤럴드
PC시장엔 성수기와 비수기가 있다? 그렇다면 PC 구매의 적기는 언제? 동영상 있음	보드나라
태블릿과 함께, 알차고 신나는 대학생활을 보내는 방법 (6)	다나와
안드로이드 태블릿은 어떤 걸 사야 할까요? (9)	다나와
미 중부의 중심 ‘시카고’에 미국 여행 다 모였다 (1)	트래비
로아와 마비노기 모바일의 뜨거운 감자 '딜 미터기' (2)	게임메카
[겜ㅊㅊ] 낚시는 거들 뿐, 스팀 낚시게임 축제 명작 4선 (2)	게임메카
중국 전기차 옹호자들의 예상 반론 동영상 있음	오토기어
스팀에 출격하는 나혼렙, 어라이즈와는 별개 게임 (2)	게임메카
[숨신소] 8번 출구에 보스전 더한 '스쿨 666' (1)	게임메카
[성지순례] 칭다오엔 맥주 뿐 아니라 게임센터도 있다 (1)	게임메카
입맛대로 골라가는 베트남 나트랑 호텔 완벽정리 5 (1)	트래비
사이판 여행 히든 스팟 4 (1)	트래비
[판례.zip] 리니지 라이크 벤치마킹의 끝이 도래하나? (1)	게임메카
메이저 4사 독과점으로 비싸진 메인보드 가격 생체별 바이오스타는 독과점을 깨고 메인보드 가격을 낮출 수 있을까 (2) 동영상 있음	보드나라
노트북의 발열 관리, 여름철에 더 신경써야합니다! (4)	다나와
스틸시리즈, 초경량 아크티스 노바 3P/3X 무선 헤드셋 발표 (1)	위클리포스트
중급 시장의 새로운 아이돌! Radeon RX 9060 XT 그래픽카드 출격 (2)	위클리포스트
출시도 안 된 픽셀 10, 벌써 픽셀 12 소식?... 지금 뜨는 IT 루머 다 모았다! (3)	다나와
스텔라 블레이드 제작진 "유저 모드 적극 환영" (1)	게임메카
[오늘의 스팀] 혹평 급증, 레식 시즈에 무슨 일이? (1)	게임메카
기아는 왜 PV5에 CATL 배터리를 넣었을까? 동영상 있음	오토기어
PV5 가격 정말 이게 맞아? 정말 충격인데? 동영상 있음	오토기어
다카마쓰에 숨겨진 보물을 찾아라, 비밀스러운 소품샵 4 (4)	트래비
여행기자가 스위스 '그슈타트'를 편애한 이유 (4)	트래비
종로 모더니스트, 문학의 길 (3)	트래비
5가지 색으로 기억한 부다페스트 (4)	트래비
지속가능한 속초 여행 (3)	트래비
[모빌리티 넥스트] 무한 에너지, 태양이 만든 휘발유로 달린 할리 데이비슨	오토헤럴드
'벤츠 유니목 그 이상'... 르노, 전천후 화재 진압용 '비전 4레스큐’ 최초 공개 (1)	오토헤럴드
슈퍼레이스 챔피언십, 이창욱 인제 나이트 레이스 제패… 두 번째 ‘밤의 황제’	오토헤럴드
슈퍼레이스, GTA 클래스 정경훈 압도적 경기 ‘폴 투 피니시’ 시즌 2승	오토헤럴드
르망 24시 "페라리 독립 레이싱 스쿼드가 마침내 르망 정상을 밟았다"	오토헤럴드
현대차 '더 뉴 아반떼 N TCR', 월드투어 2라운드 스페인 대회서 우승	오토헤럴드
다옥-와우-아이온 2까지, RvR MMORPG의 역사 (1)	게임메카
'데카론' 유비펀 스튜디오 "친구 같은 개발사 되고 싶다"	게임메카
[겜덕연구소] 전설의 게임기! 슈퍼패미콤 일체형 TV(Sharp SF1)를 수리하다! (2)	게임동아
[겜덕연구소] 진짜 특이하다! 코나미 파로디우스의 골때리는 보스들! (2)	게임동아
출시 시기가 다가오는 인텔 바틀렛레이크 및 3GB GDDR7 품은 엔비디아 RTX 5060 출시설 등 (5)	다나와
AWS 현직 전문가가 말하는 생성형 AI의 현재와 미래! \|\| AWS (1) 동영상 있음	조코딩 JoCoding
[순정남] 무료인데도 스팀서 99% '압긍'인 게임 TOP 5 (3)	게임메카
쉽지 않았습니다, 와신상담 포트나이트의 '한국 재도전'	게임메카
[기승전결] 더 프레싱트, 갱단 잡는 '경찰 GTA' (1)	게임메카
[월간자동차] 25년 5월, 전월 대비 신차 판매량 하락…팰리세이드 판매 1위 (1)	IT동아
세계 최고 맥주 브랜드 10 (5)	마시즘
국산 브랜드(OEM) 그래픽카드 전성시대. 이엠텍/렉스텍/유니텍/에버탑 우리나라 그래픽카드 시장 변화 이야기 [PC흥망사 123] (2) 동영상 있음	보드나라
솔직하게 말해 봐! 전기차 산 거 후회하지? (2) 동영상 있음	오토기어
"같은 회사니까" 니케-스텔라 블레이드 고삐 풀린 컬래버 (2)	게임메카
AI 대신 UI를 준 WWDC25 핵심 요약 (4) 동영상 있음	UnderKG
아이패드&아이폰 또 떡상한다고? 디자인 싹 갈아엎은 애플 근황 ‍ WWDC25 총정리 (1) 동영상 있음	주연 ZUYONI
2025 스틸시리즈, 260g 초경량 듀얼 무선 게이밍 헤드셋 ‘아크티스 노바 3P/3X 무선’ 국내 이벤트 (2)	브레인박스
[보드게임] 한국과는 다른, 일본 '게임마켓' 행사 탐방기 (1)	게임메카
[AI야 소녀를 그려줘] 여기가 사람 갈아넣는 우주 림월드? (1)	게임메카
분리·모듈·권총형 등, 기능도 모양도 다양한 이색 마우스 (14)	게임메카
[숨신소] '압긍' 운빨 던전 탐험 로그라이크, 솔 세스토 (2)	게임메카
새로운 디자인과 애플 인텔리전스로 플랫폼 통일, 애플 WWDC25 (1)	보드나라
12년 만에 싹 바뀐 아이폰 투명 디자인 ㄷㄷ (iOS26, 아이패드OS26, 맥OS26 총정리) (1) 동영상 있음	THE EDIT
[넥스트 모빌리티] 가솔린도 전기차도 아닌 '암모니아 엔진'에 전 세계 주목 (1)	오토헤럴드
[인디言] 화가 네 명의 인생을 담은 퍼즐게임 ‘스프레디’ (1)	게임메카
BYD 제 2의 헝다가 될 수 있다! "이 말 책임질 수 있어?" 동영상 있음	오토기어
[순정남] 공식 설정엔 없지만, 어쨌든 불사신 TOP 5 (3)	게임메카
AI PC 시대를 준비하는 인텔 코어 울트라 프로세서의 자세 (1)	브레인박스
경쟁이 두렵지 않은 1살의 거인, 카시아 속초 (1)	트래비
당신의 여름휴가를 완벽하게 만들어줄 어느 리조트 (1)	트래비
픽셀10부터 폴드7까지, 올여름 주목할 IT 기기 루머 총정리 (10)	다나와
‘더워도 신난다!’ 김천 여행지 10 (1)	트래비
MFG 지원하는 보급형 GPU 지포스 RTX 5050 출시설 및 향기 산업에 관심을 갖기 시작한 듯한 조텍 등 (8)	다나와
[체험기] "캐릭터도 액션도 매력적" 마영전의 글로벌 진화 '빈딕투스' (1)	게임동아
이 회사가 우리나라거였어? 미국시장을 주름잡았던 한국계 브랜드 [PC흥망사 132] (4) 동영상 있음	보드나라
[모빌리티 넥스트] 콜라캔과 바닷물로 수소 생산... 수소경제 돌파구? (4)	오토헤럴드
다키스트 데이즈, 느리더라도 신중히 개선하겠다 (1)	게임메카
손발 감각 저하ㆍ인지 상실... 페달 오조작 급발진 사고 "이 것" 때문 일수도 (2)	오토헤럴드
여름, 그 여행에는 언제나 바다가 남았고 (7)	트래비
애플 WWDC 2025 미리보기 \| iOS·iPadOS·macOS·watchOS 26 변화 한눈에 (12)	다나와
아이온의 근본, 천마전쟁은 왜 시작됐나? (4)	게임메카
'레이스와 축제' 슈퍼레이스 챔피언십 썸머 시즌 여는 강원 국제 모터 페스타 (2)	오토헤럴드
[기자 수첩] “현대차 N, 잘 지내고 있지?”... 가장 치열한 시장에서 폭풍 성장 (8)	오토헤럴드
임플란트 대신 실험실에서 키운 '내 치아' 끼운다 (3)	과학향기
BYD로 발칵 뒤집힌 중국! 600억원 들고 튄 딜러사도 있다 (2) 동영상 있음	오토기어
트래비 에디터가 뽑은 6월 최고의 한 접시 (2)	트래비
아이폰SE급 휴대성에 갤럭시S25 엣지보다 얇다고?! 아이폰17 에어 유출 & 엣지 실사용자의 생각..ㅋㅋ (6) 동영상 있음	주연 ZUYONI
중국의 충격적인 전기차 무덤 "아직도 헛소리라고 할 건가?" (1) 동영상 있음	오토기어
[모빌리티 넥스트] “진짜 트랜스포머?”…날아서 착지하고 바퀴로 질주 (8)	오토헤럴드
[겜ㅊㅊ] ‘수저린’ 끝내고 해볼 만한 정치 시뮬 4선 (3)	게임메카
연초록 물결, 가파도 청보리 캠핑 (4)	트래비
혹시 가전주부라는 유튜버 아세요...? 동영상 있음	THE EDIT
“이게 진짜 나와요?”…후지 X-E5부터 픽셀10까지, 쏟아지는 신제품 루머 총정리 (9)	다나와
신빙성 낮지만, 기대가 되는 라데온 RX 9080 XT 출시설 및 인공지능 가속기 생산 증가를 위한 RTX 50 감산설 등 (10)	다나와
철원의 멋과 맛을 느낄 수 있는 곳을 찾아라 (5)	트래비
제네시스 마그마 레이싱 'GMR-001 하이퍼카' 르망 24시서 실전 경험 (2)	오토헤럴드
[매장탐방] 가정의 달 특수 없앤 스위치 2의 폭풍전야 (3)	게임메카
닌텐도 스위치 2, 기대되는 성능과 걱정되는 키 카드 (2)	게임메카
Okm 중고차가 쏟아지는 중국 "결국 BYD 폭탄 할인 선언!" (1) 동영상 있음	오토기어
에이서, AI PC 전면에 내세운 컴퓨텍스 2025 전략… Copilot+로 전 라인업 무장 (2)	뉴스탭
“증명사진 위조 여부 판별” 생성 AI 딥페이크 탐지 서비스 샌즈랩 ‘페이크체크 2.0’ (3)	IT동아
크리에이터에게 가장 중요한 건 스토리지, SanDisk CREATOR SERIES 발표회 (1)	브레인박스
크리에이터를 위한 선택, 샌디스크 크리에이터 시리즈 발표 (2)	블루프레임
대만 국내용 메시지에 불과한 엔비디아와 대만의 AI 중심기지 전략 '팀타이완' 전략 (1) 동영상 있음	보드나라
로컬 친구 같은 호텔, OMO5 구마모토 (2)	트래비

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

공유하기

공감/비공감