AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발 : 다나와 DPG는 내맘을 디피지

Leveraging Explainable AI for LLM Text Attribution
: Differentiating Human-Written and Multiple LLMs-Generated Text

텍사스 A&M 대학교 연구팀이 발표한 연구에 따르면, 설명가능한 AI(XAI) 기술을 활용해 챗GPT(ChatGPT)나 클로드(Claude) 등 AI 언어모델이 생성한 텍스트를 높은 정확도로 식별해낼 수 있게 되었다. 연구진은 2023년 11월에 600개의 텍스트 샘플을 수집하여 분석을 진행했다.

AI가 쓴 글과 사람이 쓴 글 98.5% 구분하는 기술 공개

연구진은 인공지능 대형언어모델(LLM)이 생성한 텍스트와 사람이 작성한 텍스트를 구분하는 데 머신러닝과 딥러닝 알고리즘을 활용했다. 랜덤 포레스트(Random Forest)와 순환신경망(RNN) 등의 기술을 적용한 결과, 이진 분류에서 98.5%의 높은 정확도를 달성했다. 이는 기존의 AI 텍스트 탐지 도구인 GPT제로(GPTZero)의 78.3% 정확도를 크게 앞지른 수준이다. 특히 GPT제로가 전체 샘플의 4.2%를 식별하지 못한 반면, 새로운 모델은 모든 테스트 데이터셋을 성공적으로 분석했다.

다양한 AI 도구별 특징 파악하는 데 성공

연구팀은 챗GPT, 라마(LLaMA), 구글 바드(Google Bard), 클로드, 퍼플렉시티(Perplexity) 등 5개 주요 AI 언어모델이 생성한 텍스트를 각각 구분하는 데도 성공했다. 데이터 전처리와 TF-IDF 벡터화 기법을 활용한 다중 분류에서 랜덤 포레스트는 97%의 정확도와 93%의 정밀도, 94%의 재현율을 기록했다. XGBoost는 94%의 정확도와 90%의 정밀도 및 재현율을 보였으며, RNN은 88%의 정확도, 90%의 정밀도, 72%의 재현율을 달성했다.

특히 RNN의 경우 'claude' 클래스에서는 12.5%의 진양성률을 보여 'human', 'chatgpt', 'bard' 클래스와의 구분에 어려움을 겪었고, 'llama' 클래스에서는 62.5%의 진양성률을 보여 'human', 'chatgpt', 'perplexity' 클래스와의 구분에 한계를 드러냈다.

AI별(바드, 챗GPT, 클로드, 라마, 퍼플렉시티) 텍스트 특징 분석

연구진은 LIME(Local Interpretable Model-agnostic Explanations) 기술을 활용해 각 AI 도구별로 독특한 텍스트 생성 패턴을 발견했다.

구글 바드는 '초점', '운송', '투표', '자동차', '범위', '보장', '우려', '시스템' 등 체계적이고 구조적인 요소와 관련된 단어를 자주 사용했다.

챗GPT는 '좋은', '찾기', '수용', '고려', '신뢰', '시민', '도시', '제한', '편지', '사용' 등 질적 평가와 실용적 적용을 혼합한 표현을 특징적으로 사용했다.

클로드는 '도시', '국가', '과도한', '사람들', '감사합니다', '진심으로', '투표', '합리적', '부탁 드립니다' 등 공손하고 시민 참여적인 표현을 주로 사용했다.

라마는 '선거', '사용', '과정', '평등', '제한', '의견', '대안', '또한', '보장', '진심으로' 등 절차적이고 민주적인 요소를 강조하는 단어를 사용했다.

퍼플렉시티는 '감소', '시스템', '압력', '보장', '도움', '운전', '덜', '상원의원', '개인', '친애하는' 등 효율성과 개인적 중요성을 강조하는 단어를 특징적으로 사용했다.

반면 사람이 작성한 텍스트는 '하다', '것', '많은', '말하다', '방법', '얻다', '가다', '사람들', '아니다' 등 일상적인 동사와 대명사를 자주 사용하는 것으로 나타났다. 이러한 단어 사용 패턴은 실제 인간의 자연스러운 의사소통 방식을 반영하는 것으로 분석되었다.

학술적 표절 방지에 새로운 돌파구 될까?

이번 연구 결과는 특히 교육계에서 문제가 되고 있는 AI 표절 문제 해결에 큰 도움이 될 것으로 기대된다. 연구진은 이 기술이 학생들의 과제나 에세이에서 AI 사용 여부를 정확하게 판별할 수 있을 뿐만 아니라, 미묘하게 수정되거나 바꿔 쓴 텍스트도 감지할 수 있다고 밝혔다. 더불어 이 기술은 사이버보안, 학문적 진실성, 비즈니스 운영 등 다양한 분야에서 콘텐츠의 신뢰성을 검증하는 데 활용될 수 있을 것으로 전망된다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

"자살 언급 한 번이면 끝?" 부모-전문가, AI 챗봇 위험 판단 기준 정반대	AI matters
AI가 지진·홍수 예측한다... 인프라 재난 대응 정확도 90% 시대 온다	AI matters
[AI 써봄] 영상 만들어 공유하는 소셜 플랫폼, iOS용 소라	IT동아
[SAO] '검색'에서 '00'으로 변하는 소비자 정보 탐색!? ㅣ 에피소드 8 동영상 있음	AI matters
[SAO] SEO가 진화했다? 검색 AI 최적화, SAO 시대! ㅣ 에피소드 7 (1) 동영상 있음	AI matters
양자컴퓨터, AI 시대에 당신이 준비해야 할 것 \|\| IBM Hans Dekkers 사장 인터뷰 (1) 동영상 있음	조코딩 JoCoding
“로봇을 이해하고 체험하는 공간” 2025 서울AI로봇쇼	IT동아
[AI되니] 메타 레이밴 디스플레이로는 뭘 할 수 있을까요? 동영상 있음	AI matters
래블업 신정규 대표 "앞으로의 10년, 조합 가능한 AI·계량 가능한 AI 시대 열겠다"	IT동아
[위클리AI] 구글 '제미나이 인 크롬'부터 카카오톡에 챗GPT 탑재 (50)	IT동아
[기고] 이레테크 “데이터·AI 전문가로 가는 길, 유행 아닌 본질에서 찾아야”	IT동아
"AI가 당신의 스트레스까지 감지한다"... 인간 행동 패턴 분석하는 HMU 기술 주목	AI matters
그레이엄 버넷 교수 “주의력 상실의 시대, AI로부터 안식처 마련해야” [GPA 2025]	IT동아
델 테크놀로지스 포럼 2025 성료··· "AI 산업·서버 인프라 혁신 한눈에"	IT동아
게임 개발자 7명 중 1명이 AI와 일한다... 하지만 여전히 '사람 손'이 필요한 이유	AI matters
"혼자 고민 마세요" AI 노동법 상담, 가입 없이 24시간 무료로	IT동아
[AI되니] 오픈AI 한국 지사 오픈AI 코리아 출범, 현장에서 들어보니 섬짓했습니다 동영상 있음	AI matters
의사도 AI에게 대체될까? 의사에게 직접 물어봤습니다 \|\| AI시대에서 살아남기, 강성지 대표님 (1) 동영상 있음	조코딩 JoCoding
오픈AI 코리아 공식 출범…"한국을 AI 허브로" (1)	IT동아
[위클리AI] 챗gpt, 무료 버전 사용자도 프리미엄 기능 제공 외 (1)	IT동아
궤도 '인공지능의 과학'과 AGI 시대 예측하기 \| 조코딩의 팟캐스트 #16 동영상 있음	조코딩 JoCoding
[SAO] AI 뉴스 검색 시대, 마케터가 해야 할 것 ㅣ 에피소드 5 동영상 있음	AI matters
특이점이 온다? 구글 딥마인드 리드에게 구글 AI의 미래에 대해 물어봤습니다 동영상 있음	조코딩 JoCoding
AI, 바이브코딩에서 성과 뻥튀기·문제 은폐한다… 실험서 드러난 속임수 패턴	AI matters
[SAO] AI 시대 마케팅 키워드는 끝났다 (1) 동영상 있음	AI matters
AI 눈에는 스위스가 천국, 남수단이 지옥? 똑같은 데이터, 다른 평가... AI 속 숨겨진 국가 차별	AI matters
아직도 챗GPT만 쓴다고? 직장인들이 업무에 쓰는 툴 뭔가 봤더니	AI matters
"왜 내 쿠팡 광고는 전부 야한 걸까?" 소셜미디어 AI 추천 이유 설명해 주는 시스템 등장 (3)	AI matters
MS 조사 개발자 AI 활용 실태... 개발자 90% 'AI 덕분에 일 더 잘해', 일자리 걱정은 10%만	AI matters
약 처방 개인화 시대 온다... DNA 분석해서 약 처방하는 AI, 정확도 90% 돌파 (3)	AI matters
알파고 vs 이세돌 대결 이후 바둑계 이야기와 AI 시대 살아남는 방법 \| 조코딩의 팟캐스트 #15 동영상 있음	조코딩 JoCoding
[AI되니] 디지털 쌍둥이 AI 등장, 우리는 전뇌화될까요? #aimatters #ai매터스 #이종철 동영상 있음	AI matters
중국 휴머노이드 로봇 축구 대회 개초/ 25년 7월 첫째 주 [주간 AI 뉴스] #aimatters #ai매터스 #ai뉴스 동영상 있음	AI matters
아시아 최초 구글에 회사 매각한 IT 리빙 레전드의 AI 시대 생존 방법 \| 조코딩의 팟캐스트 #14 (1) 동영상 있음	조코딩 JoCoding
24년 하드웨어 전문기자가 바라는 새정부의 소버린 AI 정책의 방향, 칩부터 모델링 산업융합까지 우리 것으로 동영상 있음	보드나라
클라우드를 떠나 내 PC로! 생성형 AI의 진짜 무대는 로컬이다! (53)	다나와
AI PC 시대를 준비하는 인텔 코어 울트라 프로세서의 자세 (1)	브레인박스
연초록 물결, 가파도 청보리 캠핑 (5)	트래비
“증명사진 위조 여부 판별” 생성 AI 딥페이크 탐지 서비스 샌즈랩 ‘페이크체크 2.0’ (3)	IT동아
딥 리서치에 대한 모든 것: 경쟁 지형도부터 모델 별 장단점, 가격 비교까지 (2)	AI matters
AI 시대를 맞이하는 새로운 스토리지 패러다임, 컴퓨텍스 2025 씨게이트 부스 (2)	브레인박스
PC업계가 게이밍 마케팅 꿀을 그만 빨고 새로운 메시지를 내놓아야 하는 이유 동영상 있음	보드나라
GAME CHANGER. 지포스 RTX 50 시리즈 노트북 (10)	다나와
프롬프트 하나로 인간을 뛰어넘다…인공지능의 진화 (4)	과학향기
[생성 AI 길라잡이] '인공지능으로 더 멋진 문서를 만든다' 캔바 비주얼 스위트 2.0	IT동아
[생성 AI 길라잡이] 해커인 척 LLM 취약점 찾아낸다, AI 레드팀 (1)	IT동아
[생성 AI 길라잡이] GPT-4o 이미지 생성은 왜 새삼스레 주목받는가? (3)	IT동아
ChatGPT부터 Gemini까지, 일반 사용자용 LLM AI 가격과 특징 비교 (8)	다나와
AI 챗봇, 쓰면 쓸수록 불안감 줄어든다...대학생 사용 패턴 연구 결과	AI matters
기업 경쟁력의 새 기준 'AI 신뢰도'...액센추어 2025년 AI 시대 전망 보고서 발표	AI matters
기업 경쟁력의 새 기준 'AI 신뢰도'...액센추어 2025년 AI 시대 전망 보고서 발표	AI matters
[CES 2025] 액센추어, CES 2025서 AI 리파이너리 플랫폼 공개..."기업별 맞춤형 AI 에이전트 솔루션 제공"	AI matters
당신의 직업은 안전한가요? AI가 바꾸는 2025년 일자리 지도 (1)	AI matters
[CES 2025] 현대차-삼성전자, '스마트싱스' 연동한 차량-IT 융합 생태계 공개 (1)	AI matters
매킨지가 전망하는 2025년 뷰티 산업의 AI 혁신	AI matters
초급 개발자 5명 대신 고급 개발자 1명?...생성형 AI가 바꾼 소프트웨어 개발자 채용시장 (1)	AI matters
금융권 AI 도입률 70% 육박...효율성↑ 비용↓ '두 마리 토끼' 잡는다 (1)	AI matters
AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장	AI matters
AI 매년 10배씩 진화하는데 인류는 준비되어 있나? ...노동 자동화에 따른 단계별 대응 전략 (1)	AI matters
AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발 (1)	AI matters
링크드인 선정 2025년 유망직종 TOP2는 AI 엔지니어·AI컨설턴트 (1)	AI matters
[CES 2025] 델타항공, 100주년 맞아 AI 여행 서비스 '델타 콘시어지' 공개…AI가 짐 챙기고, 게이트도 안내 (4)	AI matters
[CES 2025] 아마존, AI·차량 기술 대거 공개…AI비서가 운전하고 스마트홈이 화재 감시하는 미래 일상 (4)	AI matters
[CES 2025] 파나소닉의 AI 미래전략 '파나소닉 고' 공개...앤트로픽과 손잡고 웰니스 시장 공략 (3)	AI matters
프롬프트 최적화가 왜 중요한가? AI 활용의 실전 사례들	AI matters
월마트·EA·레노보가 증명한 생성형 AI의 힘...75%가 도입, 100배 생산성 향상까지 (4)	AI matters
한국 기업, CES 2025서 최고혁신상 7개 수상...기술 강국의 위상 과시 (4)	AI matters
AI로 우울증·불안장애 진단한다... AI 진단 정확도 90% 돌파 (4)	AI matters
AI가 쓴 글과 사람이 쓴 글은 정말 다를까? 과학적 분석으로 밝혀낸 실체 (2)	AI matters
AI가 가르치는 VR 나폴리 피자 만들기, 학습 효과 64% 높였다… 문화유산 교육의 새 지평 (2)	AI matters
AI로 돈을 더 잘 벌 수 있을까? 금융사들이 택한 미래 전략 (2)	AI matters
"7만건 민원도 하루 만에 처리"…정부·공공기관이 AI로 확 바뀐다 (10)	AI matters
챗봇부터 생체인식까지...2025년 금융권 AI 도입 로드맵 (2)	AI matters
구글, 2025년에는 제미나이 5억명 유저 목표...챗GPT 독주 막는다 (10)	AI matters
AI가 만든 뉴스도 감정을 움직인다...긍정적 뉴스 프레임이 청취자 불안감 45% 줄여 (1)	AI matters
모션 캡처가 필요 없다! 걷고, 앉고, 기타 치고...AI가 스스로 배우는 자연스러운 동작 생성 기술 (3)	AI matters
구글은 하는데 전통기업은 왜 못할까? TMT 산업의 AI 도입 실태와 전망 (2)	AI matters
AI 세대 격차 우려...18-24세는 72% 사용, 65세 이상은 31%에 그쳐 (5)	AI matters
생성형 AI의 경제적 가치 중 75%의 가치는 단 4개 분야에서 나온다	AI matters
AI 예산의 0.41%, 이 작은 투자가 세상을 바꾸는 이유… 기술이 만든 놀라운 혁신 사례들	AI matters
“내 교육이 쓸모없어졌다”...AI와 협업하는 과학자들의 현실 고백 (1)	AI matters
AI로 고객 서비스를 혁신하는 기업들, "도입 비용 대비 가치 있다" 71% 동의 (1)	AI matters
ChatGPT 등장 1년...금융권 AI 도입 70% 육박, 생산성 2배 증가 vs 일자리 양극화 우려	AI matters
"AI가 코딩도 척척" 신입 개발자 생산성 67% 높였다 ...시니어보다 주니어 개발자에게 더 큰 효과 (1)	AI matters
AI가 물가를 잡는다? 임금은 오르고 물가는 안정될까... BIS가 전망한 AI 시대 10년 경제 전망	AI matters
"CFO인 줄 알았는데..."...AI 딥페이크로 25억 날린 글로벌 기업의 경고 (1)	AI matters
AI로 실력 쌓는 마케터들...86%가 하루 1시간 이상 창의적 업무시간 확보	AI matters
불만족 고객을 충성 고객으로: AI가 만드는 CX의 미래	AI matters
2025년을 이끌 5가지 기술 트렌드: 글로번트 트랜드 전망 보고서 (2)	AI matters
[생성 AI 길라잡이] 더 똑똑한 “헤이 구글”, 구글 ‘제미나이(Gemini)’ 앱 (2)	IT동아
'회의록 작성부터 이메일 교정까지'...AI가 바꾸는 장애인 근무 환경	AI matters
디지털 전환시대, AI 도입을 위한 고객 신뢰 확보의 모든 것 (1)	AI matters
NVIDIA가 예측하는 AI 기술 전망 “2025년은 에이전틱 AI와 휴머노이드의 시대” (2)	AI matters
AI가 바꾸는 소비자 산업의 미래, 기업들의 도입 장벽과 혁신 사례 총정리	AI matters
AI가 바꾸는 소비자 산업의 미래, 기업들의 도입 장벽과 혁신 사례 총정리	AI matters
AI로 공부하니 학습 시간 줄고 성적은 오른다... 대학생 83% "학습 효과 체감" (2)	AI matters
생성형 AI, 소비자 만족도 '껑충'...데이터 보안·신뢰도 숙제 남아 (2)	AI matters
AI 도입 기업 87%, 하지만 절반 이상은 윤리기준 없이 운영한다 (2)	AI matters
[생성 AI 길라잡이] 생성 AI로 업무 효율 높이는 기업들 (1)	IT동아
[생성 AI 길라잡이] 텍스트만 넣으면 영상, 음성, 자막까지 완성 ‘브루’ (1)	IT동아

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글, 98.5% 정확도로 구분한다...새로운 탐지 기술 개발

공유하기

공감/비공감