AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장 : 다나와 DPG는 내맘을 디피지

Detecting AI-Generated Text in Educational Content
: Leveraging Machine Learning and Explainable AI for Academic Integrity

아랍 아메리칸 대학교(Arab American University)와 콜롬비아 대학교(Columbia University) 연구진이 발표한 최근 연구에 따르면, AI가 생성한 텍스트를 높은 정확도로 탐지할 수 있는 새로운 머신러닝 모델이 개발됐다.

AI 생성 텍스트 탐지의 새로운 전환점

연구팀은 사이버보안 분야의 텍스트 1,000개를 분석 대상으로 삼았다. 이중 500개는 인간이 작성했고, 나머지 500개는 챗GPT가 생성했다. 'CyberHumanAI'라고 명명된 이 데이터셋을 기반으로 다양한 머신러닝과 딥러닝 알고리즘을 테스트한 결과, XGBoost 알고리즘이 83%의 정확도를, 랜덤 포레스트(Random Forest) 알고리즘이 81%의 정확도를 기록했다.

AI와 인간의 글쓰기 특성 차이 발견

연구진은 설명 가능한 AI(XAI) 기술인 LIME을 활용해 AI와 인간의 글쓰기 패턴을 심층 분석했다.

분석 결과, 인간이 작성한 텍스트에서는 'security'가 420회(1.71%), 'use'가 312회(1.27%), 'system'이 264회(1.07%), 'computer'가 251회(1.02%), 'information'이 206회(0.84%) 빈도로 사용됐다. 반면 AI 생성 텍스트에서는 'security' 411회(1.52%), 'system' 261회(0.97%), 'computer' 233회(0.86%), 'within' 220회(0.81%), 'datum' 183회(0.68%) 순으로 나타났다.

특히 주목할 만한 점은 단어 선택의 경향성이다. 인간이 작성한 텍스트에서는 'allow', 'use', 'virus', 'people'과 같이 실용적이고 행동 중심적인 용어가 자주 등장했다. 반면 AI는 'realm', 'employ', 'serve', 'establish'와 같은 추상적이고 형식적인 용어를 선호했다.

이러한 차이는 TF-IDF(Term Frequency-Inverse Document Frequency) 분석에서도 확인됐는데, 인간 텍스트에서는 'use'와 'computer'가 각각 가중치 16과 14를 기록한 반면, AI 텍스트에서는 'datum'과 'authentication'이 각각 11에 가까운 가중치를 보였다.

기존 AI 탐지 도구와의 성능 비교

연구팀은 600개의 새로운 관측 데이터를 활용해 자체 개발 모델과 GPTZero의 성능을 비교했다. 데이터는 순수 AI 텍스트 200개, 혼합 텍스트 200개(AI 텍스트 비율 1-99%), 순수 인간 텍스트 200개로 구성됐다. 이 중 400개는 훈련 데이터로, 200개는 테스트 데이터로 사용됐다.

테스트 결과, GPTZero는 200개의 관측치 중 32개를 분류하지 못했으며, 분류에 성공한 케이스에서도 48.5%의 정확도를 보였다. 구체적으로 살펴보면, GPTZero는 혼합 텍스트의 경우 76개를 정확히 분류하며 좋은 성능을 보였으나, 순수 AI 텍스트는 단 3개만을, 순수 인간 텍스트는 18개만을 정확히 분류했다. 특히 56개의 순수 AI 텍스트와 15개의 순수 인간 텍스트를 혼합 텍스트로 잘못 분류하는 문제를 보였다.

반면 연구팀이 개발한 XGBoost 모델은 77.5%의 정확도를 기록했으며, 미분류 케이스도 없었다. 이 모델은 순수 AI 텍스트 66개 중 48개를 정확히 분류했고, 혼합 텍스트와 순수 인간 텍스트에서도 각각 55개와 52개를 정확히 분류했다. 특히 GPTZero와 달리, 순수 인간 텍스트 67개 중 52개를 정확히 판별하며 균형 잡힌 성능을 보여주었다.

교육 현장에서의 활용 가능성

이번 연구 결과는 교육계에 중요한 의미를 갖는다. AI 생성 콘텐츠가 교육 현장에서 증가하는 상황에서, 이 기술은 학생들의 과제와 논문의 진실성을 검증하는 도구로 활용될 수 있다. 연구진은 특히 학습 결과물의 평가, 디지털 제출물 검증, AI 활용 학습 환경에서의 학습 성과 보호 등에 이 기술이 기여할 수 있을 것으로 전망했다.

이번 연구는 특정 분야에 맞춤화된 AI 시스템이 GPTZero와 같은 범용 AI 시스템보다 더 우수한 성능을 발휘할 수 있다는 점을 입증했다는 데 의의가 있다. 연구진은 이 기술이 학문적 진실성을 유지하면서도 AI 기술의 교육적 활용을 촉진하는 데 도움이 될 것으로 기대하고 있다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

호환·비정품 소모품 정말 괜찮을까?...공기청정기 호환필터의 두 얼굴	IT동아
아반떼의 숨겨진 진실 "2.0 엔진이 더 싸다!" 동영상 있음	오토기어
항공편부터 맛집까지 첫 런던 여행을 위한 작은 안내서	트래비
[끌리는 CAR①] 르노 '트윙고 일렉트릭'... 2000만원대 유럽산 '개구리'	오토헤럴드
[기자수첩] 일론 머스크 "이민자 퇴출, 반대하면 배신자" 100점 이모지	오토헤럴드
[취재] 이제 중국으로 날개 편다. ‘아이온2’ 셩취게임즈 통해 중국 진출 추진	게임동아
한 달 내내 스노우볼링, 소니 디스크 중단 결정 ‘일파만파’	게임메카
타이중에서 만난 로컬 식문화 체험 공간 3	트래비
피지컬 AI 시대, 엣지 플랫폼이 중요한 이유	IT동아
인텔 2분기 실적과 향후 전망, 그리고 최신 뉴스를 정리해드립니다 (1) 동영상 있음	보드나라
커플·아이·대식구를 위한 파타야 가족여행 리조트, 아마리 파타야	트래비
영국인들이 가장 사랑하는 전원 풍경, 코츠월드 (1)	트래비
업스테이지, 전 국민 대상 'MABC 2026' 개최··· 8월부터 전국 순회 교육 시작	IT동아
[르포] "더 작고 강력하게" 다이슨, 모터에 자신 있는 이유···싱가포르 SAM 가보니	IT동아
[모빌리티 인사이트] '사라진 경쟁자' 신형 아반떼가 넘어야 할 진짜 상대	오토헤럴드
[김흥식 칼럼] 獨 3사의 무덤이 된 중국 "희망의 땅에서 절망의 땅으로"	오토헤럴드
中 '자율주행 중' 파란불 퇴출... 일반차, 첨단 이미지 마케팅 수단 악용	오토헤럴드
갤럭시 그래픽카드 국내 사업, 클릭나라 체제로 재편…A/S는 이엠텍이 맡는다 (1)	케이벤치
[순정남] 아무도 안 믿을 게임 속 거짓 선전 TOP 5 (1)	게임메카
클릭나라, GALAX와 손잡고 국내 시장 공략…공식 유통 본격화	미디어픽
[인터뷰] 미래 모빌리티 따라 자동차 튜닝도 진화한다…’한국자동차튜너협회’	IT동아
[주간보안동향] 근거 없이 개인정보 수집한 틱톡·애플, 과징금 철퇴 外 (1)	IT동아
사일런트 힐: 타운폴, 1인칭과 노스탤지어로 엮어낸 공포 (2)	게임메카
고집불통 볼보가 중국 기술을 받아들인 이유 동영상 있음	오토기어
갤럭시 품은 클릭나라, 그래픽카드 유통 강자로 등극 (1)	위클리포스트
중국산 다 틀어막는 트럼프, 이번에는 '휴머노이드 로봇' 수입 차단 (2)	오토헤럴드
지금 국중박에서 놓치면 안 돼요! 태국 명품 239점 총출동 '어메이징 타일랜드: 태국미술명품전' (2)	트래비
[BOOK] 나무가 다독이는 일상 (1)	트래비
호주 케언즈 여행, 9~10월이 황금 시즌인 이유 (3)	트래비
"위성망을 지상망의 연장선으로"…스카일로, 표준 기반 D2D 대중화 목표	IT동아
'오픈웨이트 서한'으로 글로벌 AI 판도 격변··· 독파모는 방파제가 되어줄까 (1)	IT동아
사라진 갤럭시 코리아 대신 지포스 그래픽카드 유통하는 클릭나라, 그런데 A/S는 이엠텍이? (3)	IT동아
젠몬 X 갤럭시 AI 글래스, 이제 스마트폰 꺼내지 마세요 (1) 동영상 있음	AI matters
[기획] 과금 요소 줄이고 소통을 늘린 리니지.. 상반기 모바일과 PC방 '동반 1위'	게임동아
[EV 트렌드] "운전자 없는 물류" 테슬라, 세미 트럭으로 자율주행 제시	오토헤럴드
시원한 바다부터 오싹한 공포까지…휴가에 즐기기 좋은 게임 10선	게임동아
[EV 트렌드] 순수 전기차로 변신하는 '스팅어' 공식 영상에서 왜건 포착 (1)	오토헤럴드
전자식 도어 핸들 '결함'은 아니지만 전원 끊겨도 탈출해야 '정상'	오토헤럴드
진시황이 벌떡 일어날 '디지털 불로장생'...죽음 뒤 나를 대신하는 AI	오토헤럴드
[위클리AI] "경쟁축 다변화" 앤트로픽·오픈AI·구글, 다른 승부수 던졌다	IT동아
[자동차와 法] 신호등은 꺼지고 AI는 틀렸다…교통사고 책임은 누구에게?	IT동아
[겜ㅊㅊ] 성장과 탐험의 재미 모두 잡은 오픈월드 RPG 5선	게임메카
8월에 알아두면 좋은 여행 소식, 폭염을 피해 떠나는 ‘쿨케이션’ 대세 (2)	트래비
서울에서 만나는 여름 물놀이 명소 11 (2)	트래비
컴퓨텍스에서 다시 만난 Ducky, 오랜 타건의 시간을 OK-M KE(Korean Edition)에 담다	케이벤치
배경훈 부총리, 엔비디아 독점 견제로 AMD와 협업 제안··· 'AMD에 국산 NPU 접목한다'	IT동아
[EV 트렌드] 테슬라, 사이버캡에 스타링크 V5 내장 '위성 인터넷 직접 연결' (1)	오토헤럴드
"랜드로버보다 더 길게 탄다"... 현대차 베라크루즈, 폐차할 때까지 30만km (1)	오토헤럴드
'폭염·폭우에도 7말 8초, 어쩔수가 없다' 휴가철 500만대 이동 예상	오토헤럴드
현대차 플레오스 "그냥 안드로이드 오토 쓰면 안되나요" 물었더니... (1)	오토헤럴드
[EV 트렌드] '뒤처지는 위기감' 토요타, 차세대 코롤라 EV 개발 속도	오토헤럴드
부산도 갔던 BMW, 파리는 안간다... 올해 파리 모터쇼 불참 결정 (1)	오토헤럴드
벤츠, 30만대 시장 쫓겨날 판... 미 상원 상무위 '중국 지분 규제법' 승인 (1)	오토헤럴드
[EV 트렌드] 100% 전기차, 내연기관차 수입을 전면 금지한 라오스	오토헤럴드
'실리콘밸리' 현대차그룹, 미래 피지컬 AI 전략 생태계 구축의 핵심 거점	오토헤럴드
BYD 첫 휴머노이드 실물 티저 공개… 테슬라·현대차 불붙은 로봇 전쟁	오토헤럴드
메리어트, 한국은 중화권 성장 모멘텀의 동력…최저가 아닌 ‘최상의 가치’ 선사에 집중 [Interview]	트래비
상반기 인기 IT 제품 한자리에…다나와 상반기 히트브랜드 팝업 성황 (2)	미디어픽
휴가철 가기 좋은 대한민국 여름 섬 10 (1)	트래비
피지컬 AI 강국 도약 선언한 대한민국, 목표 달성하려면 앞서간 국가의 사례들에 주목해야	IT동아
AI 워크플로우 혁신 꿈꾸는 시냅스AI에 시장이 주목한 이유	IT동아
인간과 AI, 화이트 해커 맞대결...보안 패러다임 바꾼 ‘코드게이트 2026’	IT동아
[르포] 차 안이 공연장이 된다…’하만 카랩’에서 접한 '버추얼 베뉴 라이브'	IT동아
"두피는 AI로, 골반은 기구로" 2026 뷰티&헬스케어쇼 가보니	IT동아
"나오면 바로 산다" 아반떼 쿠페 랜더링 한 장에 들썩이는 마니아들 (1)	오토헤럴드
"가족과 바다 여행" 23년간 호흡 보조 장치와 살아온 온유씨의 소원 (1)	오토헤럴드
안토넬리, 스파에서 다시 날았다... 벨기에 GP 우승으로 선두 굳히기	오토헤럴드
GM, EV 올인 전략 수정...향후 5년 제품에 국내 생산 가능한 신차는?	오토헤럴드
[EV 트렌드] '프롤로그' 단종, 혼다 전동화 전략의 서막이 보여 준 종말	오토헤럴드
AMD 어드밴싱 AI 2026 개최, 에이전틱 AI 시대를 위한 차세대 AI 인프라 및 피지컬 AI 포트폴리오 공개	블루프레임
[기획] AI를 쓰면 정말 게임개발 기간이 짧아질까? 앵커노드 사례를 보니..	게임동아
AMD 생태계 합류 넘어 'AI 파트너사'로 발돋움한 국내 기업 3사	IT동아
흑자 전환에도 웃지 못한 '볼보자동차'...판매 줄고 中 부진·수익성 악화	오토헤럴드
대전 DCC 물들인 이터널 리턴의 열기.....그 중심에서 빛난 MSI 모니터	미디어픽
AMD, 2030년까지 제품 로드맵 소개··· '신규 서버랙 매년 낼 것'	IT동아
세레브라스·AMD 헬리오스 서버 도입··· '이기종 컴퓨팅·클라우드 협력도 시동'	IT동아
AMD, 헬리오스 서버렉으로 '풀스택 인프라' 사업에 시동	IT동아
AMD, 어드밴싱 AI 2026서 6세대 에픽 CPU·인스팅트 MI455X 공개	IT동아
[정보/루머] 2027년 1분기부터 출시된다는 인텔 노바 레이크 및 이름조차 공개하지 못하고 혼돈 속으로 빠지는 지포스 RTX 50 슈퍼 등 (1)	다나와
[취재] 스마일게이트·엔픽셀, "이클립스는 이용자의 생활에 맞춰주는 MMORPG"	게임동아
[취재] “MMORPG의 재미는 살리고 부담은 줄였다” 스마일게이트 신작 ‘이클립스’ 9월 출격	게임동아
삼성전자 '갤럭시 Z 플립 8' 공개… 워치·인텔리전트 아이웨어로 AI 모바일 생태계 확장	IT동아
“10:9와 4:3” 두 가지 화면비로 폴더블폰 대중화 노리는 삼성 갤럭시 Z 폴드 8 시리즈 (2)	IT동아
FSD는 꼭 필요한가? 중국산 FSD의 위험 요소는? (1) 동영상 있음	오토기어
'K-팝 흥행 효과' 번개장터, 글로벌 비즈니스에 속도 내는 이유	IT동아
메모리/SSD 반도체 대란 이후 한국 조립 PC 유통 시장은 어떻게 변할 것인가? 동영상 있음	보드나라
결제만 하던 삼성월렛(삼성페이), 이젠 신분증까지 넣자 (1)	IT동아
에어컨 대신 숲바람, 서울둘레길 여름 산책 코스 5선	트래비
마닐라&세부, 더 깊이 여행하는 법	트래비
대만 타이중에서 발견한 친환경 문화공간 4	트래비
애스턴마틴, 첫 군용차 '드레드노트' 공개... 007 제임스 본드에 딱이네	오토헤럴드
모두가 'NO'라고 외치는 '디젤 파워트레인' 이 브랜드는 끝까지 간다	오토헤럴드
렉스턴 후속 모델이 "아리랑?" 이거 진심이야? 동영상 있음	오토기어
대책없는 이륜차 주차 단속이 몰고 올 자동차 주차 대란 \| 도로교통법 시행령 일부개정령안 입법예고 동영상 있음	포켓매거진
"국산게임 역사는 화려한데, 유산은 보존되지 못하고 있다"	게임메카
[EV 트렌드] "전기차도 결국 M3" BMW, 고성능 전기 세단 이름 확정 (1)	오토헤럴드
현대차그룹, 보스턴다이나믹스 지분 100% 확보... 로보틱스 주도권 잡았다 (1)	오토헤럴드
[기자 수첩] 자율주행 시대를 위협하는 비매너 '승객 규제법' 논의 할 때 (2)	오토헤럴드
[김훈기 칼럼] 월드컵 누빈 아틀라스, 다음 무대는 현대차 생산 라인 (3)	오토헤럴드
떠날까, 집에 머물까…휴가 스타일로 고르는 MSI 노트북 4종	뉴스탭

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장

공유하기

공감/비공감