AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장 : 다나와 DPG는 내맘을 디피지

Detecting AI-Generated Text in Educational Content
: Leveraging Machine Learning and Explainable AI for Academic Integrity

아랍 아메리칸 대학교(Arab American University)와 콜롬비아 대학교(Columbia University) 연구진이 발표한 최근 연구에 따르면, AI가 생성한 텍스트를 높은 정확도로 탐지할 수 있는 새로운 머신러닝 모델이 개발됐다.

AI 생성 텍스트 탐지의 새로운 전환점

연구팀은 사이버보안 분야의 텍스트 1,000개를 분석 대상으로 삼았다. 이중 500개는 인간이 작성했고, 나머지 500개는 챗GPT가 생성했다. 'CyberHumanAI'라고 명명된 이 데이터셋을 기반으로 다양한 머신러닝과 딥러닝 알고리즘을 테스트한 결과, XGBoost 알고리즘이 83%의 정확도를, 랜덤 포레스트(Random Forest) 알고리즘이 81%의 정확도를 기록했다.

AI와 인간의 글쓰기 특성 차이 발견

연구진은 설명 가능한 AI(XAI) 기술인 LIME을 활용해 AI와 인간의 글쓰기 패턴을 심층 분석했다.

분석 결과, 인간이 작성한 텍스트에서는 'security'가 420회(1.71%), 'use'가 312회(1.27%), 'system'이 264회(1.07%), 'computer'가 251회(1.02%), 'information'이 206회(0.84%) 빈도로 사용됐다. 반면 AI 생성 텍스트에서는 'security' 411회(1.52%), 'system' 261회(0.97%), 'computer' 233회(0.86%), 'within' 220회(0.81%), 'datum' 183회(0.68%) 순으로 나타났다.

특히 주목할 만한 점은 단어 선택의 경향성이다. 인간이 작성한 텍스트에서는 'allow', 'use', 'virus', 'people'과 같이 실용적이고 행동 중심적인 용어가 자주 등장했다. 반면 AI는 'realm', 'employ', 'serve', 'establish'와 같은 추상적이고 형식적인 용어를 선호했다.

이러한 차이는 TF-IDF(Term Frequency-Inverse Document Frequency) 분석에서도 확인됐는데, 인간 텍스트에서는 'use'와 'computer'가 각각 가중치 16과 14를 기록한 반면, AI 텍스트에서는 'datum'과 'authentication'이 각각 11에 가까운 가중치를 보였다.

기존 AI 탐지 도구와의 성능 비교

연구팀은 600개의 새로운 관측 데이터를 활용해 자체 개발 모델과 GPTZero의 성능을 비교했다. 데이터는 순수 AI 텍스트 200개, 혼합 텍스트 200개(AI 텍스트 비율 1-99%), 순수 인간 텍스트 200개로 구성됐다. 이 중 400개는 훈련 데이터로, 200개는 테스트 데이터로 사용됐다.

테스트 결과, GPTZero는 200개의 관측치 중 32개를 분류하지 못했으며, 분류에 성공한 케이스에서도 48.5%의 정확도를 보였다. 구체적으로 살펴보면, GPTZero는 혼합 텍스트의 경우 76개를 정확히 분류하며 좋은 성능을 보였으나, 순수 AI 텍스트는 단 3개만을, 순수 인간 텍스트는 18개만을 정확히 분류했다. 특히 56개의 순수 AI 텍스트와 15개의 순수 인간 텍스트를 혼합 텍스트로 잘못 분류하는 문제를 보였다.

반면 연구팀이 개발한 XGBoost 모델은 77.5%의 정확도를 기록했으며, 미분류 케이스도 없었다. 이 모델은 순수 AI 텍스트 66개 중 48개를 정확히 분류했고, 혼합 텍스트와 순수 인간 텍스트에서도 각각 55개와 52개를 정확히 분류했다. 특히 GPTZero와 달리, 순수 인간 텍스트 67개 중 52개를 정확히 판별하며 균형 잡힌 성능을 보여주었다.

교육 현장에서의 활용 가능성

이번 연구 결과는 교육계에 중요한 의미를 갖는다. AI 생성 콘텐츠가 교육 현장에서 증가하는 상황에서, 이 기술은 학생들의 과제와 논문의 진실성을 검증하는 도구로 활용될 수 있다. 연구진은 특히 학습 결과물의 평가, 디지털 제출물 검증, AI 활용 학습 환경에서의 학습 성과 보호 등에 이 기술이 기여할 수 있을 것으로 전망했다.

이번 연구는 특정 분야에 맞춤화된 AI 시스템이 GPTZero와 같은 범용 AI 시스템보다 더 우수한 성능을 발휘할 수 있다는 점을 입증했다는 데 의의가 있다. 연구진은 이 기술이 학문적 진실성을 유지하면서도 AI 기술의 교육적 활용을 촉진하는 데 도움이 될 것으로 기대하고 있다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

[모빌리티 넥스트] “진짜 트랜스포머?”…날아서 착지하고 바퀴로 질주 (2)	오토헤럴드
[겜ㅊㅊ] ‘수저린’ 끝내고 해볼 만한 정치 시뮬 4선 (3)	게임메카
연초록 물결, 가파도 청보리 캠핑 (1)	트래비
혹시 가전주부라는 유튜버 아세요...? 동영상 있음	THE EDIT
“이게 진짜 나와요?”…후지 X-E5부터 픽셀10까지, 쏟아지는 신제품 루머 총정리 (4)	다나와
신빙성 낮지만, 기대가 되는 라데온 RX 9080 XT 출시설 및 인공지능 가속기 생산 증가를 위한 RTX 50 감산설 등 (5)	다나와
철원의 멋과 맛을 느낄 수 있는 곳을 찾아라 (4)	트래비
제네시스 마그마 레이싱 'GMR-001 하이퍼카' 르망 24시서 실전 경험 (1)	오토헤럴드
[매장탐방] 가정의 달 특수 없앤 스위치 2의 폭풍전야 (3)	게임메카
닌텐도 스위치 2, 기대되는 성능과 걱정되는 키 카드 (1)	게임메카
Okm 중고차가 쏟아지는 중국 "결국 BYD 폭탄 할인 선언!" 동영상 있음	오토기어
에이서, AI PC 전면에 내세운 컴퓨텍스 2025 전략… Copilot+로 전 라인업 무장 (1)	뉴스탭
“증명사진 위조 여부 판별” 생성 AI 딥페이크 탐지 서비스 샌즈랩 ‘페이크체크 2.0’ (1)	IT동아
크리에이터에게 가장 중요한 건 스토리지, SanDisk CREATOR SERIES 발표회 (1)	브레인박스
크리에이터를 위한 선택, 샌디스크 크리에이터 시리즈 발표 (1)	블루프레임
대만 국내용 메시지에 불과한 엔비디아와 대만의 AI 중심기지 전략 '팀타이완' 전략 동영상 있음	보드나라
로컬 친구 같은 호텔, OMO5 구마모토 (2)	트래비
[BOOK] 로컬 맛집에서 당황하지 않기 (2)	트래비
전설의 100만뷰 아이폰 꿀팁,, 2025년 최신 버전 (1) 동영상 있음	THE EDIT
시즈오카 여행을 계획한다면 반드시 저장해야 할 맛집 5 (2)	트래비
질병코드∙심의∙확률 규제 등, 대선 후보별 게임 공약은?	게임메카
[순정남] 아차! 대선 정치색을 드러낸 롤 챔피언 TOP 5 (1)	게임메카
남들과 다른 겜돌이를 위한 겜디아스 컴퓨텍스 2025 부스를 가다. (2)	브레인박스
새로운 나스 DS1825+, DS 1525+ 및 NVMe 스토리지 솔루션 PAS7700 등을 전시한 시놀로지 컴퓨텍스 2025 부스에 가다. (2)	브레인박스
20년 넘게 부침 없는, 국산 장수 MMORPG 근황 (4)	게임메카
[겜덕연구소] 왕년의 디즈니는 짱이었지! 디즈니 레트로 게임도 짱이었어! (5)	게임동아
딥 리서치에 대한 모든 것: 경쟁 지형도부터 모델 별 장단점, 가격 비교까지 (2)	AI matters
[KOBA 2025] 8K 영상 실시간 편집이 가능한 NAS? 해답은 QNAP (3)	위클리포스트
폭스바겐 "전기차 힘드네!" 다시 내연차에 93조원 쏟아붓겠다! (1) 동영상 있음	오토기어
컴퓨텍스2025에서 커세어-엘가토 부스에서 "스트림덱 에브리웨어" 직접 체험해 보다. (2)	브레인박스
퇴근 후 술자리는 본능일까? 침팬지에게 물어보라 (3)	과학향기
[단독] 구글 CEO 직접 만나 AI 시대 개발자, 교육, 구글 검색의 미래에 대해 물어봤습니다 동영상 있음	조코딩 JoCoding
걷기 좋은 다카마쓰, 도보로 여행하기 좋은 곳 5 (2)	트래비
서서히 침몰하는 포르쉐 (1) 동영상 있음	오토기어
Acer와 함께 하는 발로란트 챔피언스 투어 퍼시픽 스테이지 1 결승전 탐방기 (3)	쿨엔조이
뻔한 호주여행 말고 chill한 호주 여행 5 (4)	트래비
대만 타이베이 중산&완화 호텔 2 (4)	트래비
일본 오타루 1박 2일 추천 여행지 5 (4)	트래비
음악·아이돌과 게임의 결합, 소니 긴자 파크 展 탐방기 (2)	게임메카
[컴퓨텍스 2025] 유럽을 넘어 아시아로...게이밍PC 시장의 강자 '쿠거' (4)	미디어픽
[컴퓨텍스 2025] 여기가 바로 쿨러 맛집 '아틱' (2)	미디어픽
[컴퓨텍스 2025] 탄탄한 기본기와 차별화된 디자인 '비콰이어트' (2)	미디어픽
[컴퓨텍스 2025] 개성 넘치는 디자인으로 시선 집중 '1STPLAYER' (2)	미디어픽
[컴퓨텍스 2025] 감성 게이밍 기어의 정점 '겜디아스' (2)	미디어픽
中 진출 앞둔 님블뉴런 “이터널 리턴 글로벌 IP 만든다” (1)	게임메카
[AI야 소녀를 그려줘] 미스터 프레퍼, 핵 벙커를 짓는 소녀 (1)	게임메카
코카콜라와 펩시, 치열했던 100년 전쟁의 끝은? [라이벌 열전] (27)	다나와
‘메모리만 증설’한 지포스 RTX 5080 슈퍼 사양 유출 및 인텔 아크 B770 ‘2025년 4분기’ 출시설 등 (19)	다나와
추위보다 고온에 약한 자동차, 폭염 오기전 반드시 살펴봐야 할 목록 (2)	오토헤럴드
애플, 판을 다시 짠다! OS부터 디자인까지 대대적 변화 예고...요즘 뜨거운 IT 루머 총정리 (5)	다나와
AI 때문에 국산차 미래는 없다! "깡통만 잘 만들면 뭐하나?" 과연 진실은? (1) 동영상 있음	오토기어
조텍, COMPUTEX 2025에서 GPU 서버 및 DEEPX와 협력으로 AI 혁신 선도 (1)	뉴스탭
조텍, COMPUTEX 2025서 차세대 핸드헬드 PC 'ZONE White Edition' 프로토타입 공개 (1)	뉴스탭
조텍, 컴퓨텍스 2025서 초소형 데스크톱급 미니PC 전격 공개 (3)	뉴스탭
MSI, COMPUTEX 2025에서 차세대 노트북 비전 공개…AI·예술·게이밍을 아우른 종합 전시 선보여 (1)	뉴스탭
다크플래쉬, 컴퓨텍스 2025서 '우주 탐사' 테마로 신제품 전 라인업 공개 (2)	뉴스탭
[컴퓨텍스 2025] 여기가 바로 쿨러 맛집 '아틱' (4)	미디어픽
[컴퓨텍스 2025] PC 업계의 트렌드를 이끌다 '리안리' (3)	미디어픽
[컴퓨텍스 2025] 혁신에 혁신을 더하다 'HYTE' (3)	미디어픽
[컴퓨텍스 2025] 메모리계의 엄친아 '팀그룹' 성능부터 디자인까지 모두 만족 (4)	미디어픽
[컴퓨텍스 2025] 우주 여행을 떠나보자...독창적인 케이스 / 주변기기 선보인 '다크플래쉬' (2)	미디어픽
[컴퓨텍스 2025] 조텍이 만들면 다르다...혁신적인 VGA / 헨드핼드PC 선보인 'ZOTAC' (1)	미디어픽
[컴퓨텍스 2025] 팔릿 x 이엠텍, 왜 지금, 왜 PALIT인가? 에 답하다. (4)	위클리포스트
[컴퓨텍스 2025] 애즈락(ASRock)의 투(鬪)트랙 “게임의 한계를 넘고, AI 상상을 구현하다” (1)	위클리포스트
[컴퓨텍스 2025] 커세어, DIY 키보드 시장에 던지는 실질적 제안 (1)	위클리포스트
[컴퓨텍스 2025] 숫자 대신 설계로 증명한 커세어 ‘RTX 50 세대’ 청사진 공개 (1)	위클리포스트
[컴퓨텍스 2025] 해븐(HAVN) “소음을 줄이면, 존재감은 커진다” (3)	위클리포스트
[컴퓨텍스 2025] 히트 메이커 뉴젠씨앤티 × 수퍼플라워, 세계 최초 3300와트 고출력 파워 공개 (2)	위클리포스트
[컴퓨텍스 2025] 산업용 섀시 맛집 실버스톤 “LED 대신 공기 경로를 이야기할 때” (1)	위클리포스트
[컴퓨텍스 2025] 한미마이크로닉스, 기술과 감성 사이 한국적인 미를 탐했다 (2)	위클리포스트
[컴퓨텍스 2025] 프라이빗 룸에서 마주한 GAMDIAS (2)	위클리포스트
[컴퓨텍스 2025] 1STPLAYER, ‘타협 없는 가성비’로 LCD 쿨러·케이스 완성 (2)	위클리포스트
[컴퓨텍스 2025] 시소닉, Opti-tech 플랫폼으로 3200 W 고출력 PSU 시대 개막 (2)	위클리포스트
[컴퓨텍스 2025] 기가바이트의 리딩 엣지, 방향은 사용자 체감 강화한 AI 종합 솔루션 (2)	위클리포스트
[컴퓨텍스 2025] 커세어, 사용자의 취향에 날개를 달다 (3)	위클리포스트
[컴퓨텍스 2025] 애즈락, 스펙을 넘어 AI 경험의 혁신으로 (1)	위클리포스트
[컴퓨텍스 2025] QNAP Jack Yang VP에게 듣다. '기술의 방향, 아시아 시장 전략, 그리고 데이터의 미래' (1)	위클리포스트
박규승, 도요타 가주 레이싱 첫 승…슈퍼레이스 6000 클래스 새 역사	오토헤럴드
쏠라이트 인디고 레이싱 박준성, 2025 TCR 유럽 시즌 첫 포디엄 달성	오토헤럴드
[컴퓨텍스 2025] 조텍, 그래픽 카드 명가를 넘어 프리미엄 브랜드를 향한다 (1)	위클리포스트
[컴퓨텍스 2025] 이엠텍 사파이어, 성능이라는 본질에 집중하다 (1)	위클리포스트
[컴퓨텍스 2025] AI 시대를 선도할 씨게이트의 데이터 스토리지 전략은? (1)	위클리포스트
[QNAP Tech Summit 2025] “진화한 고가용성·AI 스토리지” 차세대 NAS 비전 제시	위클리포스트
[컴퓨텍스 2025] 에이서 '혁신과 가성비를 모두 잡다' 웨인 지사장, 김홍철 부장 인터뷰	위클리포스트
[컴퓨텍스 2025] 브랜드 출범 10주년 다크플래쉬, 황인성 부장에게 들어본 성장 동력 (1)	위클리포스트
[컴퓨텍스 2025] 만리 패트릭 맨 CEO 인터뷰 "대원씨티에스 손잡고 한국 그래픽카드 시장에 도전장"	위클리포스트
[컴퓨텍스 2025] 조텍, 제품 본질과 사용자 신뢰 중심의 전략 강화	위클리포스트
AI 를 넘어선 노트북, 메인보드, 그래픽카드 들을 전시한 기가바이트 컴퓨텍스 2025 VIP 부스에 가다. (1)	브레인박스
In-Side SK하이닉스, Out-Side 한국의 영혼을 에센코어-클레브 컴퓨텍스 2025 부스를 가다. (1)	브레인박스
예전 지포스, 라데온 그래픽카드를 찾는다면, 여기 액슬 컴퓨텍스 2025 부스 (1)	브레인박스
뼈속까지 원조 빨강맛, 컴퓨텍스 2025 사파이어 부스를 가다. (1)	브레인박스
AI 유료로 쓰면 큰일나는 이유;;; 동영상 있음	THE EDIT
파워, 케이스 그리고 세계로 컴퓨터텍스 2025 마이크로닉스-위즈맥스 부스에 가다. (2)	브레인박스
P의 거짓과 스텔라 블레이드는 넘었지만 왜 넥슨의 카잔은 넘지 못했을까 동영상 있음	집마 홀릭TV
한국인 입맛에 딱 맞는 사이판 맛집 5 (2)	트래비
TeamGroup, COMPUTEX 2025서 AI와 게이밍 시대 아우르는 차세대 메모리·스토리지 전격 공개 [컴퓨텍스 2025] (53)	다나와
31년, 하지만 스스로 꾸준하게 진화하고 있는 토탈 컴퓨터 커세어 컴퓨텍스 2025 부스에 가다. (3)	브레인박스
MSI 최신 제품을 직접 체험할 수 있는 절호의 기회, 2025 플레이 엑스포 (4)	노트포럼
애니 기반 타이틀 모았다, 웹게임 포털 G123 한국 상륙 (2)	게임메카
[기자 수첩] "美 2035년 내연기관 금지 무력화"... 국산차에 미칠 영향은 (4)	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장

공유하기

공감/비공감