AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장 : 다나와 DPG는 내맘을 디피지

Detecting AI-Generated Text in Educational Content
: Leveraging Machine Learning and Explainable AI for Academic Integrity

아랍 아메리칸 대학교(Arab American University)와 콜롬비아 대학교(Columbia University) 연구진이 발표한 최근 연구에 따르면, AI가 생성한 텍스트를 높은 정확도로 탐지할 수 있는 새로운 머신러닝 모델이 개발됐다.

AI 생성 텍스트 탐지의 새로운 전환점

연구팀은 사이버보안 분야의 텍스트 1,000개를 분석 대상으로 삼았다. 이중 500개는 인간이 작성했고, 나머지 500개는 챗GPT가 생성했다. 'CyberHumanAI'라고 명명된 이 데이터셋을 기반으로 다양한 머신러닝과 딥러닝 알고리즘을 테스트한 결과, XGBoost 알고리즘이 83%의 정확도를, 랜덤 포레스트(Random Forest) 알고리즘이 81%의 정확도를 기록했다.

AI와 인간의 글쓰기 특성 차이 발견

연구진은 설명 가능한 AI(XAI) 기술인 LIME을 활용해 AI와 인간의 글쓰기 패턴을 심층 분석했다.

분석 결과, 인간이 작성한 텍스트에서는 'security'가 420회(1.71%), 'use'가 312회(1.27%), 'system'이 264회(1.07%), 'computer'가 251회(1.02%), 'information'이 206회(0.84%) 빈도로 사용됐다. 반면 AI 생성 텍스트에서는 'security' 411회(1.52%), 'system' 261회(0.97%), 'computer' 233회(0.86%), 'within' 220회(0.81%), 'datum' 183회(0.68%) 순으로 나타났다.

특히 주목할 만한 점은 단어 선택의 경향성이다. 인간이 작성한 텍스트에서는 'allow', 'use', 'virus', 'people'과 같이 실용적이고 행동 중심적인 용어가 자주 등장했다. 반면 AI는 'realm', 'employ', 'serve', 'establish'와 같은 추상적이고 형식적인 용어를 선호했다.

이러한 차이는 TF-IDF(Term Frequency-Inverse Document Frequency) 분석에서도 확인됐는데, 인간 텍스트에서는 'use'와 'computer'가 각각 가중치 16과 14를 기록한 반면, AI 텍스트에서는 'datum'과 'authentication'이 각각 11에 가까운 가중치를 보였다.

기존 AI 탐지 도구와의 성능 비교

연구팀은 600개의 새로운 관측 데이터를 활용해 자체 개발 모델과 GPTZero의 성능을 비교했다. 데이터는 순수 AI 텍스트 200개, 혼합 텍스트 200개(AI 텍스트 비율 1-99%), 순수 인간 텍스트 200개로 구성됐다. 이 중 400개는 훈련 데이터로, 200개는 테스트 데이터로 사용됐다.

테스트 결과, GPTZero는 200개의 관측치 중 32개를 분류하지 못했으며, 분류에 성공한 케이스에서도 48.5%의 정확도를 보였다. 구체적으로 살펴보면, GPTZero는 혼합 텍스트의 경우 76개를 정확히 분류하며 좋은 성능을 보였으나, 순수 AI 텍스트는 단 3개만을, 순수 인간 텍스트는 18개만을 정확히 분류했다. 특히 56개의 순수 AI 텍스트와 15개의 순수 인간 텍스트를 혼합 텍스트로 잘못 분류하는 문제를 보였다.

반면 연구팀이 개발한 XGBoost 모델은 77.5%의 정확도를 기록했으며, 미분류 케이스도 없었다. 이 모델은 순수 AI 텍스트 66개 중 48개를 정확히 분류했고, 혼합 텍스트와 순수 인간 텍스트에서도 각각 55개와 52개를 정확히 분류했다. 특히 GPTZero와 달리, 순수 인간 텍스트 67개 중 52개를 정확히 판별하며 균형 잡힌 성능을 보여주었다.

교육 현장에서의 활용 가능성

이번 연구 결과는 교육계에 중요한 의미를 갖는다. AI 생성 콘텐츠가 교육 현장에서 증가하는 상황에서, 이 기술은 학생들의 과제와 논문의 진실성을 검증하는 도구로 활용될 수 있다. 연구진은 특히 학습 결과물의 평가, 디지털 제출물 검증, AI 활용 학습 환경에서의 학습 성과 보호 등에 이 기술이 기여할 수 있을 것으로 전망했다.

이번 연구는 특정 분야에 맞춤화된 AI 시스템이 GPTZero와 같은 범용 AI 시스템보다 더 우수한 성능을 발휘할 수 있다는 점을 입증했다는 데 의의가 있다. 연구진은 이 기술이 학문적 진실성을 유지하면서도 AI 기술의 교육적 활용을 촉진하는 데 도움이 될 것으로 기대하고 있다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

[순위분석] 사상 최초로 10위까지 밀려난 서든어택 (2)	게임메카
(가장 쉽게 알려드림) SKT 유출사태, 또 새로운 정황. 꼭 필요한 정보&해결책 싹 정리했습니다! 동영상 있음	주연 ZUYONI
200으로 CPU와 GPU를 배분하시오 9800X3D+9070 XT vs 7800X3D+5070 Ti (2)	기글하드웨어
치즈에 진심인 당신이라면 '스위스 치즈 패스포트' 체크 (1)	트래비
소박한 일본 소도시 골프여행에 맞춤 '고치현' 골프코스 2 (1)	트래비
SKT 해킹 사태에 관한 (아마) 혼자만의 걱정 동영상 있음	UnderKG
"나도 살아야지" 짝짓기 상대를 '독'으로 마비시키는 문어가 있다? (2)	과학향기
[AI야 소녀를 그려줘] 모비노기, 얘네를 제물로 바칩니다 (1)	게임메카
2025 Segotep GM 80PLUS골드 풀모듈러 ATX3.1 시리즈 살펴보기 (1)	쿨엔조이
2025 AONE 시그니처 80PLUS브론즈 풀모듈러 시리즈 살펴보기 (1)	쿨엔조이
[이슈+] 고사양 VGA 성능 200% 뽑아낼 공식 '인텔 울트라 K-SKU 플랫폼' 총정리 (1)	위클리포스트
올 해 취준을 앞둔 디자이너, 영상 제작자를 위한 PC로 어떤 것을 선택하는 것이 좋을까? (1)	브레인박스
[동아 게임 백과사전] “뭐 이런 것까지 나와?” 콜라보의 제왕으로 불리는 게임들 (1)	게임동아
2,400만 명 정보 털린 SKT "유심만 바꿔주면 끝이다?" 동영상 있음	오토기어
이충후 셰프에게 반얀트리 서울 페스타의 새로움을 묻다	트래비
[자동차와 法] 전기차 화재 줄일 기술 살펴보니	IT동아
518년 조선 지식의 보고, 종로 배움의 길 (3)	트래비
베트남 남호이안의 '신상' 리조트 파헤치기 (3)	트래비
섬여행 전문가가 말하는 대한민국 섬 BEST 20 (4)	트래비
벌써 가을 대전 예고?! 스냅드래곤 8 엘리트 2부터 소니 WH-1000XM6까지...IT 신제품 루머 총정리! (3)	다나와
[르포] "보이지 않는 곳에서 2억 불 수주를 향해 땀 흘리고 있는 현대모비스"	오토헤럴드
스마트폰 배터리 수명 확인하려면 이렇게! [이럴땐 이렇게!] (6)	IT동아
나도 프로게이머가 되어보자 '카카오 배틀그라운드 다나와배 대학최강자전' (3)	다나와
'나 배그 좀 하는데' 싶은 학생이라면 주목!! 카카오 배틀그라운드 다나와배 대학최강자전 (8)	다나와
하만, "느끼고 생각하는 자동차"... 미래 커넥티드카 생태계 주도 Ready!	오토헤럴드
GPT-4o 기본 탑재한 HP 비즈니스 제품군, 'AI PC 확산'에 마중물 될까 (1)	IT동아
AMD 라데온 RX 9060 XT 8GB 출시 취소 및 24GB 용량 증설한 아크 B580 출시 예정 등 주요소식 정리 (5)	다나와
[취재] 블루아카, 기찻길 옆 '마스터 시바' 라멘 팝업스토어 오픈 (3)	게임동아
안정화되는 그래픽카드 가격, 인텔 아크 고급형 취소? 그외 PC 시장 1분기 PC 뉴스 해석 (1) 동영상 있음	보드나라
그래픽 카드도 등급이 있습니다. 잘 보고 구입하세요![라인업을 보자] (7)	다나와
[2025 상하이오토쇼] 벤틀리, 컨티넨탈 GT · 플라잉스퍼 아주르 라인업 공개	오토헤럴드
부담되는 UMPC 가격! 렌탈로 써보고 결정해 볼까? (3) 동영상 있음	무적풍화륜
올봄엔 뭘 먹지? 미식 나들이 가기 좋은 서울 호텔 레스토랑 3 (6)	트래비
[CULTURE] 초콜릿 덕후는 놓칠 수 없다 (1)	트래비
당신에게 추천하는 중국 항저우의 뮤지엄&미술관 (1)	트래비
TEAMGROUP HQ 인터뷰 : 2025년 팀그룹의 목표는 게이밍과 AI	쿨엔조이
매출 17만원 식당이 두 달 후 어떻게 변했을까? #극한창업 Ep4 마지막회 동영상 있음	맛상무
[2025 상하이오토쇼] 폭스바겐 대공세, 2027년 30종 신차 출시 (1)	오토헤럴드
[2025 상하이오토쇼] 포르쉐, 70년대 레트로 감성 물씬 '911 스피릿 70' 공개	오토헤럴드
요즘 IT계에 무슨 일이? 삼성부터 소니까지…지금 가장 뜨거운 루머 총정리 (11)	다나와
2025 상하이 모터쇼 개막, 中 전기차 굴기 과시 '월드 프리미어 100대' (1)	오토헤럴드
서울 수도권에서 레트로 애플 제품을 만날 수 있는 유일한 사설 박물관 파주 맥뮤지엄 탐방 동영상 있음	보드나라
AI 이미지 만드는 법 5분 안에 알려드림 (포토샵 AI 꿀팁) (1) 동영상 있음	THE EDIT
한국타이어 후원, 2025 WRC ‘이슬라스 카나리아스 랠리’ 개최...‘풀 타막’ 랠리	오토헤럴드
[무엇이든 물어보살] 인텔 CPU 밸류팩에 대한 A~Z (2)	위클리포스트
메르세데스-벤츠, 럭셔리 밴의 새로운 기준… 전기 밴 ‘비전 V’ 공개 (1)	오토헤럴드
차 한 잔에 중금속이 줄었다? 찻잎의 숨겨진 능력! (3)	과학향기
기나긴 터널을 지난 이엠텍, 대표 자리가 갖는 의미는? (2)	다나와
수입차 월간 베스트셀링카 톱 10에 오른 단 한대의 유럽산 전기차	오토헤럴드
자신에게 맞는 중고차 고를 땐 이렇게! [이럴땐 이렇게!] (2)	IT동아
애로우레이크 리프레시냐, 팬서레이크냐. 그리고 노바레이크와 AMD의 9950X3D까지. 1분기 최신 PC 뉴스 해석 (1) 동영상 있음	보드나라
나의 성격을 보여주는 나의 ‘마시는 습관’은? (4)	마시즘
돈 받고 주는 세계 올해의 차 "소비자 우롱하는 속임수이다?" 동영상 있음	오토기어
[인디言] 몹시 인간적인 추리 군상극 ‘평범한 날: 청하구편’	게임메카
형이 가져온 똥컴 예토전생 후 1000원에 팔립니다? 게이밍PC 천원경매 [형사3편] 동영상 있음	딴트공 말방구 실험실
미친 플스5, 미친 PC, 미친 스위치2... 게이머는 더 이상 도망 갈 곳이 없다 동영상 있음	집마 홀릭TV
'디저트 배'는 진짜였다! 당신 뇌 속의 달콤한 속삭임 (3)	과학향기
당신이 발리 울루와뚜에서 들르면 좋을 편집샵 5 (2)	트래비
강원도 원주에서 찾은 거부할 수 없는 맛집 4 (3)	트래비
현대차그룹 '연비 45%·최고 출력 19%↑'도요타 잡을 게임 체인저 공개	오토헤럴드
[기자 수첩] 스바루가 내린 신형 아웃백 인테리어 결단에 쏟아지는 찬사	오토헤럴드
슈퍼레이스 개막전 토요타 가주 레이싱 6000 클래스 금호 SLM ‘더블 포디엄’	오토헤럴드
[생성 AI 길라잡이] '인공지능으로 더 멋진 문서를 만든다' 캔바 비주얼 스위트 2.0	IT동아
[IT하는법] 스마트폰 속의 민증, '모바일 신분증' 만드는 법 (3)	IT동아
‘또 다른 생태계 교란종 될까?’ 라데온 RX 9070 GRE 사양 유출 및 성능 코어만 제공하는 바틀렛 레이크 프로세서 출시설 등 주요 소식 정리 (9)	다나와
[월간자동차] 25년 3월, 신차 등록 증가세…기아 쏘렌토 5개월 연속 판매 1위 (1)	IT동아
현대차, 더 복잡해진 최강 오프로더 '팰리세이드 XRT Pro' 세계 최초 공개 (1)	오토헤럴드
기아, EV9 나이트폴·K4 해치백 세계 최초 공개… 북미 전기차 시장 공략	오토헤럴드
짝퉁 EGMP라고 분노하던 EV3 "세계 올해의 차 수상!" 동영상 있음	오토기어
[동아게임백과사전] 다 같은 총싸움이 아니다! FPS도 장르가 있다! (3)	게임동아
지금 방콕에서 가장 핫한 레스토랑 4 (4)	트래비
조달용 시피유 대결 'AMD 라이젠7 PRO 7745 vs. 인텔 코어 i5-14세대 14500' (3)	위클리포스트
[기획] 큐냅(QNAP) 한국형 나스 'TS-264-4G-KR ' 출시는 특별하다 (3)	위클리포스트
[인터뷰] "쉬운 나스? 큐냅 한국형 NAS 쓰세요!" 리버네트워크 김진욱 부장	위클리포스트
2025 MSI 파워서플라이 주요 라인업 살펴보기 (4)	쿨엔조이
롤 차기 시즌 신규 모드 '돌격전'은 팀 데스매치 (1)	게임메카
55인치 실내 디스플레이·에어 라이드 서스펜션 탑재…‘더 뉴 에스컬레이드’ 출시	IT동아
AMD에 밀려 어이없게 가성비 넘버원이 된 인텔 CPU 동영상 있음	민티저
차 바꾸고 싶다던 남편의선택! 여보 이게 내가말한 기변이야 ㅋㅋㅋㅋ 내차의 변신은 무죄 동영상 있음	딴트공 말방구 실험실
2만원짜리 고물PC 고쳤더니 게이밍PC됨? 싸펑돌아가는거 실화냐? 수리비6만5천원 (형이사왔다 2부) (1) 동영상 있음	딴트공 말방구 실험실
천안&아산, 가족 모임 하기 좋은 곳 BEST 4 (6)	트래비
차 한 잔 즐기기 좋은 곳, 여유로운 항저우 카페 4 (5)	트래비
[겜덕연구소] 게임 속 종횡무진! 마블 코믹스는 영화가 아니라 게임이 더 재밌다! (3)	게임동아
지포스 RTX 5060 & 5060 Ti 공개! MFG 사용 시 이전 세대보다 성능 2~6배 향상되고 가격은 낮아졌다 (64)	다나와
One UI 8 벌써 유출, 스위치2에서 돌아가는 사이버펑크2077…요즘 IT 루머, 진짜일지도 몰라요 (4)	다나와
[자동차와 法] 첨단 교통단속 기술의 빛과 그림자 (1)	IT동아
[e제품] 애즈락 라데온 RX 9070 XT 타이치ㆍRX 9070 스틸레전드 (2)	위클리포스트
[기자수첩] 꿈이 된 테슬라 완전 자율주행 '하드웨어' 교체 없이 불가능	오토헤럴드
강원도 원주 숨은 맛집&여행지 6 (4)	트래비
항저우 현지인도 줄 서는 맛집 4 (2)	트래비
BYD 블레이드 배터리, 혁신적 기술로 한계 극복... 안전과 원가 경쟁력 뛰어나 (1)	오토헤럴드
"지프가 왜 미국산?" 스텔란티스, 관세 노린 애국 마케팅 벌이다 딱 걸렸다 (1)	오토헤럴드
경량 스포츠카 제조사 ‘로터스’ 77년 역사 장식한 슈퍼카 살펴보니 (4)	IT동아
[생성 AI 길라잡이] 해커인 척 LLM 취약점 찾아낸다, AI 레드팀 (1)	IT동아
PCI-E 와 12V-2x6 단자 혼용되는 지포스 RTX 5060 Ti 및 미국 vs 중국 관세 전쟁에 숟가락 얹은 마이크론 등 주요소식 정리 (11)	다나와
ASUS/MSI/기가바이트 대만제조사에 갑질(?)하는 잘만쿨러 최전성기 그리고 쇠락. 그래픽카드 쿨링 솔루션 2부 [PC흥망사 112] 동영상 있음	보드나라
봄의 해남을 위한 한식 맛집 4 (7)	트래비
누사두아의 해변, 그리고 물리아 발리의 여유 (2)	트래비
지포스에서 라데온으로 환승? 아드레날린 소프트웨어, 이렇게 다르다 (13)	다나와
"에어백도 안 터졌는데..." 유로 NCAP, 중국 車 별 5개 주고도 매서운 지적	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI vs 인간 글쓰기, 83% 정확도로 구분한다...교육계 표절 방지 새 무기 등장

공유하기

공감/비공감