AI가 쓴 글과 사람이 쓴 글은 정말 다를까? 과학적 분석으로 밝혀낸 실체 : 다나와 DPG는 내맘을 디피지

Does a Large Language Model Really Speak in Human-Like Language?

대규모 통계 분석으로 밝혀낸 AI 글쓰기의 한계

서울시립대학교 통계데이터과학과 연구진이 발표한 최신 연구에 따르면, 챗GPT로 대표되는 대형 언어모델(LLM)이 생성한 텍스트는 겉보기에 자연스러워 보이지만 인간의 글쓰기와는 본질적인 차이가 있는 것으로 나타났다. 연구진은 2023년 12월 6일부터 2024년 1월 17일까지 맨해튼 지역 446개 호텔의 3만2천여 개의 숙박 리뷰를 수집했으며, 추가로 CNN 뉴스 기사 8,008개, SQuAD2 문장 9,198개, 그리고 Quora 질문 24,714개를 분석 대상으로 삼았다.

혁신적인 연구 방법론으로 AI 텍스트의 본질에 접근

연구진은 두 가지 핵심 질문에 주목했다. 첫째, 원본 텍스트(O)와 GPT가 이를 바꿔 쓴 버전(G) 간의 잠재적 커뮤니티 구조 차이가 G와 이를 다시 바꿔 쓴 버전(S) 간의 차이와 같은지, 둘째, GPT의 텍스트 다양성을 제어하는 매개변수를 조절할 때 G가 O와 더 유사해지는지를 분석했다.

연구팀은 각 텍스트를 OpenAI의 text-embedding-3-small 모델을 사용해 1536차원의 단위 벡터로 변환했다. 분석을 위해 호텔링의 T-제곱 검정, Nploc 검정, 에너지 검정, 볼 검정 등 4가지 통계적 방법을 사용했으며, 클러스터 수를 2개에서 5개까지 변화시키며 실험을 진행했다. 또한 쿨백-라이블러 발산과 바서스타인 거리 분석을 통해 텍스트 간의 통계적 거리도 측정했다.

GPT의 다양한 설정값 변화에도 여전한 인간 텍스트와의 간극

연구팀은 GPT의 텍스트 생성 다양성을 제어하는 '온도' 매개변수를 0.1에서 1.5까지 다양하게 조절하며 실험을 진행했다. 실제 실험에서 사용된 호텔 리뷰 사례를 보면 흥미로운 차이가 드러난다. 원본 리뷰가 "기본적이고, 깨끗하고 편안한 호텔이다. 단기 숙박으로는 나쁘지 않다. 모든 것과의 접근성이 좋다"였을 때, GPT는 온도 설정에 따라 다음과 같이 다른 텍스트를 생성했다.

낮은 온도(0.1)에서는 "저렴하면서도 깨끗하고 아늑한 숙소를 제공하는 호텔이다. 빠른 숙박에 적합하다. 편리한 위치 덕분에 모든 편의시설에 쉽게 접근할 수 있다"와 같이 원본에 충실한 표현을 생성했다. 중간 온도(0.7)에서는 "아늑하고 잘 관리된 호텔로 모든 필수 시설을 갖추고 있다. 짧은 휴가에 딱 좋다. 위치의 편리함이 큰 장점이다"처럼 좀 더 자연스러운 변형이 이루어졌다. 높은 온도(1.5)에서는 "이 부티크 호텔은 기대 이상이었다. 객실은 아늑했고 직원들도 친절했다. 도시를 둘러보기에 완벽한 위치였다. 짧은 여행을 위한 훌륭한 선택이다"와 같이 원본과는 상당히 다른, 더 창의적이고 열정적인 표현이 생성됐다.

이러한 실험 결과는 온도 설정이 높아질수록 AI가 더 자유롭고 창의적인 표현을 생성하지만, 동시에 원본의 의도나 톤에서 더 멀어질 수 있음을 보여준다. 흥미롭게도 SQuAD2 데이터셋에서는 온도 매개변수가 증가할수록 인간 텍스트와의 유사성이 증가하는 특이한 패턴이 발견됐다. CNN과 SQuAD2 데이터의 경우, 한 문장으로 구성된 특정 문체를 가진 텍스트라서 일부 예외적인 결과가 나타났다.

텍스트 변환 과정에서 발견된 주목할 만한 차이

연구진은 텍스트 변환 과정에서 중요한 발견을 했다. 두 번째 패러프레이징(G에서 S로의 변환)이 첫 번째 패러프레이징(O에서 G로의 변환)보다 더 큰 변화를 보였다는 것이다. 이는 LLM이 텍스트를 변환할 때마다 원본과의 차이가 점점 더 커질 수 있음을 시사한다.

연구의 한계와 자연어 처리 분야의 새로운 과제

연구진은 이번 연구가 가진 한계도 명확히 했다. 제안된 테스트 방법이 간접적인 증거만을 포착할 수 있어 탐지력과 적용 가능성이 제한될 수 있으며, 대응된 데이터 설정에서만 적용 가능하다는 제약이 있다고 설명했다. 또한 LLM의 성능을 정량적으로 평가할 수 있는 통계적 방법론이 부족한 현실을 지적하며, 이는 LLM이 최근에 등장했기 때문이라고 설명했다. 연구진은 이번 연구가 제시한 방법론이 향후 LLM 평가를 위한 새로운 기준이 될 수 있을 것으로 기대했다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

DDR4용 CPU 구하기 더 힘들어진다? 인텔이 14세대 CPU 공급을 줄이는 이유는? 동영상 있음	보드나라
[정보/루머] 스트릭스 헤일로 잡을 노바 레이크-AX 떡밥 및 RTX 5090 Tiㆍ타이탄 블랙웰 준비설 등	다나와
[김훈기 칼럼] "돈 많은 시장도 멈췄다" 중동발 자동차 산업 경고 (1)	오토헤럴드
[모빌리티 인사이트] '리스크가 된 속도전' BYD로 드러난 중국의 한계 (1)	오토헤럴드
[EV 트렌드] '이상 징후 시작' 테슬라 1분기 판매 시장 기대치 하회	오토헤럴드
AI가 사람 움직임을 '언어'처럼 이해하게 됐다	AI matters
"의자를 책상 앞에"라는 말만으로 AI가 3D 공간을 완벽하게 재배치한다	AI matters
AI에게 '자신 없으면 나중에 써'라고 했더니, 속도가 10배 빨라졌다	AI matters
[체험기] 윙 건담 제로 3돌 감사합니다! SD 건담 지 제네레이션 이터널 1주년 달려보니	게임동아
[EV 트렌드] '모델 S·X 단종 공식화' 테슬라 플래그십 역사 마침표	오토헤럴드
탐험 없이 배틀에만 집중한 신작, 포켓몬 챔피언스	게임메카
[매장탐방] 스위치 2 품절 일으킨 ‘포코피아’ 열풍	게임메카
포드 블루크루즈 "섣부른 기술에 운전자 과신이 치명적 사고 초래"	오토헤럴드
BMW iX3, 2026 월드카 어워즈 '왕중왕' 등극... 전기차 부문까지 2관왕	오토헤럴드
현대차, '뼛속까지 미국산' 정통 프레임 보디 픽업 '볼더 콘셉트' 공개 (1)	오토헤럴드
'셀토스·EV3 동시 출격' 기아, 뉴욕서 북미 전략 모델 대거 공개	오토헤럴드
오픈월드 액션 어드벤처 속으로!, 펄어비스(Pearlabyss) 붉은사막(Crimson Desert)	블루프레임
이거 보고 빠지면 너도 일주일 밤 샌다... 붉은사막 종결 입문자 가이드 동영상 있음	집마 홀릭TV
BMW는 왜 듣보 배터리로 새 플랫폼에 재를 뿌렸을까? 동영상 있음	오토기어
‘잠에 곯아떨어진다’는 말, 비유가 아니었다?	과학향기
증강현실 기기, 엑스리얼 1S 공개 “안경 착용자 배려 부족은 여전해”	IT동아
2026 서울 기계식 키보드 엑스포 탐방기 (1)	쿨엔조이
2026 엔티스 파워서플라이 시리즈 살펴보기	쿨엔조이
2026 마이크로닉스 신제품 발표회 탐방기	쿨엔조이
다해서 3만7천원? 다이소 데스크테리어 ㅋㅋㅋ 미쳤네 이거 (2) 동영상 있음	딴트공 말방구 실험실
2026 전기바이크 정부보조금 계산 하는 방법 \| 환경부가 생각하는 한국의 전기이륜차 추천 방향 \| 이제 고고로, 지호 같은 제대로 된 바이크는 못 타겠네요 동영상 있음	포켓매거진
모카 스마트 충전기 토론 "하.. 이걸 지금 토론이라고 하나?" (1) 동영상 있음	오토기어
쉿, 우리만 알자! 바르셀로나 히든 스폿 4	트래비
칭다오 여행에서 꼭 가야 할 역사 관련 명소 4 (1)	트래비
[BOOK] 북촌 건축 기행부터 800일의 남미 일주까지 (1)	트래비
에디터가 추천하는 피렌체 여행지&맛집 7 (2)	트래비
[겜ㅊㅊ] 아늑한 나만의 공간 만들자, 집 꾸미기 게임 5선 (1)	게임메카
“AI 데이터 효율 개선” 구글 터보퀀트, AI 산업 어떻게 바꿀까?	IT동아
'목표는 완주' 제네시스 마그마 레이싱 'GMR-001' 공개, WEC 출전 공식화	오토헤럴드
단종 수순·생산 중단까지··· 벼랑 끝에 선 소비자용 메모리, 그 이유는? (1)	IT동아
[취재] ‘승리의 여신: 니케’ 오케스트라 콘서트, '음악을 통해 확장된 니케의 생명력'	게임동아
[취재] 넥슨 이정헌 대표 “유저와 더 깊이, 더 밀접한 게임 선보일 것”	게임동아
[취재] 넥슨이 추구하는 AI 방향성 “AI는 창작을 대체하지 않는다”	게임동아
[취재] 넥슨 CFO “2026년 더 적극적인 주주 환원 정책 펼친다”	게임동아
[취재] 넥슨 패트릭 쇠더룬드 회장 “매출 추정치&목표 전면 재검토한다”	게임동아
[취재] 넥슨 패트릭 쇠더룬드 신임 회장 “넥슨 전면적 구조 재구성 들어갈 것”	게임동아
음성 AI의 역설: 접근성 높아지자 성차별도 함께 증가했다	AI matters
강바닥 모래와 자갈, AI가 레이저로 구분한다: 헬기 띄워 3차원 지도 완성	AI matters
보험 산업이 AI로 재편되는 이유, 처리 속도 40% 단축이 만든 격변	AI matters
앤트로픽 경제 지수, AI 혜택은 이미 불평등하게 분배되고 있다	AI matters
챗봇은 죽었다, 2026년 AI가 고객 경험을 완전히 다시 쓰는 5가지 방법	AI matters
AI가 결제 버튼을 대신 누르는 시대, 결제 산업은 어떻게 바뀌나	AI matters
유튜브 추천 AI가 광고 수익까지 챙긴다, 구글이 공개한 '돈 버는 추천 알고리즘'	AI matters
[기자 수첩] 사망자 역대 최저치, 교통사고 사회적 비용은 사상 최고	오토헤럴드
[모빌리티 인사이트] 펠리세이드 시트 사고 "경고 있었지만 막지 못해"	오토헤럴드
현대차, "다시 도전하는 픽업트럭" 뉴욕오토쇼에서 전략 모델 공개	오토헤럴드
또 열리는 e스포츠 상설경기장, 활용도는 개선됐나?	게임메카
사용 환경으로 나뉘는 선택 기준, 2026년형 LG gram 라인업 정리	다나와
[숨신소] 새로운 로마 세운다, '매긍' 받은 도시 건설 시뮬 (1)	게임메카
[위대한 발명 ⑦ 공기압 타이어] 도로 위 모든 충격을 품는 핵심 요소	오토헤럴드
"첫 목표는 완주" 제네시스 마그마 레이싱 WEC 드라이버 라인업 공개	오토헤럴드
스톤에이지 키우기, ‘근본 펫’ 베르가와 오가로스가 온다	게임메카
[인디言] 코스믹 호러 피해 소녀를 찾는 소년 ‘도스믹’ (1)	게임메카
[정석희의 기후·에너지 인사이트] 7. 사소하지 않은 5%의 균열	IT동아
왜 AI 써도 칼퇴 못할까…표류하는 AI 세상에서 중심 잡는 법	IT동아
“조립 특화 피지컬 AI” 플라잎의 기술에 투자 기관이 주목한 이유	IT동아
[크립토퀵서치] 디지털자산 과세 폐지를 주장하는 이유는 무엇인가요?	IT동아
“AI 에이전트로 프론티어 기업 전환하라” 마이크로소프트, M365 코파일럿으로 차별화 가속	IT동아
픽셀 11 디자인 바뀌고 아이폰 18 프로 홀 줄어드나…이번 주 IT 루머 총정리	다나와
[EV 트렌드] '자동차는 데이터센터' 자율주행차, 300GB RAM 시대	오토헤럴드
[김훈기 칼럼] "전기차 올인, 이제 위험" 글로벌 톱3가 바꾼 게임의 룰	오토헤럴드
[칼럼] 르노코리아 '오로라 프로젝트' 대박 신차로 마이너 한계 극복	오토헤럴드
호르무즈 봉쇄 기름값 폭등, 다시 뜨는 전기차에 각국 보조금 ‘유턴’	오토헤럴드
[SECON 2026] 대한CNI 우종현 CTO “지키는 보안에서 남기는 보안으로” 아카이브를 다시 생각할 시간	위클리포스트
[SECON 2026] 씨게이트 김정균 이사 “요즘에도 하드 쓰나? 오히려 지금은 예전보다 훨씬 더 많이 쓰입니다”	위클리포스트
[SECON 2026] 레안텍 조정호 이사 "저장장치 시장의 현실… 지금은 판매보다 확보가 먼저"	위클리포스트
AMD 라이젠 CPU, 왜 정품이어야 하나?	위클리포스트
[정보/루머] 저가형에서 의외로 힘숨찐될 듯한 인텔 와일드캣 레이크 및 다시 고개 든 지포스 RTX 60 떡밥 등	다나와
CXMT 중국 메모리는 가격 폭등을 타고 메모리 BIG4가 될 수 있을까? [메모리 가격 폭등 9부] (1) 동영상 있음	보드나라
3월 마지막 주말 나들이 인천 송도와 라면박람회 어때요? (1)	트래비
홍도 여행은 식탁에서 완성된다	트래비
에디터가 반한 프라하의 매력적인 건축물&카페 모음 (1)	트래비
유튜브 영상 5만개 보고 가위질 배운 AI 로봇	AI matters
AI가 단백질과 약물의 궁합을 예측해 신약 개발 판도를 바꾼다	AI matters
기존보다 50배 빠른 AI 영상 화질 개선 기술이 실시간 처리 시대를 열다	AI matters
[취재] Xbox 파트너 프리뷰 통해 19종 신작 공개…‘게임 패스’ 중심 전략 강화	게임동아
[칼럼] 콘솔 게임 개발, 돈이 될까?	게임동아
‘AI와 네트워크 융합 본격화’…올해 주목받을 통신 기술 트렌드는	IT동아
잔재주 대신 본질...정통 진화형 신제품, LG전자 ‘더 넥스트 올레드’ TV	IT동아
NHN두레이, 공공기관 AI 전환 해법 제시··· 'CSAP 인증 협업 툴로 GPT·제미나이 활용'	IT동아
[순정남] 실사화 되며 '눈뽕' 선사한 게임 캐릭터 TOP 5 (1)	게임메카
BMW 노이어클라쎄 iX3 "잘해 놓고 중국 EVE 뿌리네!" (5) 동영상 있음	오토기어
아크 월드 투어 파이널 대회 수놓은 실감나는 화질의 'MSI 모니터'	미디어픽
[2026 다나와 아카데미] '이게 대체 얼마야' 하이엔드 그래픽카드와 공유기 선보인 'MSI'	미디어픽
[2026 다나와 아카데미] 혁신적인 하드웨어로 학생들과 소통한 '마이크로닉스'	미디어픽
[2026 다나와 아카데미] 차별화된 게이밍 기어로 서강대 사로잡은 '커세어' (1)	미디어픽
[2026 다나와 아카데미] 누구나 갖고 싶은 메모리 '클레브 x 서린씨앤아이'	미디어픽
유럽은 AI 강국인데 아무도 모른다, 그 이유가 충격적이다	AI matters
AI가 기업 리스크 관리의 판도를 바꾼다, HBR이 밝힌 GRC 혁신의 실체	AI matters
“창작 침해인가? 기술 진보인가?” 엔비디아 DLSS 5가 낳은 논란 (1)	IT동아
ASUS ROG x 키움 DRX, ASUS ROG 게이밍 기어 신제품 쇼케이스	블루프레임
노션, 협업툴 넘어 ‘에이전트 OS’ 시대 그린다	IT동아
[모빌리티 인사이트] "가격이 시장을 바꾼다" 유럽 전기차 대중화 진입	오토헤럴드
'벤츠의 굴욕' 브랜드 이미지 2년 만에 와르르, 1위에서 5위로 추락 (1)	오토헤럴드
[EV 트렌드] '버튼 대신 레버' 테슬라, 사이버캡에서 도어 구조 변경	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글은 정말 다를까? 과학적 분석으로 밝혀낸 실체

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 쓴 글과 사람이 쓴 글은 정말 다를까? 과학적 분석으로 밝혀낸 실체

공유하기

공감/비공감