비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 쓴 글과 사람이 쓴 글은 정말 다를까? 과학적 분석으로 밝혀낸 실체

2025.01.07. 09:33:10
조회 수
603
4
댓글 수
2

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Does a Large Language Model Really Speak in Human-Like Language?



대규모 통계 분석으로 밝혀낸 AI 글쓰기의 한계

서울시립대학교 통계데이터과학과 연구진이 발표한 최신 연구에 따르면, 챗GPT로 대표되는 대형 언어모델(LLM)이 생성한 텍스트는 겉보기에 자연스러워 보이지만 인간의 글쓰기와는 본질적인 차이가 있는 것으로 나타났다. 연구진은 2023년 12월 6일부터 2024년 1월 17일까지 맨해튼 지역 446개 호텔의 3만2천여 개의 숙박 리뷰를 수집했으며, 추가로 CNN 뉴스 기사 8,008개, SQuAD2 문장 9,198개, 그리고 Quora 질문 24,714개를 분석 대상으로 삼았다.

혁신적인 연구 방법론으로 AI 텍스트의 본질에 접근

연구진은 두 가지 핵심 질문에 주목했다. 첫째, 원본 텍스트(O)와 GPT가 이를 바꿔 쓴 버전(G) 간의 잠재적 커뮤니티 구조 차이가 G와 이를 다시 바꿔 쓴 버전(S) 간의 차이와 같은지, 둘째, GPT의 텍스트 다양성을 제어하는 매개변수를 조절할 때 G가 O와 더 유사해지는지를 분석했다.

연구팀은 각 텍스트를 OpenAI의 text-embedding-3-small 모델을 사용해 1536차원의 단위 벡터로 변환했다. 분석을 위해 호텔링의 T-제곱 검정, Nploc 검정, 에너지 검정, 볼 검정 등 4가지 통계적 방법을 사용했으며, 클러스터 수를 2개에서 5개까지 변화시키며 실험을 진행했다. 또한 쿨백-라이블러 발산과 바서스타인 거리 분석을 통해 텍스트 간의 통계적 거리도 측정했다.


GPT의 다양한 설정값 변화에도 여전한 인간 텍스트와의 간극

연구팀은 GPT의 텍스트 생성 다양성을 제어하는 '온도' 매개변수를 0.1에서 1.5까지 다양하게 조절하며 실험을 진행했다. 실제 실험에서 사용된 호텔 리뷰 사례를 보면 흥미로운 차이가 드러난다. 원본 리뷰가 "기본적이고, 깨끗하고 편안한 호텔이다. 단기 숙박으로는 나쁘지 않다. 모든 것과의 접근성이 좋다"였을 때, GPT는 온도 설정에 따라 다음과 같이 다른 텍스트를 생성했다.

낮은 온도(0.1)에서는 "저렴하면서도 깨끗하고 아늑한 숙소를 제공하는 호텔이다. 빠른 숙박에 적합하다. 편리한 위치 덕분에 모든 편의시설에 쉽게 접근할 수 있다"와 같이 원본에 충실한 표현을 생성했다. 중간 온도(0.7)에서는 "아늑하고 잘 관리된 호텔로 모든 필수 시설을 갖추고 있다. 짧은 휴가에 딱 좋다. 위치의 편리함이 큰 장점이다"처럼 좀 더 자연스러운 변형이 이루어졌다. 높은 온도(1.5)에서는 "이 부티크 호텔은 기대 이상이었다. 객실은 아늑했고 직원들도 친절했다. 도시를 둘러보기에 완벽한 위치였다. 짧은 여행을 위한 훌륭한 선택이다"와 같이 원본과는 상당히 다른, 더 창의적이고 열정적인 표현이 생성됐다.

이러한 실험 결과는 온도 설정이 높아질수록 AI가 더 자유롭고 창의적인 표현을 생성하지만, 동시에 원본의 의도나 톤에서 더 멀어질 수 있음을 보여준다. 흥미롭게도 SQuAD2 데이터셋에서는 온도 매개변수가 증가할수록 인간 텍스트와의 유사성이 증가하는 특이한 패턴이 발견됐다. CNN과 SQuAD2 데이터의 경우, 한 문장으로 구성된 특정 문체를 가진 텍스트라서 일부 예외적인 결과가 나타났다.



텍스트 변환 과정에서 발견된 주목할 만한 차이

연구진은 텍스트 변환 과정에서 중요한 발견을 했다. 두 번째 패러프레이징(G에서 S로의 변환)이 첫 번째 패러프레이징(O에서 G로의 변환)보다 더 큰 변화를 보였다는 것이다. 이는 LLM이 텍스트를 변환할 때마다 원본과의 차이가 점점 더 커질 수 있음을 시사한다.

연구의 한계와 자연어 처리 분야의 새로운 과제

연구진은 이번 연구가 가진 한계도 명확히 했다. 제안된 테스트 방법이 간접적인 증거만을 포착할 수 있어 탐지력과 적용 가능성이 제한될 수 있으며, 대응된 데이터 설정에서만 적용 가능하다는 제약이 있다고 설명했다. 또한 LLM의 성능을 정량적으로 평가할 수 있는 통계적 방법론이 부족한 현실을 지적하며, 이는 LLM이 최근에 등장했기 때문이라고 설명했다. 연구진은 이번 연구가 제시한 방법론이 향후 LLM 평가를 위한 새로운 기준이 될 수 있을 것으로 기대했다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.





AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 기획뉴스 전체 둘러보기
1/1
온보드와 SO-DIMM의 경계가 무너진다, LPCAMM2가 바꾸는 노트북 메모리의 미래 다나와
메모리 가격 폭등 부추기는 공포 마케팅과 대형 PC 제조사들 [메모리 가격 폭등 3부] 동영상 있음 보드나라
로터스 정체성 '미드십 스포츠카' 헤리티지, 유로파에서 에미라까지 오토헤럴드
인텔 코어 울트라 시리즈 3 AI PC의 새로운 이정표, 인텔 2026 AI PC 쇼케이스 블루프레임
차세대 PCIe 5.0 SSD...'키오시아'가 제시하는 미래 스토리지 미디어픽
알프스를 곁에 둔 스위스 골프 여행 트래비
우주로 확장되는 전쟁터, 스타링크 위성통신 역할은 IT동아
인텔 코어 울트라 시리즈 3 등판··· '성능·배터리·무게 다 갖춘 노트북 현실로' (1) IT동아
퓨리오사AI, NPU 'RNGD' 양산 돌입··· '한국 넘어 세계시장 향한다' IT동아
“사람을 연결하는 미래 교육, AI와 에듀테크를 만나다”...제5회 링크(LINK)에서 엿본 미래 교육 현장 IT동아
"인간은 쓸모없어질 것" 머스크의 경고가 현실로? '피지컬 AI'가 바꾸는 충격적 미래 (ft. 젠슨 황, 현대차 아틀라스) 동영상 있음 AI matters
한국타이어, 포뮬러 E 시즌 12 도심 서킷 ‘2026 마이애미 E-PRIX’ 후원 오토헤럴드
LLM 넘어 기술 패권 기업으로 성장한 '딥시크', 쇼크 이후 1년 톺아보니 IT동아
[겜ㅊㅊ] 고난은 나누면 절반이 된다, 협동 소울라이크 5선 게임메카
[위클리AI] 마이크로소프트, 마이아200으로 경쟁력 강화···아마존도 의료용 서비스 대열 합류 IT동아
AI로 10시간 걸릴 일 1시간으로 줄였는데... 왜 우리는 더 바빠질까? (2026 AI 트렌드) 동영상 있음 AI matters
아이폰부터 라이카, 스위치2까지…지금 가장 뜨거운 IT 루머 한눈 정리 다나와
[자동차와 法] 교통사고 과실비율 판단의 변수들 IT동아
[김흥식 칼럼] "기계는 살았다" 방직기와 컴퓨터 그리고 AI 로봇의 공통점 오토헤럴드
충청남도 서산의 보물: 웅도, 개심사, 간월암 완벽 코스 트래비
이 시간 HOT 댓글!
1/4