비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

챗GPT가 쓴 글, 사람의 글과 무엇이 다를까? 대규모 데이터 분석 결과

2025.02.17. 14:02:13
조회 수
1,890
25
댓글 수
12

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Evaluation of a trial of generative AI (Copilot) in The Treasury


AI 생성 문장, 인간과 얼마나 비슷할까?

호주 재무부에서 진행한 코파일럿 실험 보고서에 따르면, 코파일럿(Copilot) 같은 대형 언어 모델이 생성하는 문장은 표면적으로는 자연스럽게 보이지만, 통계적으로 분석했을 때 인간이 작성한 문장과는 뚜렷한 차이가 존재하는 것으로 나타났다. 연구진은 수만 개의 실제 데이터와 AI가 만든 텍스트를 비교 분석하여 AI 문장의 구조적, 통계적 차이를 규명했다​.

AI의 업무 지원 기대치 50%, 실제 영향을 더 높아

연구에서는 AI의 실질적인 활용 가능성을 평가하기 위해, 사용자가 AI가 지원할 것으로 기대한 작업량과 실제 지원된 작업량을 비교하였다. 실험 결과, AI가 지원할 수 있다고 예상한 업무량과 실제로 지원한 업무량 간에는 큰 차이가 존재했다. 연구 참여자들의 사전 기대치는 "대부분의 업무(50% 이상)를 지원할 것"이라고 답한 비율이 19%에 불과했으나, 실험 후 AI가 실질적으로 지원했다고 느낀 업무량은 더 높았다.

AI가 실제 업무 프로세스에 미친 영향을 분석한 결과에서도 유사한 경향이 나타났다. 관리자와 실험 참가자의 평가를 비교한 결과, 관리자의 59%가 코파일럿이 업무에 아무런 영향을 미치지 않았다고 답한 반면, 실험 참가자의 56%는 긍정적인 영향을 주었다고 응답했다. Copilot이 매우 긍정적인 영향을 주었다고 답한 비율은 관리자 2%보다 실험 참가자가 7%로 더 높았다. 반면, 부정적인 영향을 주었다고 답한 비율은 매우 낮아, AI가 업무에 미치는 부정적 요소는 크지 않은 것으로 나타났다.


AI 문장 변형 반복할수록 인간의 글쓰기와 더 차이나

연구진은 AI가 문장을 변형할 때 발생하는 차이를 확인하기 위해 두 가지 실험을 진행했다. 첫 번째 실험에서는 원본 문장(O)과 AI가 이를 변형한 버전(G) 간의 차이를 측정했다. 두 번째 실험에서는 AI가 이미 한 번 변형한 문장(G)을 다시 변형한 버전(S)과의 차이를 비교했다. 실험 결과, AI가 문장을 변형하는 과정에서 원본과의 거리가 점점 더 벌어지는 경향이 나타났다​.

AI의 온도 매개변수 설정 높을수록 창의적, 감성적 표현 증가

연구진은 코파일럿 생성하는 문장의 특성을 파악하기 위해 '온도(Temperature)' 매개변수를 조절하며 동일한 문장을 생성하는 실험을 진행했다. 생성형 AI에서 '온도(Temperature)' 매개변수는 모델이 응답을 생성할 때 무작위성의 정도를 조절하는 역할을 의미한다. 온도 값이 낮을수록 원본 문장과 유사한 표현을 유지했고, 온도 값이 높을수록 보다 창의적이고 감성적인 표현이 포함되었다. 예를 들어, 원본 호텔 리뷰가 "기본적이고, 깨끗하고 편안한 호텔이다. 단기 숙박으로는 나쁘지 않다. 모든 것과의 접근성이 좋다"였다면, AI는 온도 값에 따라 다음과 같이 문장을 변형했다.

낮은 온도 설정에서는 "저렴하면서도 깨끗하고 아늑한 숙소를 제공하는 호텔이다. 빠른 숙박에 적합하다. 편리한 위치 덕분에 모든 편의시설에 쉽게 접근할 수 있다"와 같이 원본에 가까운 표현을 생성했다. 반면 온도가 높을 경우 "이 부티크 호텔은 기대 이상이었다. 객실은 아늑했고 직원들도 친절했다. 도시를 둘러보기에 완벽한 위치였다. 짧은 여행을 위한 훌륭한 선택이다"와 같이 원본과 상당히 다른 문장을 생성하는 경향을 보였다​.

AI, 긴 문장 생성시 한계 뚜렷… 문맥 파악하는 데 부자연스러워

연구진은 AI가 인간과 동일한 방식으로 글을 쓰지 못하는 주요 이유로 문맥을 장기적으로 유지하는 능력 부족을 꼽았다. 인간의 글은 문맥적 흐름을 기반으로 한 논리적 전개가 강한 반면, AI는 주어진 문장 내에서만 최적의 표현을 찾는 데 집중하기 때문이다. 이는 특히 긴 텍스트를 생성할 때 명확하게 드러나며, AI가 장기적 문맥을 유지하는 데 한계를 보인다는 점을 보여준다​.

연구 결과에 따르면, AI가 문장을 생성할 때 문맥적 연결성을 충분히 반영하지 못하는 경우가 많았다. 예를 들어, 동일한 글에서 앞뒤 문장이 자연스럽게 이어져야 하지만, AI가 생성한 문장은 일부 문맥이 단절되거나, 동일한 내용을 반복하는 경향이 나타났다.

인간처럼 쓰지 못하는 AI, 문장 재구성할수록 원본과 멀어지는 ‘구조’가 원인

연구진은 AI가 생성하는 텍스트의 가장 큰 한계 중 하나로 통계적으로 인간과의 차이를 좁히기 어려운 구조적 문제를 지적했다. 연구에서는 원본 문장(O)과 AI가 이를 변형한 문장(G), 그리고 AI가 다시 변형한 문장(S) 간의 유사성을 측정했으며, AI가 한 번 변형한 문장과 원본 간의 차이가 두 번째 변형된 문장과의 차이보다 더 작다는 점을 발견했다. 이는 AI가 문장을 반복적으로 재구성할수록 원본과 더욱 멀어지는 경향이 있음을 시사한다​.

연구진은 이를 통계적으로 분석하기 위해 호텔링의 T-제곱 검정, Nploc 검정, 에너지 검정, 볼 검정 등 네 가지 통계 기법을 활용했다. 또한 텍스트 간의 통계적 유사도를 평가하기 위해 쿨백-라이블러 발산(KL divergence)과 바서스타인 거리(Wasserstein distance)를 측정했다. 이러한 분석을 통해 AI가 생성한 문장이 인간이 쓴 문장과 점점 더 차이가 나게 되는 경향이 있음을 입증했다​.

AI 글쓰기의 한계와 향후 발전 방향은 모두 ‘문맥 유지 능력’

이번 연구는 AI가 생성하는 텍스트의 신뢰성을 평가하는 데 중요한 시사점을 제공한다. AI가 생성한 문장은 표면적으로 자연스럽게 보일 수 있지만, 인간이 작성한 글과는 근본적으로 다른 방식으로 생성된다는 점이 통계적으로 입증되었다. AI가 인간처럼 문장을 구조화하고 문맥을 유지하는 능력이 아직 완전하지 않다는 점에서, 향후 발전 방향으로는 문맥 유지 능력을 강화하는 연구가 필요할 것으로 보인다.


해당 기사에 인용된 리포트 원문은 링크에서 확인 가능하다.

기사는 클로드 3.5 Sonnet과 챗GPT를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
“탈모는 아저씨 문제?” 이제는 2030 여성의 뷰티 루틴! (1) 뉴스탭
이노스 음식물처리기, 국가 품질인증 ‘Q 마크’ 획득… 최대 30만 원 정부 지원 뉴스탭
국민 아기 심하루, 아토팜 모델 됐다! 세탁세제 캠페인서 ‘포근함’ 전한다 뉴스탭
“피로는 줄이고 집중력은 높이고”… 수능 D-10, 건강기능식품이 뜬다 뉴스탭
배틀그라운드에 포르쉐 달린다! 크래프톤, 글로벌 초호화 협업 공개 뉴스탭
“여기저기서 인사하는 곰돌이”... 할리스, 매장마다 ‘할리베어’로 변신 뉴스탭
크로스오버존, 24형 144Hz 게이밍 모니터 ‘무결점 무료 업그레이드’ 이벤트 진행 뉴스탭
조텍 RTX 5090 회원들, 한강 위에서 불꽃과 재즈 속 특별한 밤 즐기다 뉴스탭
NXP, 아비바 링크스·키나라 인수 완료… 자동차 네트워킹과 AI 엣지 솔루션 강화 뉴스탭
크로스오버존 '24F200G IPS FHD 리얼 게이밍' 무결점 업그레이드 행사 다나와
마이크로닉스 '클래식 II 풀체인지 실버 ATX 3.1' Cybenetics 인증 획득 다나와
일본 자동차 산업, '갈라파고스' 이미지 벗고 진짜 반격 나설까 글로벌오토뉴스
현대자동차, 10월 글로벌 판매 35만 1,753대… 전년 대비 6.9% 감소 글로벌오토뉴스
KG 모빌리티, 10월 글로벌 판매 9,517대… 수출 26% 급증하며 상승세 유지 글로벌오토뉴스
기아, 10월 글로벌 판매 26만 3,904대… 해외 시장 2.1% 증가로 선전 글로벌오토뉴스
르노코리아, 10월 판매 7,201대… 하이브리드 비중 66%로 ‘전동화 전환 가속’ 글로벌오토뉴스
GM 한국사업장, 10월 완성차 판매 3만9,630대… 트랙스 크로스오버가 실적 견인 글로벌오토뉴스
다나와 '인텔 울트라7 CPU, 34인치 모니터' 1천원 래플 판매 진행 다나와
누적 30억 뷰 TV애니메이션 ‘젤리고’, 퍼즐게임으로 재탄생한다! (1) 게임동아
유비스, 지스타 2025서 ‘루나’ 메인 캐릭터 코스프레 공개… 미우뮤·하봄 참가 (1) 게임동아
이 시간 HOT 댓글!
1/4