비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 써 준 논문 서론, 써도 될까? 모델별 실력 봤더니, 1등은 '라마4'

2025.08.25. 18:44:09
조회 수
275
6

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

챗GPT 같은 AI가 대학 논문의 첫 부분을 대신 써주는 시대가 왔다. 미국 일리노이대학교와 어도비에서 실시한 연구에 따르면, GPT-4o나 라마4 같은 최신 AI들이 연구자들의 논문 작성을 상당히 도와줄 수 있는 것으로 밝혀졌다. 연구팀은 AI가 얼마나 잘 논문의 서론을 쓸 수 있는지 알아보기 위해 특별한 실험을 했다. 논문 제목과 요약, 그리고 관련된 다른 논문들 정보를 AI에게 주고 서론을 써달라고 한 것이다.

이를 위해 2025년 주요 학술대회에서 발표된 총 3,900편의 컴퓨터과학 논문을 모았다. 이 논문들은 평균적으로 13~15개의 다른 논문을 인용하고 있어서, AI가 학술적인 맥락을 얼마나 잘 이해하는지 종합적으로 살펴볼 수 있었다.

라마4가 1등, 예시 3개 보여주니 더 잘해

딥시크, 젬마, 라마4, 미스트랄, GPT-4o 등 5개의 최신 AI 모델을 비교 실험한 결과, 라마4가 전반적으로 가장 좋은 성과를 보였다. 특히 의미를 얼마나 비슷하게 표현하는지, 그리고 사실을 얼마나 정확하게 반영하는지 측면에서 뛰어났다.

또 흥미로운 점은 AI에게 예시를 3개 보여준 후 써달라고 하면, 예시를 적게 보여주거나 아예 안 보여줬을 때보다 훨씬 더 좋은 글을 썼다는 것이다. 실험 결과를 보면 라마4는 원래 논문과 비슷한 단어를 사용하고 의미도 비슷하게 전달하는 능력이 다른 AI들보다 뛰어났다.


인용과 정확성에서는 아직 문제 있어

하지만 현재 AI들은 여전히 중요한 한계를 보였다. 실제 사람이 평가해 본 결과, AI가 쓴 서론은 글의 일관성이나 내용을 포괄하는 면에서는 괜찮았지만, 다른 논문을 인용할 때 맥락에 맞게 사용하는 것이나 연구의 핵심 기여를 요약하는 부분에서는 부족했다. 예를 들어 젬마 AI는 관련 논문들을 많이 찾아내는 능력은 뛰어났지만, 정작 필요 없는 인용까지 포함시키는 경향이 있었다.

사람이 직접 평가한 결과에서도 라마4의 3개 예시 방식이 내용 포괄성과 글의 흐름에서는 가장 좋은 점수를 받았지만, 잘못된 정보를 만들어내지 않는 능력이나 기술적 세부사항의 정확성에서는 여전히 개선이 필요했다.

연구 도우미로는 좋지만 완전 대체는 아직

연구팀은 "AI들이 명확한 지시와 논문 제목, 요약, 관련 연구 목록을 받으면 학술 논문 규칙에 맞는 일관되고 잘 짜인 서론을 만들 수 있다"고 평가했다. 하지만 동시에 "AI가 쓴 서론을 그대로 쓰기에는 한계가 있다"며, 인용된 논문의 세세한 기술 내용 반영, 정확한 인용 사용, 논문의 핵심 기여 설명 등에서 상당한 수정과 전문가 검토가 필요하다고 지적했다. 이는 현재 AI들이 학술 글쓰기에서 유용한 도우미 역할은 할 수 있지만, 아직 사람 연구자를 대신할 수준은 아니라는 뜻이다.

FAQ ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.

Q: AI가 논문 서론을 써주면 바로 사용해도 될까요?

A: 아직은 안 됩니다. AI가 쓴 서론은 좋은 초안은 되지만, 인용이 정확한지, 기술적 내용이 맞는지, 연구의 핵심 내용이 제대로 표현됐는지 등을 전문가가 반드시 검토하고 수정해야 합니다.

Q: 어떤 AI가 논문 서론 쓰기에 가장 좋나요?

A: 이번 연구에서는 라마4가 전체적으로 가장 좋은 성능을 보였습니다. 특히 의미 전달과 사실 정확성 면에서 뛰어났고, AI에게 예시 3개를 보여준 후 써달라고 하면 더 좋은 결과를 얻을 수 있습니다.

Q: AI 논문 작성 도구는 언제쯤 실용적으로 쓸 수 있을까요?

A: 지금도 연구를 도와주는 보조 도구로는 충분히 활용할 수 있습니다. 하지만 사람의 감독 없이 혼자 사용하기에는 아직 한계가 있어서, 연구팀도 중요한 학술 작업에서는 전문가 검토 없이 AI 도구를 사용하지 말라고 주의를 당부했습니다.




해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: Let's Use ChatGPT To Write Our Paper! Benchmarking LLMs To Write the Introduction of a Research Paper

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
'음료 업체 먼저 출원' 테슬라 사이버캡, 상표권 분쟁에 사용 못할 수도 오토헤럴드
'미국 얘기인데 듣기만 해도 공포' 벤츠 EQB '열폭주 화재우려' 리콜 오토헤럴드
[EV 트렌드] 혹한 속 전기차 주행거리 '반토막' WLTP 최대 46% 감소 오토헤럴드
'정의선과 타이거우즈' 美 PGA 대회 타이틀 스폰서 2030년까지 동행 오토헤럴드
폴스타, 3년간 4종 ‘역대 최대 규모의 신차 공세'로 볼륨 확장에 주력 오토헤럴드
[EV 트렌드] 테슬라, 사이버캡 첫 양산차 공개 '2027년 출시 재확인'  오토헤럴드
'세단·왜건으로 M3 정조준' 아우디, 신형 RS5 티저 공개 직전 유출 오토헤럴드
BYD 첫 경형 전기차 라코 출시 임박 '1회 충전 180km' 경차 천국 日 조준 오토헤럴드
'테슬라 또 때린 中' 전자식 도어 핸들 이어 요크 스티어링 휠 금지 추진 오토헤럴드
'엇갈리는 스포츠카 전략' 포르쉐·아우디 차세대 전기차에서 다른 선택 오토헤럴드
'패밀리 정체성 강화' 현대차, 유럽 공략 맞춰 디자인 전략 재정비 오토헤럴드
롤스로이스, 중동 건축 유산 담은 비스포크 모델 ‘팬텀 아라베스크’ 공개 글로벌오토뉴스
현대차그룹, 캐나다 올해의 차 4년 연속 2관왕 달성 글로벌오토뉴스
폴스타, 스테이폴리오와 맞손… 고객 로열티 프로그램 ‘폴스타 스테이’ 론칭 글로벌오토뉴스
비톨 CEO “글로벌 석유 시장 수급 균열 시작… 지정학적 위기 고조” 글로벌오토뉴스
미국 자동차 시장, '프리미엄' 대신 '실속'… 고물가에 기본 트림 인기 글로벌오토뉴스
메르세데스-벤츠, 2025년 영업이익 57% 급감… 관세·중국 악재에 직격탄 글로벌오토뉴스
중국차, 2025년 유럽 시장 점유율 6%로 2배 급등 글로벌오토뉴스
토요타, 베스트셀러 ‘하이랜더’ 앞세워 전기차 반격 글로벌오토뉴스
현대차그룹, 교통약자 위해 전기차 120대 쏜다… ‘이셰어’ 사업 2028년까지 연장 글로벌오토뉴스
이 시간 HOT 댓글!
1/4