비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

유료와 무료, ChatGPT 3.5와 ChatGPT 4의 교실 내 형평성 비교

2024.12.19. 14:02:12
조회 수
822
18

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Equity in the Use of ChatGPT for the Classroom:

A Comparison of the Accuracy and Precision of ChatGPT 3.5 vs. ChatGPT4 with Respect to Statistics and Data Science Exams

무료 버전과 유료 버전 간 성능 차이가 학습 격차를 확대할 가능성

ChatGPT는 교육의 민주화를 위한 강력한 도구로 자리 잡고 있다. 하지만 ChatGPT 4(유료)와 ChatGPT 3.5(무료)의 성능 차이가 학생들 간 학습 기회를 불균등하게 만들고 있다는 연구 결과가 나왔다. 미국 서던메소디스트 대학교에서 진행된 이 연구는 통계학 및 데이터 과학 시험 문제를 통해 두 플랫폼의 정확도와 정밀도를 비교하며, 경제적 이유로 유료 버전에 접근하지 못하는 학생들이 학습 격차를 겪을 가능성을 지적한다.

연구는 경제적 격차 외에도 유료 버전을 사용하지 않는 다양한 이유를 언급한다. 예를 들어, 신용카드 정보 제공에 대한 우려, 사용 빈도에 따른 비용 부담, 그리고 일부 교실에서의 사용 금지 조치가 이에 해당한다. 이러한 이유들은 단순한 경제적 요인을 넘어 사용 접근성을 복합적으로 제한하고 있다.



시험에서 드러난 성능 차이

ChatGPT 4와 ChatGPT 3.5는 서로 다른 난이도의 통계 시험에서 테스트되었다. AP 통계 시험, 대학 입문 수준의 CAOS 시험, 고등학교 수준의 ACTM 시험, 그리고 박사 과정 통계학 시험에 걸쳐 두 모델의 정답률이 평가되었다. 연구에 따르면, ChatGPT 4는 모든 시험에서 ChatGPT 3.5를 능가하며 평균적으로 80% 이상의 정답률을 기록했다. 반면 ChatGPT 3.5는 50% 수준에 머물렀다.

시험별로 분석했을 때 ChatGPT 4는 ACTM 시험에서 100%, AP 통계 시험에서 81%, CAOS 시험에서 70%의 정답률을 보였다. 반면 ChatGPT 3.5는 각각 64%, 50%, 48%의 정답률을 기록하며 모든 시험에서 유료 버전에 크게 뒤처졌다. 특히 시각적 데이터를 포함한 문제에서 ChatGPT 4는 66%의 정답률을 보였으나, ChatGPT 3.5는 6%로 현저히 낮았다. 이 차이는 ChatGPT 3.5가 이미지 처리 기능을 지원하지 않는 데 기인한다.



문항 유형에 따른 성능 분석

연구진은 문제 유형(객관식, 주관식)과 이미지 포함 여부에 따라 성능을 세분화해 분석했다. ChatGPT 4는 이미지가 포함된 문제에서 압도적으로 우위를 보였으며, 객관식 문제에서도 ChatGPT 3.5보다 높은 정확도를 기록했다. 특히 30개의 이미지 포함 문제 중 ChatGPT 4는 18개를 맞혔지만, ChatGPT 3.5는 단 2개만 정답을 맞혔다. ChatGPT 3.5는 “이미지를 직접 읽을 수 없다”는 메시지를 반복하며 정확한 답변을 제공하지 못했다.

주관식 문제에서도 두 모델 간의 격차가 두드러졌다. ChatGPT 4는 82%의 주관식 문제를 해결한 반면 ChatGPT 3.5는 43%만 해결했다. 이는 복잡한 문제 해결 능력에서 유료 모델의 우수성을 보여준다.



교육 격차를 심화시키는 요인

이 연구는 ChatGPT 4의 유료 구독 모델이 학습 격차를 확대할 수 있음을 경고한다. 특히 경제적 어려움으로 인해 무료 버전만 사용할 수 있는 학생들은 저품질의 응답에 의존해야 하는 상황이다. 이러한 격차는 단순한 소득 문제를 넘어 시각 장애를 가진 학생들에게도 영향을 미친다. ChatGPT는 스크린 리더와 음성 텍스트 변환 기능을 지원하지만, 이를 통한 학습의 질은 이미지 기반 질문에서 여전히 제한적이다.

연구진은 또한 유료 서비스에 대한 신용카드 정보 제공에 대한 불안감과 사용 빈도에 따른 비용 부담 문제도 격차를 심화시키는 요인으로 꼽았다.

향후 과제와 개선 방향

ChatGPT의 차기 버전인 GPT-4o가 일부 유료 기능을 무료로 제공하면서 이러한 격차를 완화할 가능성이 제기되었다. GPT-4o는 이미지 인식 기능을 지원하며, 텍스트 음성 변환과 같은 접근성 기능도 개선되었다. 그러나 무료 사용자에게 메시지 전송 횟수 제한이 부과되어 여전히 근본적인 형평성 문제를 해결하기에는 부족할 수 있다.

또한 연구진은 Microsoft Co-Pilot, Google Gemini, Anthropic의 Claude와 같은 다른 AI 플랫폼과의 비교 연구 필요성을 제기했다. 초기 연구에서는 ChatGPT 4가 정확도 면에서 다른 플랫폼을 압도했지만, 유료 모델이 사용되지 않는 환경에서의 형평성 확보를 위한 대안으로 다양한 플랫폼 간 비교가 필요하다.


결론

ChatGPT 4는 무료 버전인 ChatGPT 3.5에 비해 명백히 우수한 성능을 보여주었다. 그러나 이러한 기술적 우수성이 경제적 이유로 유료 버전에 접근하지 못하는 학생들에게 학습 격차를 확대할 가능성이 있다. 연구진은 ChatGPT와 같은 생성형 AI 도구가 개인 교사의 역할을 수행할 수 있는 잠재력을 지닌 만큼, 이를 보다 공평하게 활용할 수 있는 방안을 모색해야 한다고 강조했다.

연구는 또한 ChatGPT 4조차 18%의 질문에 대해 정확한 답변을 하지 못했으며, 일부 질문에서는 ChatGPT 3.5가 더 나은 답변을 제공했다는 점을 지적하며, AI 기술 전반의 한계를 논의했다. 이러한 한계를 극복하기 위한 추가 연구와 정책적 지원이 필요하다는 점이 강조되었다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 





AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
오픈AI, 챗GPT '슈퍼 AI 비서' 발전 계획 공개… "헬스장 가입부터 변호사 연락까지" (1) AI matters
24시간 만에 업무 활용 가능 수준 AI 솔루션 완성하는 로봇? MS 차세대 에이전트 기술 공개 AI matters
"AI 때문에 망했다" vs "AI로 대박났다"... 성패를 가르는 이것 AI matters
AI 뒤처진 애플, iOS 19 대거 개편… “AI보다 디자인 변화가 핵심” AI matters
내 캐릭터로 애니메이션 제작 가능… 캐릭터AI, 씬·아바타FX·스트림 등 멀티모달 창작 기능 공개 AI matters
이번엔 모바일서 통할까… 어도비, 생성형 AI 기능 탑재 포토샵 안드로이드 버전 출시 AI matters
美 빅3 음반사, AI 기업과 음악 활용 라이선스 협상 추진 AI matters
폭스바겐 노조 2만명 해고 동의, 볼프스부르크 공장 '4일 근무제' 전환도 (1) 오토헤럴드
'치열한 경쟁 속 BYD 압도적' 5월 中 신에너지차 판매 꾸준한 상승 중 오토헤럴드
폭스바겐, 미국에 수십억 달러 투자로 상호관세 판도 바꿀 특혜에 기대감 오토헤럴드
볼보 전기 SUV 'EX30', EV 어워즈 2025 ‘심사위원 선정 혁신 전기차’ 등극 오토헤럴드
폴스타, 'EV 어워즈 2025'서 폴스타4 '심사위원 선정 혁신 전기차' 수상 오토헤럴드
폴스타 4, EV 어워즈 2025 ‘심사위원 선정 혁신 전기차’ 수상 글로벌오토뉴스
기아 EV4, ‘대한민국 올해의 전기차’ 선정…아이오닉9은 소비자 선택상 수상 글로벌오토뉴스
한국타이어, 미국 청소년 단체 설립에 2만 달러 기부…지역 사회 지원 활동 지속 글로벌오토뉴스
볼보 EX30, ‘EV 어워즈 2025’ 심사위원 선정 올해의 전기차 수상 글로벌오토뉴스
포드·현대차, 美 5월 판매 증가…관세 우려에 소비자 구매 앞당겨 글로벌오토뉴스
중국의 희토류 수출 규제, 글로벌 자동차 산업 생산 차질 우려 글로벌오토뉴스
독일 자동차 산업, 바닥 뚫나…업황지수 또 하락 글로벌오토뉴스
젬블로컴퍼니, 라온, 쿠키런 보드게임 앞세워 천안 K-컬처 박람회 참가 게임동아
이 시간 HOT 댓글!
1/4