GenPod: Constructive News Framing in AI-Generated Podcasts
More Effectively Reduces Negative Emotions Than Non-Constructive Framing
AI가 바꾸는 뉴스 제작의 판도
AI 기반 미디어 제작이 늘어나면서 뉴스 산업에서도 AI의 활용이 확대되고 있다. 뉴스 자동화와 개인화된 콘텐츠 제작에서 AI가 중요한 역할을 하고 있지만, 허위정보 생성이나 편향된 내용 제작 같은 위험도 존재한다. 뉴욕타임스(New York Times)나 로이터(Reuters) 같은 유력 언론사의 AI 생성 콘텐츠에서도 성별과 인종 편향이 발견됐다는 연구 결과가 있다.
이러한 문제를 개선하기 위해 중국 칭화대학교(Tsinghua University) 원쿠(Wen Ku) 연구팀과 중국인민대학(Renmin University of China), 선전대학교(Shenzhen University), 남방과학기술대학(Southern University of Science and Technology) 공동 연구진이 AI 생성 팟캐스트 제작을 위한 GenPod 파이프라인을 개발했다.
AI 팟캐스트의 혁신, GenPod의 이중 프레임 기술
연구진이 공동 개발한 GenPod 파이프라인 시스템은 대규모 언어모델(LLM)과 음성합성(TTS) 기술을 결합해 동일한 뉴스 자료를 건설적 프레임과 비건설적 프레임으로 각각 제작한다. 건설적 프레임은 해결책과 긍정적 감정을 강조하고, 비건설적 프레임은 부정적 사건과 갈등에 초점을 맞춘다.
사전 연구에서 참가자들은 AI 팟캐스트의 장점으로 객관성과 실시간 정보 수집 능력을 꼽았다. 한 참가자는 "AI는 개인적 편향이 없어 특정 관점을 선별적으로 무시하거나 선호하지 않는다"고 평가했으며, 이는 "전문적이고 신뢰할 수 있는 느낌을 준다"는 의견도 있었다.
66명의 청취자가 참여한 실험의 전모
연구팀은 66명의 참가자(34명 남성, 31명 여성, 1명 논바이너리; 연령 18-51세, 평균 23.23세)를 모집해 실험을 진행했다. 참가자들은 두 그룹으로 나뉘어 각각 건설적 팟캐스트와 비건설적 팟캐스트를 청취했다.
실험은 배달 노동자의 어려움과 올림픽 팬덤 문화 논란이라는 두 가지 주제로 진행됐다. 각 에피소드는 3분 40초 내외 길이로, 동일한 도입부와 결론, 음성, 배경음악을 사용했다. 감정 상태는 10개 항목으로 구성된 PANAS 척도를, 자기효능감은 7점 리커트 척도를 사용해 측정했다.
숫자로 보는 AI 팟캐스트의 감정 효과
ANOVA 분석 결과(F(1, 63) = 7.815, p < 0.01), 건설적 팟캐스트는 비건설적 팟캐스트에 비해 부정적 감정을 크게 감소시키는 것으로 나타났다. 건설적 팟캐스트의 경우 부정적 감정이 평균 -2.36 감소한 반면, 비건설적 팟캐스트는 0.53 증가했다. 한 참가자는 "건설적 팟캐스트의 균형 잡힌 설명, 특히 배달 노동자 문제에 대한 접근이 더 객관적이고 듣기 편했다"고 평가했다.
자기효능감의 경우, 배달 노동자 주제에서 건설적 팟캐스트 청취자들의 자기효능감이 더 높게 나타났다(F(1, 63) = 8.530, p < .01). 건설적 프레임 청취자들의 자기효능감은 평균 4.85를 기록한 반면, 비건설적 프레임 청취자들은 4.16을 기록했다. 다만 스포츠 팬덤 주제에서는 유의미한 차이가 발견되지 않았다.
AI 미디어의 미래: 가능성과 도전
연구진은 AI 생성 미디어가 건설적 프레임을 통해 스트레스나 불안을 겪는 개인의 치료적 맥락에서 활용될 수 있다고 제시했다. 또한 환경 지속가능성이나 평등과 같은 사회적 이슈에 대한 인식을 높이고 행동 변화를 촉진하는 데 기여할 수 있을 것으로 전망했다.
AI 시스템의 투명성 확보와 가치관, 관점 공개의 필요성도 제기됐다. 특히 정치, 기업 브랜딩, 여론 형성 분야에서의 오남용 방지를 위한 가이드라인 마련이 시급하다는 점이 강조됐다. AI 생성 팟캐스트는 향후 시각장애인을 위한 뉴스, 교육, 내비게이션 등 다양한 분야에서 활용될 수 있으며, 개인화된 콘텐츠 제공과 멀티태스킹 환경에서의 정보 전달에도 효과적일 것으로 예상된다.
더 나은 AI 뉴스를 위한 과제들
이번 연구는 상대적으로 작은 표본 크기로 인해 통계적 검증력과 일반화 가능성이 제한적이라는 한계를 지닌다. 또한 건설적/비건설적 프레임의 이분법적 대비가 뉴스 전달의 복잡성을 지나치게 단순화할 수 있다는 지적도 제기됐다. 통제된 실험 환경이 실제 상황을 완전히 반영하지 못할 수 있다는 점도 한계로 지적됐으며, 장기적인 감정적, 인지적 영향에 대한 추가 연구가 필요하다는 결론이 도출됐다.
해당 논문의 원문은 링크에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기