드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약 : 다나와 DPG는 내맘을 디피지

아랍에미리트 연방대학교 연구팀이 자율비행 드론의 판단 능력을 체계적으로 평가할 수 있는 대규모 테스트 자료 'UAVBench'를 공개했다. 이 자료는 AI가 만든 5만 개의 검증된 비행 상황과 5만 개의 객관식 문제로 구성되어 있으며, 드론 AI의 물리 법칙 이해부터 윤리적 판단까지 10가지 영역을 종합적으로 평가한다. GPT-5, ChatGPT 4o, Gemini 2.5 Flash 등 32개 최신 AI 모델을 테스트한 결과, 날씨 인식이나 규칙 이해에서는 강점을 보였지만 여러 드론이 협력하는 상황이나 에너지 관리, 윤리적 의사결정에서는 여전히 한계가 드러났다.

AI가 만든 5만 개 비행 상황... 다단계 검증으로 현실적 상황만 선별된다

UAVBench는 드론 비행 상황을 대규모로 생성하기 위해 임무 종류, 비행 공간, 날씨, 드론 기종, 탑재 장비 등의 분류 체계를 활용해 다양한 시나리오를 자동으로 만들어낸다. 각 시나리오 데이터에는 시뮬레이션 조건, 드론 설정, 환경 요소, 임무 목표, 안전 제약 등이 구조화되어 포함된다.

드론 설정 단계에서는 에너지 소비 계산이 중심 역할을 한다. 공중 정지 시 필요한 전력, 속도에 따른 공기 저항 증가, 조종간 움직임에 필요한 에너지를 모두 합산하고 배터리 용량과 예비 에너지를 고려해 현실적 비행이 가능한지 검증한다. 탑재 장비는 200종 이상의 표준 센서 및 장비(카메라, 열화상, 라이다, 통신 등)가 각기 무게, 전력 소비, 공기 저항 특성을 반영하여 시뮬레이션된다.

모든 자동 생성 시나리오는 ▲필수 정보 누락 ▲임무-기체-환경 논리 불일치 ▲허용된 비행 공간 및 고도 체크 ▲다수 기체의 안전 거리 및 충돌 시간 검증을 포함하는 네 단계 이상의 다층 검증 과정을 거쳐, 구조·운영·물리·안전이 모두 확보된 현실적 비행 상황만 최종 데이터셋에 포함된다. 검증된 상황에는 위험 수준(0~3단계)과 안전 범주 태그(날씨, 항법, 에너지, 충돌 회피 등)가 자동으로 붙는다.

10가지 사고 유형으로 드론 AI 능력 다각도 평가... 윤리 문제는 7지선다

UAVBench_MCQ는 검증된 상황을 10가지 사고 유형의 5만 개 객관식 문제로 변환한 평가 자료다. 사고 유형은 공기역학 및 물리, 경로 계획, 규정 준수, 환경 및 센서 융합, 다수 드론 협력, 사이버 보안, 에너지 및 자원 관리, 윤리 및 안전 의사결정, 시스템 비교, 통합 판단으로 구성된다.

문제 생성 과정에서는 엄격한 제약이 적용된다. 모든 질문은 원본 상황 데이터에 포함된 정보만을 근거로 하며, 질문 길이는 28단어 이하, 선택지 길이는 14단어 이하로 제한된다. 윤리 및 안전 의사결정 평가의 경우 7개 선택지를 사용해 인간 안전을 최우선으로 하는 윤리적 선택을 명시적으로 포함한다. 나머지 사고 유형은 일반적으로 4지선다 형식을 따른다.

데이터 통계를 보면 규정 준수 문제가 6,363개로 가장 많고, 에너지 관리가 5,549개, 환경 및 센서 융합이 5,259개 순이다. 질문 길이는 대부분 15~25단어 사이에 분포하며, 선택지는 '하강', '상승', '증가', '전환', '사용' 등의 동사로 시작하여 드론 비행 조작과 의사결정의 특성을 반영한다.

중국 AI 모델이 종합 1위... 하지만 윤리와 협력은 모든 모델이 어려워해

32개 AI 모델 평가 결과, 중국 알리바바의 Qwen3 235B 모델이 평균 정확도 83.5%, 균형 점수 0.74로 1위를 차지했다. 이어 OpenAI의 ChatGPT 4o(80.3%, 0.68), GPT-5 Chat(80.2%, 0.68), Qwen3 Max(79.8%, 0.68) 순으로 나타났다.

인식 및 물리 세계 판단 부문에서 Qwen3 235B는 공기역학 82.5%, 환경 센서 융합 97.0%로 평균 89.8%를 기록했다. 거의 모든 모델이 환경 및 센서 융합 과제에서 공기역학 과제보다 높은 정확도를 보였는데, 이는 현재 AI가 감각 정보 통합에는 강하지만 동적 물리 법칙 추론에는 상대적으로 약함을 보여준다.

계획 및 자원 판단 부문에서 Qwen3 235B는 경로 계획 81.5%, 다수 드론 협력 76.5%, 에너지 관리 71.5%로 평균 76.5%를 달성했으나, 최고 성능 모델도 다수 드론 협력과 에너지 관리에서는 80%를 넘지 못했다. 이는 여러 드론이 함께 작동하며 에너지를 효율적으로 쓰는 판단이 여전히 어렵다는 것을 보여준다.

규정, 윤리 및 보안 판단 부문에서는 모든 모델이 사이버 보안 과제(95~98%)에서 매우 높은 정확도를 보인 반면, 규정 준수와 윤리 및 안전 의사결정 과제에서는 상대적으로 낮은 성능을 기록했다. Qwen3 235B는 규정 준수 76.0%, 윤리 의사결정 75.5%, 사이버 보안 96.5%로 평균 82.7%를 달성했다. 이는 AI가 기술적 대응은 잘 인식하지만, 법적 규정 준수나 불확실한 상황에서의 윤리적 선택에서는 여전히 어려움을 겪고 있음을 나타낸다.

시스템 비교 및 통합 판단 부문에서 Qwen3 235B는 시스템 비교 95.5%, 통합 판단 83.0%로 평균 89.3%를 기록했으나, 서로 다른 판단 영역을 하나로 통합하는 것은 여전히 어려운 과제로 남아 있다.

FAQ ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. UAVBench는 어떤 종류의 드론 임무를 평가할 수 있나요?

A: UAVBench는 시설물 점검, 배송, 정찰, 수색 구조, 여러 대 협력, 안전 중요 상황, 화재·유해물질 대응, 해양 작전 등 다양한 임무를 포함합니다. 각 상황은 도심, 산악, 사막, 지하 공간 등 다양한 환경과 비, 바람, 안개, 결빙, 번개 등 복잡한 날씨를 반영하며, 회전날개, 고정날개, 하이브리드 드론의 물리적 특성을 모두 고려합니다.

Q2. 왜 대부분의 AI 모델이 다수 드론 협력과 윤리 판단에서 낮은 점수를 받았나요?

A: 여러 대의 드론이 함께 작동할 때는 서로 부딪히지 않으면서 임무를 나눠야 하므로 복잡한 협력 판단이 필요합니다. 윤리 판단은 인간 안전, 법적 규정, 자원 제약 등 여러 가치를 동시에 고려해야 합니다. 현재 AI는 한 대의 드론이 날아가는 물리적 계산에는 강하지만, 복수의 목표를 통합하고 불확실한 상황에서 도덕적 선택을 하는 능력은 아직 부족합니다.

Q3. 균형 점수는 일반 정확도와 무엇이 다른가요?

A: 일반 정확도는 전체 문제 중 몇 개를 맞혔는지만 보여주지만, 균형 점수는 10가지 사고 유형별 정확도를 종합한 후 편차에 따라 감점합니다. 예를 들어 한 모델이 물리 계산에서는 95%를 맞히지만 윤리 판단에서는 50%밖에 못 맞힌다면, 평균은 높아도 균형 점수는 낮게 나옵니다. 안전이 중요한 드론 AI는 특정 영역에 치우치지 않고 모든 상황에서 고르게 잘 판단해야 하므로, 균형 점수가 더 신뢰할 수 있는 지표가 됩니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: UAVBench: An Open Benchmark Dataset for Autonomous and Agentic AI UAV Systems via LLM-Generated Flight Scenarios

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

입소문쇼핑	[네이버] 터틀비치 블랙프라이데이 / 게이밍 마우스,키보드,헤드셋,컨트롤러 최대76% 특가!	L7 (주)오세요
일반뉴스	모바일 '불가능'·PC '실망', 두 마리 모두 놓친 아이온2	게임메카
일반뉴스	[오늘의 스팀] '떡상'한 디즈니 드림라이트 밸리, 한국어는?	게임메카
일반뉴스	출시 2일 만에 PvP ‘뉴비 제초’ 문제 터진 아이온2	게임메카
기획뉴스	[순정남] '대책 없는 쓰레기'지만, 평가는 좋은 악당 TOP 5	게임메카
기획뉴스	"올해 AI 승자는 구글?" 성능·사용성 다 잡은 '제미나이 3' 등판	IT동아
전문가 리뷰	써멀테이크 View 380 WS ARGB BLACK : 나무를 곁들인 듀얼 챔버 케이스!	쿨엔조이
취미 상품포럼	이상훈TV의 [HotToy] 감탄사 연발! 터미네이터 2.0 전종을 가져와 봤습니다 영상	L20 느낌하나
ㄷㅂㄷ	[AI되니] 스팀 머신 완전 분석: PS5·Xbox·조립PC 시장까지 흔들 준비되었나? 성능·가격·활용도 총정리	AI matters
취미 상품포럼	스팀 신작 메이드 서바이벌 4일간 해보면서 (1)	L3 IDZZANG930
컴퓨터 상품포럼	잇섭님의 드디어 정상화 되었다!? iOS 베타 업데이트로 해결된 아이폰 17 시리즈 셀룰러 이슈 3탄 영상	L20 느낌하나
체험단	싸이번 SD600 도미닉 RGB 블랙 가성비 PC케이스 리뷰!!!	L9 신형컴터
컴퓨터 상품포럼	힉스 HICS 채널의 '무한' 가능성의 시작! 갤럭시 XR 첫인상 초간단 리뷰 [Galaxy XR] 영상	L20 느낌하나
전문가 리뷰	GIGABYTE 라데온 RX 9060 XT Gaming OC ICE D6 16GB 피씨디렉트: 새하얀 화이트 감성의 메인스트림 그래픽카드	쿨엔조이
자유게시판	요즘 sff 컴퓨터를 자주 보게 되네요.	L10 aibici01
일반뉴스	'길드워 리포지드' 12월 3일 출시, 한국어 지원은 없다	게임메카
컴퓨터 상품포럼	JN테크리뷰의 노트북 구매 후 언박싱부터 셀프 업그레이드, 윈도우 설치까지 영상	L20 느낌하나
자유게시판	감기 조심하세요	L14 otosan
입소문쇼핑	인기순위 상위권의 디월트 DCB184(5.0Ah), 저렴해졌어요	쇼핑봇
자유게시판	딱 한 번만 볼 수 있는 착시	L20 야거커티스
자유게시판	익스트림 스포츠 1인칭 시점	L20 야거커티스
입소문쇼핑	롯데ON 스퀘어 버클 리버서블 레더 벨트_132873 (298,810/무료배송) 구매찬스	쇼핑봇
입소문쇼핑	인기순위 상위권의 삼성전자 갤럭시 버즈 FE SM-R400N(정품), 저렴해졌어요	쇼핑봇
소비자사용기	크로스오버 32UCA9 모니터! 가성비를 능가하는 [가 성! 성! 비] 일단 사고 봅시다.	L1 원자구조
자유게시판	항상 느끼지만, 컴터는 필요할 때 사는게 최고인듯요 (2)	L1 실내정숙1
입소문쇼핑	[네이버]1kg 미만 초경량 무게를 자랑하는 젠북 A14, 사은품 받도 꼭 챙기세요!	L7 TU1148
자유게시판	추위가 좀 풀렸네요 (2)	L17 HomeRun
일반뉴스	현대차, 중국 기업사회책임 발전지수 평가 10년 연속 자동차 기업 부문 1위	오토헤럴드
일반뉴스	웨이모·테슬라, 미국 전역 ‘무인 로보택시 서비스 확대' 치열한 경쟁	오토헤럴드
일반뉴스	[모빌리티 인사이트] 유럽에서 난리난 '인스터' 獨, 소형 전기차 판매 1위	오토헤럴드
유머게시판	쇼츠에 나온 아재개그	L13 컴좀바꿔줘
자유게시판	목요일 오후네요 (2)	L20 아모스1
취미 상품포럼	인슈라오디드 플레이 중이거든요 (1)	L5 꺄아울
입소문쇼핑	알리 블랙프라이데이 NZXT 특가!팬·케이스 인기제품 총출동 최대 22%(11/20~12/3)	L8 (주)하이케이넷
일반뉴스	바람의나라 클래식’ 신규 지역 ‘환상의섬’ 업데이트 실시	게임동아
일반뉴스	‘던파 모바일’ 최고 레벨 확장 업데이트 진행	게임동아
일반뉴스	'세나 리버스', 신규 전설 등급 코스튬 '아이돌 연희' 출시	게임동아
일반뉴스	‘3on3 프리스타일’ 신규 맵 ‘카와-블래지온’ 업데이트	게임동아
일반뉴스	넷마블, '일곱 개의 대죄' 한국·일본 서비스 6.5주년 기념 업데이트	게임동아
체험단	체리 MW5500 가벼운 무선 게이밍 마우스 추천, 블루투스 지원 (1)	L5 애처가임
자유게시판	오늘도 뜨아와 아아 두 잔을 때려 부으며 버텨 봅니다. (1)	L20 느낌하나
일반뉴스	‘2025 아시아 이스포츠 대회’ 개최... 한국 롤 국가대표, 첫 경기에서 중국과 맞붙는다	게임동아
전문가 리뷰	강렬한 게이밍 경험을 제공할 18인치 하이엔드 노트북, MSI 벡터 A18 HX A9WIG-R9 QHD+	케이벤치
일반뉴스	‘마비노기’, ‘에린’에 반한 ‘잔망루피’와 컬래버	게임동아
일반뉴스	지스타에서 AGF로. 서브컬쳐 열기 계속 이어진다	게임동아
일반뉴스	“따님, 어머님을 제게 주십시오!” 주연 이긴 조연 캐릭터들	게임동아
일반뉴스	유니티, 2K와 손 잡았다... ‘PGA 투어 2K25’ 스위치2 버전 출시 예정	게임동아
일반뉴스	메이플, ‘원펀맨’ 컬래버 이벤트 실시	게임동아
일반뉴스	‘바이오하자드 서바이벌 유닛’ 글로벌 100만 다운로드 돌파	게임동아
일반뉴스	‘대항해시대 오리진, 신규’ 콘텐츠 업데이트 기념 이벤트 진행	게임동아
체험단	마이크로닉스 COOLMAX 크리스탈 블랙 케이스 후기! PC케이스 언박싱부터 케이스추천까지 (1)	L6 혀니아부지
일반뉴스	플레이위드코리아의 신작 '드래곤 플라이트2' 사전예약 100만 돌파	게임동아
일반뉴스	‘마피아: 올드 컨트리’. 신규 무료 DLC ‘자유 주행’ 배포	게임동아
일반뉴스	'미우뮤', '하봄' 코스프레로 지스타 화제작된 유비스 '루나, 스팀 정식 출시	게임동아
일반뉴스	5주년 맞은 위메이드 ‘미르4’, 대규모 이벤트와 업데이트 선보인다	게임동아
일반뉴스	넷마블 MMORPG '레이븐2', 신규 부스팅 월드 '레전드' 추가	게임동아
일반뉴스	넥써쓰, 방치형 RPG '어메이징 컬티베이션' 오는 26일 온보딩	게임동아
일반뉴스	배틀그라운드의 아버지... ‘플레이어언노운’의 생존 게임 ‘프롤로그: 고 웨이백!’ 출시된다	게임동아
일반뉴스	괴수 8호 THE GAME, 5성 풍속성 캐릭터 '[발키리] 시노미야 히카리' 공개	게임동아
일반뉴스	“링크와 젤다가 살아 움직인다!” 젤다의 전설 실사화 배우 등장... 첫 스틸컷 공개	게임동아
일반뉴스	“이거 우리 폭탄이잖아~!” 새 예고편 선보인 델타포스, 러스트 자산 도용 적발	게임동아
일반뉴스	드림에이지 '아키텍트', 인터 서버 콘텐츠 본격화 예고	게임동아
푸드 상품포럼	[먹거리 소개 #2837] 아메리칸차이니즈 전문점 차알의 차우멘 (1)	L20 느낌하나
입소문쇼핑	[네이버]15.6인치 1.11kg 가벼운 노트북 (최종 혜택가 1,176,860원)	L7 (주)코인비엠에스
일반뉴스	매드엔진, '콘진원 창의인재동반사업' 인디 개발사 견학 프로그램 진행	게임동아
ㄷㅂㄷ	정밀 전자수리에 필요한 공구 다~ 때려넣었습니다!..?	공구왕황부장
기획뉴스	시력 잃은 노인, 전자 눈으로 책을 읽다	과학향기
ㄷㅂㄷ	[리뷰] Ulanzi A200 MINI MIC 실사용 리뷰6g 초소형 무선 마이크 음질 테스트 스마트 노이즈 리덕션 야외 소음 환경 촬영까지브이로그 스트리밍 추천 & 블프 할인	진블로그
전문가 리뷰	xBoom Buds Plus, 엘지 엑스붐 버즈 플러스 ANC 이어폰 측정	0db
취미 상품포럼	[방방곡곡 #859] 가산디지털단지 카페 INC COFFEE	L20 느낌하나
취미 상품포럼	레이븐2 건슬리어 육성하고 있음 (1)	L3 라마2168
기획뉴스	급변하는 AI 혁신과 빅데이터 시대에 대응, 에이수스 NVIDIA와 ‘AI 솔루션 데이 2025’ 세미나 진행	블루프레임
전문가 리뷰	Buds3 FE, 삼성 갤럭시 버즈3 FE ANC 이어폰 측정	0db
전문가 리뷰	UGREEN DXP4800 Plus 나스	0db
기획뉴스	강남에 등장한 에이서×인텔 AI 팝업스토어 [가보니] 김홍철 에이서코리아 부장에게 듣는 브랜드 전략	위클리포스트
ㄷㅂㄷ	노련함이 묻어나는 - MANLI 지포스 RTX 5070 Ti Polar Fox OC	샵다나와
ㄷㅂㄷ	더하기 빼기가 요상하다;; 갤럭시 A17 LTE 개봉기	UnderKG
ㄷㅂㄷ	Noctua NHD15 G2 + NFA14x25 G2 chromax.black – Sleek & Clean Blackout PC Build	PC SNAP
ㄷㅂㄷ	하림 마제소바 라면 신제품 리뷰	맛상무
전문가 리뷰	LG전자 울트라기어 32GX850A : 진입장벽을 낮춘 4K OLED, 더 가까워진 선택지	쿨엔조이
전문가 리뷰	2개의 SFT 포트 지원 기가비트 스위치 허브, EFM ipTIME H8008S2	브레인박스
ㄷㅂㄷ	몰락하는 포르쉐 왕국 "믿기 힘든 충격적인 결과" 영업 이익 99% 감소	오토기어
체험단	몬스타기어 가츠 X108 SLIM PRO 체험 후기 (퀘이사존 & 몬스타기어 제공) (1)	L8 rlagudju
입소문쇼핑	[네이버]고생한 수험생들을 위한 12분기 연속 1위 한 hp 게이밍 노트북 추천	L8 SRISE
일반뉴스	유니티·2K 대형 파트너십 성사… PGA 투어 2K25, 스위치2로 ‘사실감 극대화’	뉴스탭
일반뉴스	IT OLED, 4년간 두 배 성장… 삼성·中 패널업체 ‘8.6G 전쟁’ 본격화	뉴스탭
신상품뉴스	45도 패널이 바람길을 바꿨다… 마이크로닉스 ‘APNX V1’ 미들타워 케이스 출시	뉴스탭
일반뉴스	“명품은 이제 입으로 즐긴다” 럭셔리업계, 미식 전쟁 돌입	뉴스탭
입소문쇼핑	연말 센스 있는 선물 = ROG XBOX ALLY X 공식!	L7 TU1148
입소문쇼핑	인기순위 상위권의 프로젝트엠 남성 럭스덕다운 후드숏점퍼 EYD4JD1500, 저렴해졌어요	쇼핑봇
입소문쇼핑	PXG 0311 블랙옵스 드라이버(정품) (499,000/무료배송) 구매찬스	쇼핑봇
기획뉴스	환율 상승 영향 받는 PC 시장, 정품 CPU vs 비정품 CPU 이제는 정품 CPU 사야할 때	블루프레임
일반뉴스	기아 EV5, 유로 NCAP 최고 등급 획득... 어린이 탑승자 보호 최고점	오토헤럴드
일반뉴스	폴스타 "똑똑해진다" 업계 최초 차량 내 실시간 생성형 AI '제미니' 탑재	오토헤럴드
일반뉴스	현대오토에버 내비 "목적지가 오른쪽에 있습니다"로 끝나지 않는다	오토헤럴드
신상품뉴스	포르쉐, 1156마력 괴물 전기 SUV '카이엔 일렉트릭' 공개... 내년 韓 출시	오토헤럴드
일반뉴스	기아 더 PV5, 심사위원 전원 일치 국내 최초 ‘2026 세계 올해의 밴’ 수상	오토헤럴드
일반뉴스	포드, PHEV 배터리 결함으로 ‘리콜 다시 리콜’… 2만여 대 추가 조치	오토헤럴드
기획뉴스	포르쉐 카이엔 일렉트릭 '끈질긴 고성능'을 가능케 한 하이라이트 5선	오토헤럴드
일반뉴스	테슬라, 전기차 오너 기피 브랜드 1위... 머스크 때문에 100만대 손실	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약

관련 카테고리

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약

공유하기

공감/비공감

관련 카테고리