AI 데이터셋 79%가 상업적 활용 불가... LG, 데이터셋 저작권 문제 파악하는 에이전트 '넥서스' 출시 : 다나와 DPG는 내맘을 디피지

Do Not Trust Licenses You See—Dataset Compliance Requires Massive-Scale AI-Powered Lifecycle Tracing

복잡화된 AI 데이터셋의 위험성, 법적 분쟁으로 현실화

LG AI리서치가 발표한 연구 논문에 따르면, AI 트레이닝 데이터셋의 법적 위험성은 단순히 라이선스 조건만으로는 정확하게 평가할 수 없다는 사실이 밝혀졌다. 특히 뉴욕타임스와 OpenAI의 소송(2023), Getty Images와 Stability AI의 소송(2023)와 같은 법적 분쟁들은 AI 개발과 규제 프레임워크 간의 긴장이 고조되고 있음을 보여준다. 아울러 최근 연구(Buick, 2024)는 AI 학습 데이터셋과 관련된 위험성을 강조하며, 책임 있는 AI 데이터 사용을 위한 법적 기준의 필요성을 제기했다.

18개 평가 기준 기반의 NEXUS 프레임워크로 법적 위험 평가 자동화

연구진은 이러한 문제를 해결하기 위해 AI 기반 데이터 준법성 평가 시스템 'NEXUS(넥서스)'를 개발했다. NEXUS는 저작권법, 개인정보보호, 불공정경쟁법을 포함한 주요 법적 측면을 통합하여 18개의 가중 기준에 따라 데이터셋을 평가한다. 각 평가 기준은 1점부터 5점까지의 척도로 평가되며, 5점이 가장 낮은 위험을, 1점이 가장 높은 위험을 나타낸다. 이 시스템은 라이선스 조건뿐만 아니라 데이터 출처, 변환 프로세스, 재배포 경로까지 포괄적으로 분석한다.

데이터셋 재배포의 심각한 법적 위험성: 17,429개 분석 결과

연구팀의 대규모 분석 결과, 3,612개의 대상 데이터셋 중 2,086개(57.8%)가 다층 구조를, 1,526개(42.2%)가 단일 구조를 가지고 있었다. 더욱 우려스러운 점은 25,266건의 파생-직접 종속성 관계 분석 중 8,952건만이 등급 역전 현상이 없었다는 것이다. 이는 엔티티가 법적 위험을 가질 때 62.6%의 확률로 이러한 위험이 재배포된 데이터셋에 명시적으로 반영되지 않는다는 것을 의미한다.

AutoCompliance의 놀라운 효율성: 처리시간 98% 단축, 비용 99% 절감

AutoCompliance는 종속성 찾기에서 81.04%, 라이선스 조건 찾기에서 95.83%의 정확도를 보여, 인간 전문가(각각 64.19%, 87.73%)를 크게 앞섰다. 특히 GCP a2-megagpu-16gpu 노드에서 실행된 AutoCompliance는 53.1초 만에 작업을 완료하고 0.29달러의 비용만 발생한 반면, 인간 전문가는 2,418초가 소요되고 207달러의 비용이 발생했다.

데이터셋 구성의 복잡성: 13,817개 종속성 엔티티 유형 분석

연구팀이 확인한 13,817개의 종속성 엔티티 중 데이터셋 유형이 33.9%로 가장 큰 비중을 차지했다. 소프트웨어/API, AI 모델, 플랫폼 서비스 제공자가 총 25.6%를 차지했으며, 이는 데이터 편집, 번역, 증강 활동이 활발함을 보여준다. 특히 다층 구조 데이터셋의 평균 깊이가 3단계이며, 가장 깊은 경우 16단계에 달하는 것으로 나타나 데이터셋의 복잡성이 매우 높은 것으로 확인되었다.

라이선스 준수 실태: 8,072개 라이선스 분석 결과

17,429개의 고유 엔티티 중 8,072개만이 라이선스 정보를 제공하고 있었다. 이는 AutoCompliance의 한계가 아닌 웹상의 라이선스 정보 부재로 인한 것으로, 인간 전문가도 마주하게 될 동일한 문제다. 이는 데이터, 플랫폼, 도구의 법적이고 윤리적인 사용에 있어 중요한 장벽이 될 수 있음을 시사한다.

데이터셋 라이선스의 3가지 유형과 법적 위험도

연구팀은 데이터셋의 라이선스 조건을 3가지 유형으로 분류했다. Type 1은 데이터를 자유롭게 배포, 사용, 수정, 결합할 수 있는 가장 자유로운 형태의 라이선스다. Type 2는 데이터 사용과 배포가 허용되지만 특정 조건을 충족해야 하는 경우로, 다섯 가지 하위 유형으로 세분화된다. 여기에는 저자, 출처, 저작권, 라이선스 정보 고지 의무(MIT, BSD, CC-BY), 수정 사항 통보 의무(Apache-2.0, GPL 시리즈), 대규모 작업 생성 시 저자 허가 필요(GPL v2.0, LGPL v2.1) 등이 포함된다.

특히 주목할 만한 점은 파생 작업 전체에 동일 라이선스 적용 의무(GPL 시리즈, CC-BY-SA)와 데이터 서브라이선싱만 허용하는 경우(상업용 라이선스)다. Type 3은 데이터 사용은 가능하지만 배포, 수정, 결합, 파생이 금지된 경우로, AI 모델 개발에 매우 제한적인 효용만을 제공한다.

17,429개의 고유 엔티티 중 Type 1이 8,781개(50.3%), Type 2가 2,136개(12.2%), Type 3이 6,512개(37.4%)로 나타났다. Type 2나 Type 3 조건을 준수하지 않은 재배포 사례는 총 9,905건이 발견되었는데, 이 중 8,268건(83.5%)은 재배포가 명시적으로 금지된 경우였고, 1,637건(16.5%)은 라이선스 조건 불일치로 인한 법적 문제가 있는 사례였다.

AI 데이터 거버넌스의 새로운 도전과제

이 연구는 AI 트레이닝 데이터셋의 법적 위험이 표면적인 라이선스 검토만으로는 판단할 수 없으며, 전체 수명주기에 걸친 분석이 필수적이라는 점을 입증했다. 연구진은 이러한 분석의 복잡성과 규모로 인해 AI 에이전트의 활용이 불가피하며, 자동화 없이는 중요한 법적 위험이 대부분 검토되지 않은 채 남게 될 것이라고 경고했다.

해당 기사에 인용된 논문 원문은 링크에서 확인 가능하다.

기사는 클로드 3.5 Sonnet과 챗GPT를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

와 다음 주 출시! '델타룬' 정식판 사전 예약 시작 (1)	게임메카
포켓몬 레전드 Z-A, 10월 16일 정식 출시 (2)	게임메카
스팀 출시되는 서든어택 "익숙하면서도 새로운 느낌 제공" (3)	게임메카
다크플래쉬, 책상 위 감성 최적화 케이스 ‘DY570’ 블랙·화이트 출시 (3)	뉴스탭
레고, 영화 ‘쥬라기 월드: 새로운 시작’ 테마 신제품 선보여… 현실감 살린 공룡 피겨 6종 출시 (3)	뉴스탭
샌디스크, 크리에이터 전용 ‘크리에이터 시리즈’ 스토리지 솔루션 7종 국내 출시 (2)	뉴스탭
츠바키, 두피와 모발을 동시에 케어하는 신제품 ‘헤어 폴 케어 & 리페어’ 출시 (1)	뉴스탭
강화유리·메쉬·LED까지… 프렉탈디자인 ‘노스 XL RC’로 빌드 미학 완성 (2)	뉴스탭
케이스티파이, 맥세이프 호환 프리미엄 ‘스내피’ 그립홀더 출시 (2)	뉴스탭
와이드앵글, 여름 라운드 위한 냉감 테크웨어 ‘W.ICE’ 시리즈 출시 (1)	뉴스탭
비노파라다이스, 노보 작가와 협업한 아트 와인 ‘해피니스·호프’ 한정 출시 (1)	뉴스탭
리안리, 고성능 쿨링과 원목 디자인 결합한 PC케이스 ‘랜쿨 217’ 국내 출시 (2)	뉴스탭
역사상 가장 강력한 성능… ‘올 뉴 디펜더 OCTA’ 국내 공식 출시 (1)	오토헤럴드
이베코, 신선물류 특화 ‘데일리’ 냉장ㆍ냉동차 업그레이드 버전 출시 (1)	오토헤럴드
프리즘코리아 ‘구글 5.0 화이트 삼탠바이미’ 출시 및 할인 행사 (3)	다나와
서린씨앤아이, 후면 커넥터 지원 '프렉탈디자인 노스 XL RC' 출시 (3)	다나와
픽셀아트, 38형 WQHD+ 커브드 화이트 모니터 'PAQ3830W' 출시 (2)	다나와
아이노비아 'INNO3D 지포스 RTX 5060 D7 8GB TWIN X2' 그래픽카드 출시 (2)	다나와
레이저, AI 컨트롤 탑재한 인체공학 마우스 2종 출시 (2)	뉴스탭
풀무원, 스마트 기술 접목한 프리미엄 음식물처리기 출시…주방가전 풀라인업 구축 (1)	뉴스탭
브리타, 1인 가구 위한 미니 정수기 ‘리켈리 블루’ 한국·일본 한정 출시 (1)	뉴스탭
내셔널지오그래픽 어패럴, 냉감과 스타일 모두 잡은 ‘프로즌 팩’ 출시 (1)	뉴스탭
이엠텍아이엔씨 'Palit 지포스 RTX 5060 Ti MIRACLE WHITE' 그래픽카드 출시 (6)	다나와
편식 걱정 끝... 하림 푸디버디 ‘어린이 볶음밥’ 3종 출시 (2)	뉴스탭
스토케, 북유럽 감성 담은 하이체어 ‘클릭’ 신규 색상 출시 (5)	뉴스탭
퀵실버·록시, 도심형 워터라이프 맞춤 ‘인도어 스윔웨어 컬렉션’ 출시 (2)	뉴스탭
스킨1004, 고기능 더마 라인 ‘랩인네이처’ 첫선… 스피큘·센텔라·판테놀 기반 신제품 3종 출시 (1)	뉴스탭
디앤디컴, 초경량 강풍 핸디팬 ‘터보제트’ 출시…감성 컬러·최대 9시간 연속 사용 (3)	뉴스탭
웨스턴디지털, 26TB 라인업으로 M&E·AI 시장 겨냥…초고성능 스토리지 솔루션 대거 출시 (3)	뉴스탭
레노버, 크리에이터부터 사무 환경까지 겨냥한 디스플레이 라인업 강화 (3)	뉴스탭
메르세데스-벤츠, 고하중 운송 특화 프리미엄 트럭 ‘아록스 4153L 10x4’ 2025년형 국내 출시 (1)	뉴스탭
이에프엠네트웍스, 와이파이7 기반 벽·천장형 무선 AP ‘ipTIME Ring-BE3600’ 출시 (2)	뉴스탭
연세유업X두산베어스 두 번째 협업… ‘허슬두 생크림빵’으로 팬심 저격 (1)	뉴스탭
[겜ㅊㅊ] 몬스터 트레인 2 못지 않은 덱빌딩 신작 5선 (2)	게임메카
엘더스크롤 풍 아서왕 전설 ‘테인티드 그레일’ 정식 출시 (4)	게임메카
[오늘의 스팀] 출시 임박, 엘든 링 밤의 통치자 관심 급증 (3)	게임메카
엔비디아, 중국용 저가형 블랙웰 AI 칩 출시… “6월부터 대량 생산” (4)	AI matters
향기와 촉촉함을 동시에…센녹, 레이어링 가능한 고체향수·헤어미스트 선보여 (1)	뉴스탭
올리비아로렌, 여름 휴양지 감성 담은 바캉스룩 제안…한정 수량 컬렉션 출시 (1)	뉴스탭
브리츠, 포터블 블루투스 스피커 ‘BZ-HMM’ 출시… 선명한 사운드와 TWS 지원 (3)	뉴스탭
미쉐린코리아, 연비·내구성 앞세운 ‘X 멀티 에너지’ 트럭 타이어 국내 출시 (1)	뉴스탭
아이더, 냉감 기능 더한 ‘에어리 시어서커 시리즈’ 출시…여름 데일리룩 공략 (1)	뉴스탭
삼성전자, 사계절 공기질 책임지는 '비스포크 AI 에어 콤보' 출시 (1)	뉴스탭
구달, 디즈니 '스티치'와 협업…어성초 라인 여름 한정판 출시 (1)	뉴스탭
통기성과 방수, 디자인까지 잡았다…마운티아, 여름 액티브웨어 신제품 공개 (1)	뉴스탭
시계가 신발로, 스트랩이 타임피스로… 지샥·크록스 이색 컬렉션 출시 (1)	뉴스탭
EFM네트웍스, BE3600급 벽/천장 설치형 무선 AP ‘ipTIME RING-BE3600’ 출시 (7)	다나와
앱코, 컴팩트함과 스타일의 조화 ‘UD20M 미니웨일’ 케이스 출시 (4)	다나와
초대형 5축 프리미엄 카고 ‘2025년형 벤츠 아록스 4153L 10x4’ 출시 (2)	오토헤럴드
고성능 2도어 쿠페 ‘더 뉴 메르세데스-AMG GT 55 4MATIC+’ 출시 (1)	오토헤럴드
[IT신상공개] 긴 머리카락 엉킴없이 흡입하는 ‘다이슨 펜슬백 플러피콘 무선 청소기’ (1)	IT동아
대원씨티에스, NZXT의 새로운 케이스와 쿨링 시스템 출시 (5)	다나와
제이씨현 'UDEA EDGE ED3231HQ 유케어 IPS 홈엔터' 모니터 출시 (5)	다나와
커세어, 새로운 ‘시미터 엘리트 무선SE 마우스’에 엘가토‘스트림덱’ 기능 통합 (7)	다나와
크로스오버존 '27QD166CM QHD iPS USB-C 화이트 Ai 멀티스탠드' 출시 및 이벤트 (5)	다나와
아스크텍 '마이크론 Crucial P510 PCIe Gen5 NVMe M.2 SSD' 출시 (5)	다나와
이순신 등장, 전략게임 신작 'SGS 임진왜란' 스팀 출시 (3)	게임메카
자외선·열·미세먼지 4중 방어…아토팜, 어린이 전용 쿨링 선케어 선보여 (2)	뉴스탭
다이슨, 세계에서 가장 슬림한 무선 청소기 ‘펜슬백’ 공개… 초소형 모터로 기술력 정점 구현 (2)	뉴스탭
론진, 듀얼 타임존 시계 ‘줄루 타임’ 100주년 기념 스페셜 에디션 발표 (1)	뉴스탭
BMW, 슈팅 브레이크 '콘셉트 스피드탑’ 공개... 장인정신과 미래의 공존 (3)	오토헤럴드
대형 SUV 앞세워 '韓 시장 공략' 폭스바겐, 미국산 아틀라스 국내 출시 (1)	오토헤럴드
[신차공개] 현대차 '2026 그랜저·2025 아이오닉 5·코나 일렉트릭' 출시 (3)	IT동아
'판타지 라이프 i : 빙글빙글 용과 시간을 훔치는 소녀' 정식 발매 (1)	게임동아
‘롬', 신규 아이템 합성 시스템 '용광로' 선보여 (1)	게임동아
“홍련이 보스로 등장!” 스텔라블레이드의 니케 DLC, 오는 6월 12일 발매 (2)	게임동아
넷마블, 신작 '왕좌의 게임: 킹스로드' 글로벌 정식출시 (1)	게임동아
넷이즈 '원스 휴먼', 22일 새로운 서브게임 ‘원스 휴먼 레이드존' 최초 공개 (1)	게임동아
'류와 춘리가 종횡무진', 오버워치 2 x 스트리트 파이터 6 콜라보 21일 시작 (1)	게임동아
AMD, 컴퓨텍스 2025서 라데온 그래픽카드 및 라이젠 스레드리퍼 프로세서 공개 (3)	다나와
[IT신상공개] 어떤 기기든 무선으로 즐긴다 ‘JBL 투어 원 M3 스마트 Tx’ (5)	IT동아
종교 콘셉트, 단간론파 제작진 신작 '종천교단' 9월 출시 (4)	게임메카
후지필름, 필름 감성 입은 디지털카메라 'X half' 공개 (3)	뉴스탭
삼천리자전거, 심리스 디자인 전기자전거 ‘팬텀 폴라리스’ 출시 (2)	뉴스탭
테일즈샵 신작 ‘사니양 연구실’ 스팀 체험판 26일 배포 (1)	게임메카
대원씨티에스 'Manli 지포스 RTX 5060' 그래픽카드 출시 (5)	다나와
게이밍을 넘어 워크플로우까지…커세어-엘가토, 스트림덱 기능 내장 마우스 공개 (4)	뉴스탭
스노우피크 어패럴, 여름철 아웃도어·일상 모두 잡은 ‘아쿠아 벤처’ 슈즈 출시 (1)	뉴스탭
협소한 공간도 거뜬…디월트, 전문가용 20V MAX 브러쉬리스 그라인더 선봬 (2)	뉴스탭
시놀로지, 엔터프라이즈급 NVMe 올플래시 스토리지 ‘PAS7700’ 공개 (4)	뉴스탭
도쿄크래프트, 수납과 숙면 모두 잡는 캠핑 신제품 2종 선봬 (1)	뉴스탭
에이수스, RTX 5060/5070 탑재 2025 ROG 및 TUF 게이밍 노트북 선봬 (5)	다나와
아스크텍 '마이크론 Crucial X10' 외장 SSD 출시 (5)	다나와
커세어, DIY 감성과 게이밍 성능 융합 ‘MAKR 75 베어본 키보드 키트’ 및 웹 허브 공개 (4)	다나와
제이씨현시스템, 24형 FHD 144Hz 홈게임 모니터 '유디아 ED2420GX' 출시 (6)	다나와
프린세스 메이커: 예언의 아이들, 스팀 페이지 오픈 (2)	게임메카
포르쉐 전동화의 정점, 700마력 전기 스포츠카 ‘타이칸 GTS’ 국내 출시 (2)	오토헤럴드
파타퐁 정신적 후속작 ‘라타탄’ 6월 스팀 체험판 배포 (4)	게임메카
'PHEV, 전기 모드로 150km' 도요타, 6세대 신형 RAV4 세계 최초 공개 (1)	오토헤럴드
현대차, 2026년형 그랜저 출시... '아너스' 트림 신설로 선택지 확대 (1)	오토헤럴드
뱅앤올룹슨, 샤를 르클레르와 협업한 한정판 헤드폰 ‘베오플레이 H100’ 전 세계 216대 출시 (3)	뉴스탭
120년 전통의 깊은 맛…칭따오, 프리미엄 라거 ‘1903’ 공식 출시 (1)	뉴스탭
벨킨, 갤럭시S25 엣지 맞춤형 액세서리 6종 공개… 초슬림·고속충전·고내구성 강조 (3)	뉴스탭
조텍, GDDR7 탑재 ‘지포스 RTX 5060 AMP’ 출시… 소형 PC부터 AI 워크로드까지 겨냥 (4)	뉴스탭
QHD 해상도와 100Hz 지원하는 32형 IPS 모니터, 비트엠 'Newsync 32QHD IPS100 ZERO 칼라풀' 출시 (3)	뉴스탭
셀바티코, 19세기 프랑스 티타임 담은 ‘떼알라 프랑세즈’ 퍼퓸 핸드 앤 바디 워시 출시 (1)	뉴스탭
가민, 실제 도로 감각 구현한 스마트 인도어 사이클 트레이너 ‘탁스 네오 3M’ 국내 출시 (1)	뉴스탭
파나소닉, 루믹스 S1M2·S1M2E 및 F2.8 줌렌즈 S-E2460 출시… 풀프레임 영상·사진 시장 본격 공략 (1)	뉴스탭
스와치, 한국 문화 담은 플릭플락 ‘러브 프롬 코리아’ 국내 한정 출시 (1)	뉴스탭
스틸시리즈, 차세대 게이밍 마우스 ‘라이벌 3 Gen 2’ 국내 출시… 유무선 전 라인업 강화 (3)	뉴스탭

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI 데이터셋 79%가 상업적 활용 불가... LG, 데이터셋 저작권 문제 파악하는 에이전트 '넥서스' 출시

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI 데이터셋 79%가 상업적 활용 불가... LG, 데이터셋 저작권 문제 파악하는 에이전트 '넥서스' 출시

공유하기

공감/비공감