'개인정보? 기억이 안 나네'...구글, 민감정보 기억 못하는 '볼트젬마(VaultGemma)' 공개 : 다나와 DPG는 내맘을 디피지

출처 : 구글 딥마인드 블로그

9월 12일(현지시간) 구글 딥마인드가 자사 블로그를 통해 새로운 대규모 언어 모델(LLM) '볼트젬마(VaultGemma)를 공개했다. 이 모델은 처음부터 차등 개인정보 보호(Differential Privacy, 이하 DP) 기법으로 학습된 공개 모델로, 파라미터 수는 10억 개에 달한다.

AI가 대중화됨에 따라 개인정보 보호를 기반으로 한 모델 개발은 필수 과제로 떠올랐다. DP는 학습 과정에서 데이터가 직접 노출되지 않도록 특정한 무작위 잡음을 추가하는 방식으로, 개인 정보가 모델에 원본 그대로 저장되는 것을 방지한다. 하지만 이 기법을 대규모 언어 모델에 적용할 경우 학습 안정성 저하, 대규모 배치 크기 필요, 높은 연산 비용 등 여러 가지 한계가 발생한다.

연구팀은 모델 크기·배치 크기·학습 반복 수 등에 따른 성능 변화를 정량적으로 연구하여 특히 “노이즈-배치 비율(noise-batch ratio)”이라는 지표가 DP 학습 성능을 결정짓는 핵심 요인임을 확인했다. 이를 통해 주어진 연산·데이터·프라이버시 예산 내에서 최적의 학습 설정을 찾을 수 있는 기준을 찾아냈고 DP 환경에서는 대규모 모델보다 작은 모델을 더 큰 배치 크기로 학습하는 것이 효율적이라는 점이 드러났다.

연구팀은 모델이 학습 데이터의 특정 문장을 그대로 기억하지 않는지 검증했으며, 결과적으로 학습 데이터에 대한 직접적인 기억은 관찰되지 않았다.

해당 모델은 10억 파라미터 규모로, 지금까지 공개된 DP 기반 모델 가운데 최대 크기를 자랑한다. 연구팀은 DP 학습의 핵심 기법인 '푸아송 샘플링'을 적용하면서 발생한 난제를 해결하기 위해 Scalable DP-SGD 방식을 도입, 효율적이면서도 강력한 개인정보 보호 성능을 확보했다.

실험 결과 '볼트젬마'의 최종 학습 손실은 연구팀이 예측한 값과 거의 일치해 이론적 모델의 타당성이 입증됐다.

또한 여러 표준 학술 벤치마크(HellaSwag, BoolQ, PIQA, SocialIQA, TriviaQA, ARC 등)에서 비(非)DP 모델과 비교했을 때, 약 5년 전 수준의 GPT-2 모델과 유사한 성능을 보였다.

이는 여전히 성능 격차가 존재함을 시사하지만, 연구 성과가 그 격차를 줄여나가는 중요한 단계임을 의미한다.

'볼트젬마'는 강력하면서도 개인정보 보호를 내재화한 AI 개발로 가는 과정에서 중요한 진전을 보여준다. 연구팀은 “DP 모델과 비DP 모델 간 성능 격차가 아직 존재하지만, 메커니즘 설계 연구를 통해 체계적으로 줄여갈 수 있다”며 “이번 모델과 연구가 차세대 안전하고 책임 있는 AI 개발의 토대가 될 것”이라고 밝혔다.

글 / 김지훈 news@cowave.kr

AI 대부들의 진짜 속마음... 챗GPT 이후 기술 우선주의 vs 신중론 대립	AI matters
“AI는 도우미일 때만 환영"... 2011~2025년까지 AI에 대한 대중 인식 연구	AI matters
쥐의 ‘뇌’ 학습한 AI, 인간 행동까지 예측한다... 과연 인간의 뇌를 이해한 걸까?	AI matters
AI가 만든 정치 성향별 가짜 뉴스, 기존 탐지 프로그램들 절반 수준으로 성능 저하시켜	AI matters
챗GPT 등 AI 모델, 53% 확률로 실험 의도 간파... 사회 실험 결과 신뢰도 ‘빨간불’	AI matters
AI뉴스 ICPC 만점, Grok 4 Fast, AI_TOP_100, Figma AI, 구글 AP2, WanAnimate, Meta Connect 등 동영상 있음	조코딩 JoCoding
구글, 저가형 ‘AI 플러스’ 요금제 40여 개국으로 확대...챗GPT와 신흥국 시장 확대 경쟁 중	다나와
챗GPT로 만든 가짜 스마트폰 사용 데이터, 실제와 얼마나 비슷할까?	AI matters
"AI가 쥐만 못해?"… 쥐의 뇌 활동 데이터로 AI 시각 능력 평가하는 새 벤치마크 등장	AI matters
AI가 인간 가치관 바꿀 수도... 영국 대학 연구진 "지속 관리 필요"	AI matters
AI 답변 속 광고 심는 기술 vs 탐지 기술… AI 챗봇 답변 속 숨은 광고, 알아차릴 수 있을까?	AI matters
"예측 가능한 글만 살아남는다"... AI 검색이 웹사이트를 선택하는 기준	AI matters
"AI 도구 도입하면 끝?" 착각하는 회사들... 구글이 알려주는 AI 도입 성공 전략 7가지	AI matters
예시 10개 줘도 소용없다... AI가 일반인 문체 흉내내지 못하는 진짜 이유	AI matters
AI 비서, 정말 쓸모 있을까?… AI 에이전트 활용 방해하는 5가지 장벽	AI matters
‘연간 1000억달러 손실’… 생성형 AI 비용 90% 급락하며 가짜정보 홍수	AI matters
대학생들이 증명한 AI 교육 효과... 챗봇 활용 학생 100% "학습 향상" 체감	AI matters
메타·MS·구글 XR 기기 보안 테스트해봤더니… 가짜 광고·잘못된 지시 등 취약점 발견	AI matters
기업 64%가 AI로 친환경 추진, 하지만 환경 영향 우려는 더 커져	AI matters
기업 임원 98%가 IT팀 몰래 클라우드·AI 서비스 구매… 비용-보안 문제 야기한다	AI matters
글로벌 은행들의 AI 연구 투자 7배 급증... "선두 5개 은행이 65% 장악"	AI matters
"5분이면 완성"... 가상 인플루언서 제작하는 AI 시스템 등장	AI matters
한국, ‘AI 아시아 허브’ 비전 가속화…엔터테인먼트와의 융합까지 확대 (1)	다나와
MIT, AI 기반 신소재 설계 도구 ‘SCIGEN’ 공개…차세대 전자·광학 혁신 이끈다	다나와
챗GPT 추천받는 기업 vs 외면받는 기업, 그 차이는?	AI matters
"우연 의존서 체계적 설계로"… 생성형 AI, 반도체 소재 발견-개발 가속화	AI matters
자동차 기업 77%, “AI 없으면 경쟁력 없다”… 이제 자동차가 개인비서 된다 (1)	AI matters
AI 생성 글, 지금보다 수준 높아지면 구분 불가능… 수학적 증명 나왔다 (1)	AI matters
유튜브 종교 영상, 댓글 190만개 분석했더니... ‘AI 사용’이 시청자 반응 예측에 가장 큰 영향	AI matters
구글, 2025 임팩트 리포트 공개… AI 기술로 홍수 예측·농업 혁신 등 사회 문제 해결	AI matters
WTO, “AI가 글로벌 부의 격차 심화시킬 수 있다” 경고 (1)	다나와
싱가포르, 3년간 로컬 기업 2,000곳 AI 역량 강화	다나와
아시아 국가들, ‘소버린 기반 AI’ 경쟁 본격화…효과성에 대한 우려도	다나와
구글 딥마인드 CEO, “현재의 AI를 PhD급 지능이라 부르는 것은 과장”	다나와
중국, NVIDIA 고급 그래픽 칩 구매 금지 조치	다나와
'슈퍼 커넥션 탄생'... 엔비디아, 인텔에 50억 달러 투자… 차세대 AI·PC 칩 공동 개발 예정	다나와
美 상원의원 테드 크루즈, ‘AI 규제 샌드박스’ 법안 제안	다나와
Arm, 차세대 모바일 AI 칩 아키텍처 ‘Lumex’ 발표	다나와
AI 기반 사이버 공격 가능성 경고…“제로데이 AI 공격” 우려 확산	다나와
미국 FTC, 주요 AI 챗봇 업체들 대상 조사 착수	다나와
Meta, 언론사들과 AI 뉴스 콘텐츠 라이선싱 협상…미디어-빅테크 관계 재편되나	다나와
영국-미국, 3,500억 달러 규모 ‘Tech Prosperity Deal’ 체결	다나와
CrowdStrike, AI 보안 기업 Pangea Cyber 2억6천만 달러에 인수	다나와
워싱턴 D.C. ‘Axios AI+ 서밋’, AI 경쟁과 규제 화두로 부상	다나와
Meta, ‘Superintelligence AI Lab’서 차세대 파운데이션 모델 연구 진행	다나와
AMD CEO 리사 수, “AI 붐은 이제 시작…앞으로 10년이 핵심”	다나와
Anthropic CEO 다리오 아모데이, “AI, 화이트칼라 일자리 대체 가능성 크다”	다나와
미국 하원, Microsoft Copilot AI 도입 추진 (2)	다나와
구글 딥마인드, 국제 프로그래밍 대회서 “역사적 성과” (1)	다나와
서울AI재단, 도쿄도와 도시AI 기반 디지털 혁신 협력 본격화	AI matters
당구게임으로 진로 찾기? 게임하듯 진로 탐색하는 AI 시스템의 등장	AI matters
챗GPT로 기사 쓰는 기자들, 대부분 사용 사실 숨겨… 中 기자 27명이 털어놓은 진실	AI matters
"AI와 작업했는데 내가 만든 줄 착각"... 일주일 만에 출처 기억률 37% 하락	AI matters
메타, AI글래스 '메타 레이-밴 디스플레이' 발표....가격은 799달러 (4)	다나와
사람이 만든 음악-AI로 만든 음악, 구분 가능할까? 98% 정확도로 구별하는 기술 등장	AI matters
운전면허 시험도 이제 AI 과외 시대... 내 약점 골라 시험 문제 만들어준다	AI matters
'바나나야, 고마워!' 구글 제미나이 美 앱스토어 1위 등극 (1)	다나와
'청소년의 프라이버시보다 안전이 최우선' 오픈AI, 새롭게 바뀐 청소년 사용자 원칙 공개	다나와
AI뉴스 새로운 이미지 1등, MCP 지원하는 ChatGPT 개발자 모드, 클로드 엑셀·PPT 생성, Veo 3 업데이트 등 (1) 동영상 있음	조코딩 JoCoding
[위클리AI] 마이크로소프트·오픈AI, 2030년까지 파트너십 유지 외	IT동아
소비재 기업 90% 'AI 에이전트 필수'... 2년 내 경쟁력 좌우할 핵심 기술	AI matters
AI 도구 100개 써도 소용없다... 성공하는 기업들이 선택한 단 하나의 조건	AI matters
“이 사진이 진짜라고요?”… AI 딥페이크에 속는 건 인간만이 아니다	AI matters
8월 AI 시장 데이터 분석했더니 ‘챗GPT 압도적’… 시밀러웹 보고서	AI matters
논문에 AI 쓰면 손해? 득? 23만 편 분석해 봤더니… ‘활용 많은 동양 vs 인용 혜택 큰 서양’	AI matters
AI가 벌리는 글로벌 경제 격차... 앤트로픽 경제 보고서 "선진국은 협업, 개도국은 대체"	AI matters
구글·MIT 연구진이 '인간 vs AI' 협상 능력 비교해봤더니… 수학 기반 AI가 가장 성과 좋아	AI matters
벼 사진 찍으면 질병 이름-관리 방법 알려준다… 농작물 질병 경고 AI 시스템의 등장	AI matters
"요청도 안 했는데"... 적극적인 AI일수록 사용자가 외면하는 이유	AI matters
"경력 과장하면 AI가 찾는다"... AI가 이력서 속 거짓말 90% 잡아낸다 (1)	AI matters
로봇이 실험하고 AI가 논문 쓴다... 과학 연구에 AI를 도입하면 생기는 일 (1)	AI matters
알바니아, 부패 척결 위해 세계 최초로 'AI 장관' 임명 (3)	다나와
SKT-오픈AI, ‘ChatGPT 플러스’ 구독 프로모션 예정...'1개월 유료 구독 시 2개월 무료 혜택'	다나와
'개인정보? 기억이 안 나네'...구글, 민감정보 기억 못하는 '볼트젬마(VaultGemma)' 공개	다나와
피플 CEO “구글은 ‘나쁜 행위자(bad actor)’…우리 콘텐츠 훔쳐간다”	다나와
오픈AI CFO “올해 매출 전년 대비 4배 성장”	AI matters
클로드, 업무 맥락 기억하는 '메모리' 기능 출시… “팀 협업에 효과적”	AI matters
오픈AI, MS와 새로운 파트너십 협상… "공익 기업 전환 추진"	AI matters
FTC, 메타·오픈AI 등 'AI 챗봇 동반자' 기능 안전성 조사 착수... “아동·청소년 보호가 최우선”	AI matters
‘주가 사상 최고치 경신’… SK하이닉스, 세계 최초 차세대 AI 메모리 'HBM4' 양산 체제 구축	AI matters
AI 투자 205조 시대, 글로벌 AI 분야 투자 유치 현황 분석 보고서	AI matters
AI vs 인간 인플루언서, 수익 차이 무려 46배… 2025년 마케팅 트렌드	AI matters
"기대보다 성과 떨어져도"... 재무팀에서 AI 투자 멈추지 않는 이유	AI matters
전 세계 스마트폰 사용자, 1인당 50번-하루 8천만 시간 AI 앱 사용한다	AI matters
금융 업계 AI 성장 이끄는 기업 5곳 어딘가 봤더니... '영역별 전문화 가속'	AI matters
챗GPT로 쓴 글로 사과하면 진정성 의심받는다? 카네기 멜런대 충격 연구 결과	AI matters
오픈 AI 코리아 공식 출범... 한국 생태계 침투 가속화 / 25년 9월 둘째 주 [주간 AI 뉴스] 동영상 있음	AI matters
구글·메타 출신들이 몰려든 AI 에이전트 시장… 향후 시장 전망은? (1)	AI matters
AI 분신에게 SNS 맡기면 생기는 일... 소셜미디어 클론 시대의 인간관계 (3)	AI matters
AI가 만든 동화, 여자아이에겐 외모 묘사 남자아이에겐 모험 스토리 많이 써	AI matters
"눈치 있는 AI 등장"... 불안한 사람엔 따뜻하게, 토론땐 논리적으로 대화한다	AI matters
휠체어 사용자를 위한 내비게이션 나올까… 챗GPT 활용한 횡단보도 탐지 연구	AI matters
유튜브, 다국어 더빙 기능 전 세계 크리에이터에 확대한다 (1)	다나와
아마존, 메타에 맞설 소비자용 AR 글래스 개발 중 (2)	다나와
마이크로소프트, 오픈AI 의존도 줄이고 경쟁사 앤트로픽 AI 도입 (1)	다나와
깃허브 독주 체제 흔드는 '커서'... AI 코딩 도구 시장에 무슨 일이 (1)	AI matters
서울AI재단-서울장학재단, AI 기반 업무 효율화 나선다	AI matters
AI 시대 신입사원들의 딜레마… "AI 없으면 일 못해, 있으면 일자리 위협"	AI matters
"AI가 논문 전체 써줘도 나는 저자다"... 국제 연구진 파격 주장 화제	AI matters
유튜브 썸네일 어그로 시대 끝나나? AI가 유해 썸네일 94% 정확도로 찾는다	AI matters

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

'개인정보? 기억이 안 나네'...구글, 민감정보 기억 못하는 '볼트젬마(VaultGemma)' 공개

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

'개인정보? 기억이 안 나네'...구글, 민감정보 기억 못하는 '볼트젬마(VaultGemma)' 공개

공유하기

공감/비공감