비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

'개인정보? 기억이 안 나네'...구글, 민감정보 기억 못하는 '볼트젬마(VaultGemma)' 공개

다나와
2025.09.16. 13:03:06
조회 수
154
10

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기


출처 : 구글 딥마인드 블로그


 9월 12일(현지시간) 구글 딥마인드가 자사 블로그를 통해 새로운 대규모 언어 모델(LLM) '볼트젬마(VaultGemma)를 공개했다. 이 모델은 처음부터 차등 개인정보 보호(Differential Privacy, 이하 DP) 기법으로 학습된 공개 모델로, 파라미터 수는 10억 개에 달한다.


 AI가 대중화됨에 따라 개인정보 보호를 기반으로 한 모델 개발은 필수 과제로 떠올랐다. DP는 학습 과정에서 데이터가 직접 노출되지 않도록 특정한 무작위 잡음을 추가하는 방식으로, 개인 정보가 모델에 원본 그대로 저장되는 것을 방지한다. 하지만 이 기법을 대규모 언어 모델에 적용할 경우 학습 안정성 저하, 대규모 배치 크기 필요, 높은 연산 비용 등 여러 가지 한계가 발생한다.


 연구팀은 모델 크기·배치 크기·학습 반복 수 등에 따른 성능 변화를 정량적으로 연구하여 특히 “노이즈-배치 비율(noise-batch ratio)”이라는 지표가 DP 학습 성능을 결정짓는 핵심 요인임을 확인했다. 이를 통해 주어진 연산·데이터·프라이버시 예산 내에서 최적의 학습 설정을 찾을 수 있는 기준을 찾아냈고 DP 환경에서는 대규모 모델보다 작은 모델을 더 큰 배치 크기로 학습하는 것이 효율적이라는 점이 드러났다. 


 연구팀은 모델이 학습 데이터의 특정 문장을 그대로 기억하지 않는지 검증했으며, 결과적으로 학습 데이터에 대한 직접적인 기억은 관찰되지 않았다.


 해당 모델은 10억 파라미터 규모로, 지금까지 공개된 DP 기반 모델 가운데 최대 크기를 자랑한다. 연구팀은 DP 학습의 핵심 기법인 '푸아송 샘플링'을 적용하면서 발생한 난제를 해결하기 위해 Scalable DP-SGD 방식을 도입, 효율적이면서도 강력한 개인정보 보호 성능을 확보했다.

실험 결과 '볼트젬마'의 최종 학습 손실은 연구팀이 예측한 값과 거의 일치해 이론적 모델의 타당성이 입증됐다. 


 또한 여러 표준 학술 벤치마크(HellaSwag, BoolQ, PIQA, SocialIQA, TriviaQA, ARC 등)에서 비(非)DP 모델과 비교했을 때, 약 5년 전 수준의 GPT-2 모델과 유사한 성능을 보였다. 

이는 여전히 성능 격차가 존재함을 시사하지만, 연구 성과가 그 격차를 줄여나가는 중요한 단계임을 의미한다.


 '볼트젬마'는 강력하면서도 개인정보 보호를 내재화한 AI 개발로 가는 과정에서 중요한 진전을 보여준다. 연구팀은 “DP 모델과 비DP 모델 간 성능 격차가 아직 존재하지만, 메커니즘 설계 연구를 통해 체계적으로 줄여갈 수 있다”며 “이번 모델과 연구가 차세대 안전하고 책임 있는 AI 개발의 토대가 될 것”이라고 밝혔다.


글 / 김지훈 news@cowave.kr

(c) 비교하고 잘 사는, 다나와 www.danawa.com

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
저작권 안내
크리에이트 커먼즈 저작자 표시 필수 상업성 이용 불가 컨텐츠 변경 불가
저작권 안내
저작권 표시 필수
상업성 이용 불가
컨텐츠 변경 불가
* 본 내용은 위의 조건을 충족할 시, 별도의 허가 없이 사용이 가능합니다.
최신 일반뉴스 전체 둘러보기
4/1
소비재 기업 90% 'AI 에이전트 필수'... 2년 내 경쟁력 좌우할 핵심 기술 AI matters
AI 도구 100개 써도 소용없다... 성공하는 기업들이 선택한 단 하나의 조건 AI matters
“이 사진이 진짜라고요?”… AI 딥페이크에 속는 건 인간만이 아니다 AI matters
8월 AI 시장 데이터 분석했더니 ‘챗GPT 압도적’… 시밀러웹 보고서 AI matters
논문에 AI 쓰면 손해? 득? 23만 편 분석해 봤더니… ‘활용 많은 동양 vs 인용 혜택 큰 서양’ AI matters
AI가 벌리는 글로벌 경제 격차... 앤트로픽 경제 보고서 "선진국은 협업, 개도국은 대체" AI matters
구글·MIT 연구진이 '인간 vs AI' 협상 능력 비교해봤더니… 수학 기반 AI가 가장 성과 좋아 AI matters
벼 사진 찍으면 질병 이름-관리 방법 알려준다… 농작물 질병 경고 AI 시스템의 등장 AI matters
"요청도 안 했는데"... 적극적인 AI일수록 사용자가 외면하는 이유 AI matters
"경력 과장하면 AI가 찾는다"... AI가 이력서 속 거짓말 90% 잡아낸다 (1) AI matters
로봇이 실험하고 AI가 논문 쓴다... 과학 연구에 AI를 도입하면 생기는 일 (1) AI matters
알바니아, 부패 척결 위해 세계 최초로 'AI 장관' 임명 (3) 다나와
SKT-오픈AI, ‘ChatGPT 플러스’ 구독 프로모션 예정...'1개월 유료 구독 시 2개월 무료 혜택' 다나와
'개인정보? 기억이 안 나네'...구글, 민감정보 기억 못하는 '볼트젬마(VaultGemma)' 공개 다나와
피플 CEO “구글은 ‘나쁜 행위자(bad actor)’…우리 콘텐츠 훔쳐간다” 다나와
오픈AI CFO “올해 매출 전년 대비 4배 성장” AI matters
클로드, 업무 맥락 기억하는 '메모리' 기능 출시… “팀 협업에 효과적” AI matters
오픈AI, MS와 새로운 파트너십 협상… "공익 기업 전환 추진" AI matters
FTC, 메타·오픈AI 등 'AI 챗봇 동반자' 기능 안전성 조사 착수... “아동·청소년 보호가 최우선” AI matters
‘주가 사상 최고치 경신’… SK하이닉스, 세계 최초 차세대 AI 메모리 'HBM4' 양산 체제 구축 AI matters
이 시간 HOT 댓글!
1/4