비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

[IT애정남] 똑똑해지는 AI 비서들, 내 데이터를 학습에 쓰는 건가요?

2024.06.24. 09:03:13
조회 수
370
2

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기
[IT동아 권택경 기자] 지난 10일, 애플의 연례 개발자 행사 ‘WWDC’ 시작을 알리는 키노트에서 애플이 애플 인텔리전스(Apple Intelligence)를 발표했습니다. 애플 인텔리전스의 출시로 향후 아이폰의 음성 비리 ‘시리’도 더 똑독해질 전망인데요. 이전과 달리 이용자의 개인적 맥락을 이해하고 그에 맞는 도움을 줄 수 있다고 합니다.

애플뿐만 아니라 마이크로소프트도 생성형 AI 조수인 코파일럿을 워드, 엑셀, 파워포인트 등 마이크로소프트 365 제품군과 윈도우 운영체제에 통합하면서 좀 더 밀접한 서비스를 제공하는 추세인데요.

그런데 이렇게 생성형 AI가 개인화된 서비스를 제공하기 위해 민감한 개인 정보나 사생활이 담긴 데이터를 들여다본다는 게 꺼림찍한 분들도 계실 겁니다. 이런 AI 서비스의 이면에 AI 모델 학습을 위한 데이터를 수집하려는 빅테크들의 검은 속내가 담긴 건 아닐지 의심스럽다는 poiXXXX님의 질문입니다.

“안녕하세요. 이번 애플 발표를 보니 시리가 이제 스마트폰에 저장된 개인 정보까지 활용한다는 것 같은데, 그렇다면 이런 정보들이 애플한테 넘어가서 AI를 학습시키는 데 사용되는 걸까요? 이런 서비스들을 믿고 써도 되는 건지 궁금합니다.” (일부 내용 편집)

이용자 데이터는 답변 생성에만 활용


애플의 생성형 AI '애플 인텔리전스' / 출처=애플
애플의 생성형 AI '애플 인텔리전스' / 출처=애플


AI 서비스들이 개인화된 답변을 제공하기 위해서 이용자의 데이터를 활용하는 것 자체는 맞습니다. 가령 애플 인텔리전스와 결합된 시리는 이용자의 스마트폰에 저장된 통화 요약, 메시지, 이메일 등의 정보에 모두 접근할 수 있죠. 애플이 시연에서 보여준 것처럼 “엄마가 탄 비행기가 언제 도착하지?”라고 물으면, 시리가 이용자가 엄마랑 나눈 통화, 메시지, 이메일 등을 뒤져서 엄마가 언제 어느 항공편을 타는지 알아내서 답변을 합니다.

하지만 이렇게 AI 서비스가 이용자에게 유용한 답변을 내놓기 위해 민감한 이용자 데이터를 참고 하는 게 이를 활용해 모델을 학습시킨다는 걸 의미하지는 않습니다. 생성형 AI 서비스가 답변을 생성할 때 이용자 데이터를 맥락으로 참고해 답변을 생성하는 것과 AI 모델을 개발하거나 성능을 개선하기 위해 데이터를 입력해 학습시키는 건 별개의 과정이기 때문입니다.

예를 들어봅시다. 우리는 의사에게 진료를 받기 위해 제 증상을 설명하고 이름, 나이 등 신상 정보와 건강에 대한 여러 민감한 정보를 알려줍니다. 그래야 의사가 제 상태를 진찰하고 그에 맞는 적절한 치료를 할 수 있기 때문인데요. 하지만 그렇다고 해서 의사가 제 진료 사례를 가지고 논문을 쓴다던가, 학회에서 발표 자료로 쓰는 걸 동의하는 건 아니죠. 이 때문에 진료 과정에서 받은 정보를 다른 용도로 쓰려면 환자 동의를 받거나, 개인을 특정할 수 없게 비식별화하는 처리를 합니다.

우리가 생성형 AI로부터 도움을 받기 위해 프롬프트(명령어)를 입력하고 기기에 저장된 메시지, 이메일 등을 맥락으로 제공하는 게 진료 행위라면, 이런 데이터로 LLM을 학습시켜 성능을 개선하는 건 이를 가지고 논문을 쓰거나 학계에 발표하는 건 의학이라는 학계에 지식을 보태는 일이겠습니다.


출처=마이크로소프트
출처=마이크로소프트


환자들이 어디까지나 진료를 받기 위해 정보를 제공하는 거지, 그 외 용도로 마음대로 쓰길 원치 않는 것처럼 AI 서비스를 이용하는 사람들도 내 데이터를 기업들이 마음대로 가져다 모델 학습에 쓰는 걸 원치는 않을 겁니다. 이 때문에 빅테크들도 이용자들에 대한 고지나 동의를 받지 않고 마음대로 데이터를 수집해 모델 학습에 쓸 수는 없는 노릇입니다. 더군다나 최근에는 AI 학습 데이터 수집으로 인한 저작권, 개인정보 침해에 대한 우려가 커지면서 더욱더 조심하는 분위기가 번지고 있기도 하고요. 각국의 개인정보 보호 관련 법안 또한 이용자에게 고지나 동의 없이 마음대로 민감한 이용자 데이터를 쓰지 못하게 법적으로 막고 있습니다.

실제로 애플, 마이크로소프트 등 AI 서비스를 제공 중인 기업들도 이용자들의 개인 데이터를 거대언어모델(LLM) 학습에 사용하지는 않는다고 분명히 밝히고 있습니다. 가령 애플은 별도의 웹사이트 설명에서 “우리는 이용자의 고유한 개인 정보나 상호작용을 파운데이션 모델 학습에 사용하지 않는다”고 명시하고 있습니다.

마이크로소프트도 마찬가지입니다. 현재 마이크로소프트가 마이크로소프트 365에서 제공하는 코파일럿은 ‘마이크로소프트 그래프’라는 툴을 통해 기업이나 개인이 저장해 둔 데이터를 답변 생성에 참고합니다. 하지만 이러한 데이터는 어디까지나 이용자의 요청에 가장 적합한 결과물을 맥락에 맞게 제공하기 위해 사용될 뿐, 모델 학습에는 사용하지 않는다고 밝혔습니다.


마이크로소프트의 코파일럿이 답변을 참고할 때 참고하는 이용자 데이터, 프롬프트 등을 LLM 학습에 쓰지 않는다고 분명히 명시하고 있다 / 출처=마이크로소프트 홈페이지 캡처
마이크로소프트의 코파일럿이 답변을 참고할 때 참고하는 이용자 데이터, 프롬프트 등을 LLM 학습에 쓰지 않는다고 분명히 명시하고 있다 / 출처=마이크로소프트 홈페이지 캡처


또한 시스템상으로도 이들이 개인정보를 들여다볼 수 없도록 하는 보안 조치를 취하고 있습니다. 애플의 예를 들자면, 애플 인텔리전스가 클라우드에서 AI를 처리할 때 모든 데이터는 ‘비공개 클라우드 컴퓨팅’이라는 서버를 통해 암호화되어 처리되며, 애플 또한 여기에 접근할 수 없다고 애플은 설명합니다. 이런 애플의 개인정보 보호 체계에 이상이 없는지 외부 전문가들이 검증할 수 있는 체계 또한 마련해 두었다고 하고요.

따라서 이 기업들의 공식적인 입장이나 약관, 개인정보 보호 정책을 믿는다면, 이들이 의도적으로 이용자 데이터를 수집해 AI 학습을 위한 공공재처럼 사용하는 상황을 걱정하지는 않아도 되겠습니다.

물론 아무리 기업들이 보호 체계를 갖춘다고 해도 세상에 완벽이라는 건 없는 법입니다. 생각지도 못한 시스템상의 허점이나 인간의 실수로 이러한 개인정보가 유출되는 불상사가 일어나기도 합니다. 가령 지난해 오픈AI가 챗GPT의 속도 증가를 위해 시스템을 손보던 중 오류가 발생하며 일부 이용자 정보가 유출되는 일이 있었죠. 결국 이런 AI 서비스를 이용하면 그렇지 않을 때보다는 개인정보 유출 위험이 증가하는 건 분명한 사실이라고 할 수 있습니다.

'IT애정남'은 IT제품이나 서비스의 선택, 혹은 이용 과정에서 고민을 하고 있는 독자님들에게 직접적인 도움이 되고자 합니다. PC, 스마트폰, 카메라, AV기기, 액세서리, 애플리케이션 등 어떤 분야라도 '애정'을 가지고 맞춤형 상담을 제공함과 동시에 이를 기사화하여 모든 독자들과 노하우를 공유할 예정입니다. 도움을 원하시는 분은 mh@itdonga.com으로 메일을 보내 주시기 바랍니다. 사연이 채택되면 답장을 드리도록 하겠습니다.

글 / IT동아 권택경 (tk@itdonga.com)

]]>

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 기획뉴스 전체 둘러보기
1/1
[숨신소] 먼지 닦으며 힐링하는 감성게임 '언더스티드' 게임메카
‘하코다테’ 여행 기자 추천 4분기 일본 소도시 여행지 트래비
이탈디자인, 전설의 '혼다 NSX' 현대적으로 해석한 트리뷰트 버전 예고 오토헤럴드
로반페라, 중앙유럽 랠리 우승…도요타, WRC 제조사 시즌 챔피언 확정 오토헤럴드
애스턴마틴 밴티지 GT3, GT 월드 챌린지 유럽 골드컵 클래스 챔피언 등극 오토헤럴드
현대차, 국내 최초 개최 '2025 TCR 월드투어' 6라운드 한국 레이스 우승 (1) 오토헤럴드
[넥스트 모빌리티] 마하 1.5로 날며 수증기만 배출하는 날개없는 비행기 (1) 오토헤럴드
에디터가 선택한 푸껫 필수 여행 스폿 4 (1) 트래비
[인디言] 탄막 속에서 시간을 멈춘다면? 타임 스내쳐 핸디 게임메카
"자살 언급 한 번이면 끝?" 부모-전문가, AI 챗봇 위험 판단 기준 정반대 AI matters
AI가 지진·홍수 예측한다... 인프라 재난 대응 정확도 90% 시대 온다 AI matters
거의 40년 넘는 골뱅이 전쟁, 원조의 품격이냐! 마케팅의 승리냐! [라이벌열전] (5) 다나와
KT 소액결제 사고 전수조사 결과 발표 “불법 펨토셀 16개 추가 확인” IT동아
"K-AI의 미래를 말하다" 프렌들리AI, 선도기업 4사 초청 밋업 개최 IT동아
[기승전결] 엔젤우몬! '디지몬 스토리' 신작에 팬덤 대만족 게임메카
테슬라에 칼 빼든 국토부와 환경부 "강제 리콜, 보조금 중지 고려 중" 동영상 있음 오토기어
아키텍트, 목표는 “모두에게 사랑 받는 MMORPG“ 게임메카
토요타 브랜드 가치 부동의 세계 1위…벤츠·BMW 부진 속 BYD 첫 진입 오토헤럴드
애플·삼성·DJI의 신제품 총공세가 이어진다... 이 주의 IT 루머 총정리 다나와
[AI 써봄] 영상 만들어 공유하는 소셜 플랫폼, iOS용 소라 IT동아
이 시간 HOT 댓글!
1/4