
딥시크(DeepSeek)가 최신 대규모 언어 모델 'DeepSeek-V3-0324'를 허깅페이스(Hugging Face)에 공개했다. 이번 모델은 딥시크의 기존 모델을 대폭 개선한 버전으로, MIT 라이선스로 제공된다. 허깅페이스에 등록된 정보에 따르면, 이 모델은 약 13시간 전 msr2000이라는 계정에 의해 업로드됐다. 모델은 총 163개의 파일로 분할되어 있으며, 각 파일은 약 4.3GB 크기로 총 용량이 약 700GB에 달한다.
이 모델은 텍스트 생성(Text Generation) 카테고리에 등록되어 있으며, 세이프텐서스(Safetensors) 형식으로 제공된다. 또한 'deepseek_v3', '대화형(conversational)', '커스텀 코드(custom_code)', 'fp8' 등의 태그가 붙어 있다. 이번 DeepSeek-V3-0324 모델은 MIT 라이선스로 배포되어 연구 및 상업적 목적으로 자유롭게 사용할 수 있다. 이는 인공지능 기술 발전과 접근성 향상에 큰 기여를 할 것으로 보인다.
현재까지 허깅페이스 플랫폼에서 604개의 '좋아요'를 받았으며, 18개의 커뮤니티 기여가 있다. 딥시크는 현재 허깅페이스에서 49,100명 이상의 팔로워를 보유하고 있어 AI 개발 커뮤니티에서 상당한 영향력을 갖고 있음을 알 수 있다. 모델 파일들은 'safetensors' 형식으로 제공되며, 각 파일은 대략 4.3GB 크기다. 이 외에도 설정 파일(config.json)과 딥시크 설정 관련 Python 파일(configuration_deepseek.py)이 함께 제공되어 개발자들이 모델을 쉽게 활용할 수 있도록 했다.
이번 출시는 별도의 대대적인 홍보 없이 조용히 이루어졌지만, AI 커뮤니티에서는 높은 성능과 오픈소스로 제공되는 점에서 큰 관심을 받고 있다. 특히 비추론 작업에서 뛰어난 성능을 보이는 것으로 알려져, 앞으로 다양한 AI 애플리케이션 개발에 활용될 것으로 기대된다.
해당 모델에 대한 자세한 사항은 링크에서 사용할 수 있다.
이미지 출처: 딥시크
기사는 클로드와 챗GPT를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기