[나는리뷰어다] 한빛미디어, 데이터 과학 레벨 업 with 로드맵
글 / 사진 : 서원준 (news@toktoknews.com)
본 소개 글은 한빛미디어 “나는리뷰어다” 를 통해서 도서를 제공받아 진행되었습니다.
얼마남지 않은 5월, 그리고 6월은 정말 중요한 달이다. 시간을 아나바다(아껴 쓰고, 나눠 쓰고, 바로 쓰고, 다시 쓴다는 것의 약어)하지 않으면 앞으로 각종 활동이 어려움을 겪을 지도 모른다. 시간 낭비하지 않고 열심히 일하고 읽고 또한 자기계발을 하려고 한다.
1980년대 초중반, 컴퓨터 교육을 지배했던 것은 다름아닌 프로그래밍이었다. 당시만해도 베이직, C언어 등 프로그래밍 교육 붐이 일어났는데 그 당시 모니터는 볼록 튀어나온 CRT모니터에 저장장치는 컴퓨터테이프 또는 플로피디스크였는데 요즘처럼 몇 테라바이트가 아니라 몇 킬로바이트짜리 저장장치를 써 왔다는 점이다.
그러나 최근 들어서는 코딩 붐이 일어나고 있다. 이 코딩이라고 하는 부분은 과거 “프로그래밍”과 쓰는 말이 달라졌을 뿐 하나도 다르지 않다. 그 중심에는 빅데이터, 인공지능이 있고 데이터 과학은 코딩이 있어야 “만” 배울 수 있는 것으로 생각되어 왔다.
최근 데이터과학이 발달하면서 다양한 서적들이 출간되고 있다. 이번에 소개하는 한빛미디어의 “데이터 과학 레벨 업 with 로드맵” 은 데이터과학의 기초적인 부분에서 심층적인 부분까지 다양한 접근 방식을 제공하고 있는데 이 책에서는 특히 캐글의 사용법에 대해서 설명하고 있는 부분이 특징이라고 하겠다.
이 책은 데이터 과학자들이 그랜드 마스터로 올라서는 비법을 자세하게 설명하고 있는데, 특히 데이터 과학 플랫폼 캐글을 이용한 다양한 실습 예제를 풀어 봄으로써 캐글에 대한 적응력을 향상시켜 줌은 물론 캐글을 이용한 각종 경진대회에 참가할 수 있도록 잘 정리되어 있다.
도서 소개를 마치면서
캐글 그랜드마스터인 콘라트 바나헤비치와 루카 마사론이 데이터 과학 대회와 프로젝트에서 성공하는 데 필요한 기술과 비법을 하나로 모은 내용으로 구성되어 모델링 전략과 각종 지식을 토대로 데이터 과학자로 성장하는 방법에 대해서 자세하게 설명한 책이다. 필자로서는 데이터과학에 대해서 배울 기회라 판단되어 읽어보고 있지만 캐글 및 데이터과학 초심자들은 해당 지식을 다른 책으로 먼저 이해하고 나서 이 책을 읽는다면 이해하기 훨씬 쉬울 것이다.