김영우 지음, 이지스퍼블리싱 펴냄
이른바 4차 산업혁명에 대해 기자로서 직업적 고민이 크다. 일단 빅데이터니 머신러닝이니 블록체인이니 하는 신기술을 이해부터 해야 기사를 쓸 수 있지 않겠는가. 논문용 통계나 겨우 돌리는 수준의 이른바 ‘문돌이’에겐 진입 장벽이 높다. 자료를 뒤지거나 전문가에게 문의하고, 여의치 않으면 구글에 ‘바보(dummies)도 이해하는’ 등의 검색어와 함께 신기술 명칭을 넣어서 때로 좋은 안내서를 얻을 수 있다.

다만 한계가 뚜렷하다. 가려운 발을 신발 위로 긁는 기분이랄까. 그래서 평소 거들떠보지 않았던 ‘이과계’ 도서 목록을 찾아보았는데 어느 정도의 수학 지식만 있으면 적어도 감 정도는 잡을 수 있는, 의외로 좋은 책이 많았다. 지금 소개하는 〈Do it! 쉽게 배우는 R 데이터 분석〉도 그중 하나다.

‘R’은 몇 년 전부터 학계와 업계에서 폭발적 인기를 끌어온 ‘데이터 분석’ 소프트웨어다. 무료라는 이점 외에도 일단 사용해보니 이미 시중에 나와 있는 글로벌 기업의 관련 프로그램보다 훨씬 우수하다는 생각이 들었다. 구글, 페이스북 같은 글로벌 정보통신 기업들이 이 프로그램을 사용하는 이유일 것이다. 다만 내가 ‘R’을 처음 접했던 3~4년 전의 안내서엔 체계적 설명 없이 함수(데이터를 처리하는 일종의 부호)의 기능만 잔뜩 실려 있어서 완독하지 못한 기억이 난다.

이 책은 매우 자상하다. ‘R’ 프로그램을 다운로드하는 방법에서부터 기본적인 데이터 분석은 물론 텍스트 마이닝, 간단한 통계분석 등 프로그램 응용 부문에 이르기까지 직접 실행해보면서 익힐 수 있다. 신기하고 재미있어서 저절로 몰두하게 된다. ‘R’로 익힌 데이터 분석의 감각을 신기술에 대한 이해로 확장할 수도 있을 것이다. ‘문송합니다(문과라서 죄송합니다)’ 같은 유행어가 판치는 세상에서, 문돌이도 괜찮은 책을 찾아가며 일단 해보는 거다!

기자명 이종태 기자 다른기사 보기 peeker@sisain.co.kr
저작권자 © 시사IN 무단전재 및 재배포 금지
이 기사를 공유합니다