본문 바로가기
마음가는데로서평

[IT모바일] 엑셀로 시작하는 데이터과학 실무

by 두목의진심 2022. 12. 24.
728x90


얼마 전, 구글 스프레드 시트 교육을 받은 후 관심 1도 없던 엑셀을 틈틈이 공부하고 있다. 게다가 요즘 1년 사업을 정리한 결과 보고서를 쓰고 있는데 이왕이면 데이터를 잘 정리해서 일목요연하게, 그것도 비주얼로 쉽게 보여주고 싶은 욕심이 생겼다. 이 책을 참고해서 잘만 만지작 거리면 기특한 녀석이 될 듯해서 탐독했다.


근데 음… 저자가, 교토 대학 철학과 심리학을 전공한 이력의 소유자라니 역시 엑셀은 범상치 않은 녀석인가. 어쨌든 끌리는 구석이 분명 있다.


아… 엑셀이 통계학을 기본 베이스로 하고 있다는 사실은 몰랐다. 그저 수식 몇 가지 깔작 거리는 수준이라서 계산과 데이터 분류와 분석, 적용, 오류 검출 등 상세하게 다뤄준다니 감사할 따름인데 그러기엔 책이 백과사전만 해야 하는 게 아니냐고 저자에게 묻고 싶지만 바다 건너 있으니 참을밖에.


시작하기 전에, 책에서 사용되는 예제는 이곳에 있으니 참고 하시길. 제대로 해보기 위해선 예제가 꼭 필요하다.


9쪽, 실습 파일 다운로드




이 책이 흥미로운 점은 다소 딱딱할 수 있는 숫자인 데이터를 다루는 데 있어 영진제과라는 조직 내에서 일어나는 에피소드를 통해 각 챕터마다 스토리로 풀어낸다는 데 있다. 그래서 그냥 기능이나 테크닉 설명을 읽는다기보다 만화를 보면서 그 현장 속에서 배운다는 느낌을 가질 수 있다.


영진제과 등장인물 소개




1장, 분석의 시작은 '입력'부터라는 설명에 머리 위에서 알전구가 반짝 켜지는 느낌이 들었다. 나는 데이터를 수집하는데 주먹구구식으로 넣다 보니 나중에는 필요한 정보를 정리하는데 아예 새로 입력하는 수준을 자주 경험하는 데 이제야 뭐가 문제인지 깨닫는다.


18쪽, 목적에 맞는 데이터 분석 방법




예제를 중심으로 된 설명이 되어 있어 따라 하다 보면 쉽게 결과를 볼 수 있는데, 다만 엑셀 함수나 명령어 등을 잘 모른다면 이해하는 데는 다소 어려울 수 있다. 나 역시 엑셀 함수를 잘 모르는지라 프리퀀시(FREQUENCY)는 처음 봐서 왜 데이터를 끝까지 잡지 않는지 이해하지 못했다.


그래서 예제처럼 해보고 나서 다시 데이터를 끝까지 다시 적용해 보고 나서야 두 가지 결괏값이 같다는 걸 알았다. 근데 굳이 하나 모자라게 하는 거보다 어차피 단축키로 끝까지 한 번에 잡아내는 게 편하지 않을까 싶은데, 설명이 없으니 다른 이유가 있는지는 모르겠다.


실습 중




사회복지도 트렌드가 있을까 싶지만, 매년 복지관 이용인의 선호 프로그램이나 증가 추이 등 다양한 통계 데이터를 분석한다. 이런 분석에 책에 등장하는 여러 가지 함수가 유용하지만 그중에 시계열 분석은 프로그램 운영을 예측하는데 아주 유용하지 않나 싶다. 그래서 6장은 더 열심히 따라 해 본다. 한데 이 시계열 분석은 엑셀 2016 버전 이상에서 활용할 수 있다고 하니 참고 하시길.


177쪽, 시계열 분석




이 책은 완독해 보니 결코 쉽기만 한 책은 아니다. 읽다 보면 꽤나 어려운 용어나 데이터 정의를 이해하지 못해 갈피를 잡지 못하는 경우도 있다. 내가 그랬다. 그럴 때 60개가 넘는 샘플 예제를 열어서 직접 해보면서 차근차근 따라 하다 보면 해낼 수 있다.


그렇게 완독하다고 데이터 전문가로 거듭나게 한다기보다 실무에서 적재적소에 사용할 수 있는 데이터 활용서에 가깝다. 제대로 이해하기 위해선 부록의 용어집을 꼼꼼히 읽어보길 권한다. 엑셀에서 사용되는 함수나 정의를 이해할 수 있도록 돕는다.


202쪽, 평균값의 차이 검정 /  250, 부록




그나저나 이젠 엑셀 좀 잘하는 직원으로 거듭나는 건가!

 

출판사에서 도서를 제공받아 완독 후 솔직하게 쓴 글입니다.

728x90