본문 바로가기
마음가는데로서평

[IT모바일] 실무에 바로 쓰는 일잘러의 엑셀 데이터 분석 - 데이터 리터러시를 위한 기초 통계 지식부터 엑셀 파워 쿼리 & 시각화 | 일잘러 시리즈

by 두목의진심 2022. 12. 31.
728x90

 

학창 시절부터 쭈욱 하기 싫은 것 중에 탑인게 공분데 요즘은 이놈의 엑셀 데이터에 집착하고 있다. 그동안 엑셀은 대충 목록을 채워 넣고 대충 계산, 그까이 꺼는 쭈욱 긁고 엔터만 치면 되는 수준으로 사용하면서 별 신경을 쓰지 않았다. 근데 회사 일잘러가 효율적으로 엑셀 데이터를 만지작거리는 걸 보고 욕심이 나기 시작했다.

 

비전공자를 위한 진짜 데이터 활용, 캬~ 비전공자로 이 얼마나 매력적인 말인지 모른다. 이렇게 누구나 데이터를 조물딱 거리게 만들고자 하는 세상 호혜적인 두 저자에게 응원을 보낸다. 그리고 책에 나오는 예제 파일을 여기서 다운로드해서 따라 해 보면 된다. https://bit.ly/book_jpub

 

아하, 시작부터 놀라운 설명이 있다. 같은 데이터가 완전히 뒤바뀌는 상황을 초래한다는 사실인데, 이렇게 상황에 맞는 데이터를 수집하고 해석하는 이런 분석이 가능하다니, 완전 그러고 싶다. 데이터 리터러시에 관해 이론적 설명이 이어지는데 솔직히 비전공자인 입장에서는 쉽진 않지만 희한하게 요약이 되는 느낌이 있다. 그렇다고 내가 이해하고 있다는 건 정말 아니다.

 

21쪽, 올바른 공유의 책임감

 

정부, 지자체 등등, 곳곳에 널린 다양한 데이터 수집 방법과 수집한 데이터를 활용하는 방법이 설명되어 있는데 공짜로 대단한 걸 받은 느낌이다. 북마크 해놓고 두고두고 써먹겠다고 다짐했다. 또 엑셀 버전에 따라 지원 가능 여부와 지원이 안되는 기능은 별도의 파일을 제공해 업데이트도 할 수 있게 도와 준다. 아주 친절하지 않은가. 역시 호혜적인 사람이다.

 

디디어 그럴싸한 예제로 멜론 월별 차트를 수집하는 방법을 설명하는데 어렵지 않고 재밌다. 해보니 이까이 꺼! 하게 됐다. 다만 API 데이터 수집은 좀 생소해서 어렵다. 역시 난 비전공자, 따흑!

 

43쪽, 데이터 크롤링으로 웹페이지 수집하기

 

2개의 파일, 6개의 시트를 하나로 합치는 <3장, 서로 다른 파일에 있는 시트 통합하기> 설명은 중간이 쑹덩 잘려 나가는 듯하게 느껴지지는 않지만 따라 하는 데 버전이 다르다면 좀 힘들다. 내 경우는 2016 버전인데도 설명과 달라서 이리저리 쿼리만 뒤지다 진 빠졌다.

 

그렇게 오전을 동숲에서 낚시질 좀 하다 번쩍 스치는 생각이 있어 이리저리 궁리해서 방법을 찾았다. 혹시 2016 버전이라서 저자의 설명이 혼돈의 카오스로 안내한다면 이렇게 해보시길.

 

 

우선 새 시트에서 [데이터 탭]에서 [새쿼리], 폴더가 아닌 [파일에서]를 선택하고, 창이 열리면 [여러 항목 선택]을 체크 후 세 개의 시트를 체크하고 [데이터 변환]을 클릭, 그리고 쿼리 편집기가 열리면 [닫기 및 다음으로 로드]에서 [연결만 만들기] 선택 하면 시트에 [통합 문서 쿼리] 창이 보이면서 시트 3개가 연결되는데, 나머지 파일도 같은 방법으로 반복해서 6개의 시트를 연결 상태로 만드시라.

 

그리고 이 녀석들을 하나의 쿼리로 만들어야 하니, [새쿼리]에서 [쿼리 결합]에 [추가]를 선택하고, [3개 이상의 테이블 항목 선택]하고 6개 시트를 모두 추가하고 확인 클릭하면 다시 쿼리 편집기가 열리면서 82쪽, 9단계처럼 묶여진 걸 확인할 수 있음. 이후는 책 내용처럼 따라 하면 같은 결과를 볼 수 있다는 기적과 같은 일이 일어난다는 얘기다. 소 뒷걸음 치다 쥐 잡는 격으로 찾은 방법이긴 하나 이거 해놓고 어찌나 기분이 좋던지 안 해 봤으면 말을 하지 말자.

 

86쪽, 서로 다른 파일에 있는 시트 통합하기

 

분명 고급진 테크닉들의 향연이 아닐 수 없다. 따라 하다 보면 오~ 와~ 이럴 수가~ 같은 감탄사가 남발 된다. 한데 함정은 엑셀은 기초 정도 수준으로 함수도 잘 다루지 못하는 사람이라면 따라 하면서도 뭔가 찜찜한 구석이 남는다.

 

이걸 어떻게 쓰는지, 어디에 적용해야 할지 같은 데이터 활용에 대한 기본적인 수준이 뒷받침이 안 되면, 따라 해 보면서 저자의 고급진 테크닉에 감동만 하다 끝난다. 내가 그랬다.

 

<6장, 변수의 관계를 찾는 상관 분석과 회귀 분석>을 따라 하다가 또 버전의 한계를 맞닥뜨렸다. 산점도 그래프를 만드는 데 성공하고 두 번째 상관 분석을 하려는데 [데이터 탭]에 [데이터 분석]을 클릭하라는 데 얘가 집을 나갔는지 자취를 찾을 수 없다. 그냥 슬쩍 봐도 없는 사람들은 암만 찾아 봐도 없다.

 

결국 또 한숨을 쉬다가 폭풍 검색으로 추가하는 데 성공 했다. 혹 나처럼 후진 버전으로 없다면 이렇게 하시라.

 

엑셀 창에서 [파일]에서 저 아래 끄트머리에 보면 [옵션] 선택, 창이 열리면 아래쪽으로 눈을 돌리고 [추가 기능] 또 아래쪽으로 눈을 돌려 [이동] 클릭, 창이 열리면 [분석도구], [해 찾기 추가 기능] 체크 후 확인하고 엑셀 껐다 다시 켜면 [그래픽 탭] 오른쪽 끄트머리에 [데이터 분석]이 두둥!! 이 또한 기적에 가까운 일이 아닌가.

 

200쪽, 공공데이터를 이용한 상관 분석 실습

 

엑셀을 좀 다루면서 데이터 수집이나 활용에 관심이나 필요가 있는 직장인이라면 정말 좋은 책임에는 틀림 없다. 다만 엑셀은 기초 수준인데 데이터 활용이 궁금한 사람들에겐 다소 난해한 부분이 있다. 왜 이런 테크닉을 적용해야 하는지 같은 기본적인 설명이 함께 된다면 좋겠다. 한데 그러면 책이 두꺼워지겠지? 그럼 사람들이 책을 안 보겠지? 그것참 총체적 난국일세.

 

이 책은 처음부터 엑셀의 기본기나 문법을 설명하는 게 아니라 예제를 통해 테크닉을 키우는 데 유용한 책이라서 목차를 보고 필요한 부분만 공부하는 것도 효율적이겠다. 암튼 끝까지 따라 해 보려 노력하는 만큼 진도는 더뎠지만 엑셀의 위대함을 강렬하게 느낀 기회였다.

 

YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.

728x90