본문 바로가기
IT리뷰

데이터로 전문가처럼 말하기(2022.08.30)

by jb213 2022. 10. 2.

https://www.hanbit.co.kr/store/books/look.php?p_code=B5424596013

데이터 분석 혹은 가공을 잘했어도 마지막 마무리까지 신경써야 되는 부분이 많더라.

 

그런 의미에서 이 책 초반부터 나오는 여러 참고할 책들을 정리해보는 것도 좋겠다.

-스티븐 퓨, 이제 보이는 것들(Now you See it, Stephen Few)

 

데이터 시각화는 대부분 한눈에 봤을 때 쉽게 어떤 것을 느껴야 하는지를 제시해야 한다고 생각한다. 

즉 시각화에는 강약이 있어야 한다.

책을 읽으면서 우리가 콘텐츠를 만들 때 사용하는 여러 종류의(표, 도식 등) 시각화 장치가 어떤 기능을 하는지 알 수 있었고 평소에 내가 왜 그런 시각화 장치를 사용했는지도 떠올려볼 수 있었다.

 

- 표 : 인지 부하가 큼 but 사용자가 데이터 집합에서 어떤 내용을 원하는지 불분명할 때 쓰면 좋은 방법임.

책 36p 를 보면 '매장별 자전거 판매 목표량' 을 그래프로 표현했다. 이 경우 표로 나열된 각 지역별 3자리의 판매 목표량보다 훨씬 보기 편하다. 그리고 각 매장별 월별 판매량의 차이도 쉽게 알 수 있고 그래프에 월별 목표치를 넘었는지도 가로선으로 표시해 쉽게 인식할 수 있도록 했다. 

이처럼 정보 혹은 데이터를 '어떻게' 보여줄 것인가는 생각보다 중요하다. 나도 처음부터 그렇게 생각한 건 아니었다. 그런데 실무를 해보니 단순히 데이터뿐 아니라 이를 쉽게 인지하도록 돕는 것이 시각화더라. 효과적으로 시각화를 만들수록 데이터로 하는 여러 작업들의 가치를 더 강조할 수도 있다.

일할 때 누군가 시각화를 간과한 적이 있어 의아했던 적이 있었다. endpoint 단에서 마무리를 확실하게 하지 않고 대체 누가 내가 한 작업의 성과를 들여다본단 말인가...어쨌든 나도 초반에 그랬기 때문에 그러려니 했지만 데이터 시각화에 대한 부분도 놓치지 않고 가져가는 게 맞다는 생각이다.

 

1부의 2장을 읽으면서 때론 지루한 가공작업이 떠올랐다. 이런 사소한 항목을 점검하지 않는다면 제대로 된 결과를 낼 수 없기 때문에 점검 차원에서 잘 읽었다. 

 

2부 데이터 표현

1. 표 : 범주를 읽자. 요약 데이터인지 원본인지 파악하자. 열-행 피벗의 경우 어떻게 될 지 생각해보자. 표는 많은 내용을 담고 있어서 표를 해석하는 데 드는 인지 부하를 줄이면 청중에게 핵심 내용을 더 잘 파악할 수 있게 할 수 있다. 

1-1. 표를 사용하는 이유 : 정확성. 정확한 값을 확인할 수 있다. / 친숙함, 신뢰성

but 중요한 추세나 패턴 분석에는 좋지 않음

1-2 표 강조 : 표에서 명암을 이용해 시각표현 -> 분석 쉬워짐

1-3. 표를 사용하지 않는 경우 : 데이터의 전반적 추세를 파악할 때, 너무 많은 열이 있을 때, 너무 많은 행이 있을 때

 

2. 막대차트

증감을 쉽게 확인 가능

영점 기준선을 빼먹지 말자

2-1 최적화 : 여러 범주 사용할 때 순서를 적절히 변경할 것. 색을 사용해 여러 범주를 구분할 것(색을 사용할 때는 비슷한 계열로 할 것)

2-2 막대 차트를 사용하지 않는 경우 : 차트에 너무 많은 정보가 담기는 경우

 

기본적인 내용만 전달했지만 2부에는 실전에서 별다른 이유 없이 마구잡이로 사용했던 시각화 선택에 대해서 세세하게 짚고 넘어갈 수 있는 내용이 다수 존재한다. 한번쯤 읽어보고 내 것으로 만들면 더 좋겠다.

2부의 내용은 우리가 무심코 혹은 그냥 그렇게 쓰니까 사용했던 많은 시각화 관행에 대해서 '이유'를 생각해볼 수 있게 한다. 이런 의문을 갖고 일하는 사람과 그렇지 않은 사람은 어디선가 티가 나게 마련일 것이다. 그리고 어쩌면 더 좋은 곳으로의 출발을 준비할 때도 자신의 작업에 대해 깊이를 더할 수 있는 훌륭한 양념이 될 수도 있을 것이다. 그만큼 내용이 생각보다 좋다.

 

3부에서 각 부서별로 어떻게 데이터 시각화를 기획하고 보여주는 것이 좋은가에 대해서도 참고할 수 있었다. 동일 상황에서 나는 어떻게 했을까 혹은 어떻게 했는지 떠올려보기 좋았다.

또 작가가 연습을 권유하면서 적은 웹페이지가 있어서 첨부한다. 역시 모든 건 꾸준하게 연습하는 게 베스트다.

https://www.preppindata.com/

 

Preppin' Data

Preppin’ Data weekly data preparation challenge

www.preppindata.com

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

댓글