본문 바로가기
학습노트/아티클,도서

[도서] 데이터로 전문가처럼 말하기

by kime2 2024. 7. 11.

데이터로 전문가처럼 말하기 : 네이버 도서 (naver.com)

한빛미디어의 '데이터로 전문가'처럼 말하기를 정리한 내용입니다.

 

 

 

1. 올바른 질문하기 : 도요타가 말하는 다섯가지 이유

왜 X 5

A: 우리 대학에서 이용할 수 있는 장소와 학생 수를 비교할 수 있는 대시보드가 필요합니다.

B:그 데이터가 왜 필요하죠?
A: 총장님께 다음학년도 우리 학교가 학생을 어느정도 수용 가능한지 말씀 드려야 합니다
내년도 수용가능 학생수를 파악하기 위해

B:총장님은 그 데이터를 왜 찾고 있나요?
A: 총장님은 필요한 교직원 수를 확인하고 있기 때문입니다
> 학생수에 따른 교직원수

B:그럼 총장님은 지금 교직원수를 확인하고 계신가요?
A:총장님은 더 작은 인원과 강의실에서 학생을 가르칠 직원이 부족하다면, 더 큰 강의실이 필요한지 고민하고 계십니다.
> 추가 강의실

B: 왜 강의실 크기와 수에 초점을 두고 있는 거죠?
A: C동의 모든 강의실을 리모델링 할 예정인데, 이는 사회학과 강좌와 관련있기 때문입니다.
> 강의실을 리모델링 하기때문

 

장소와 학생 수를 비교

>  내년도 수용가능 학생수

> 학생수에 따른 교직원수

추가 강의실

> 강의실을 리모델링 하기때문

 

< 질문에 따른 필요를 반영한 대시보드 >

 

< 5 WHY 예시 >

 

 

2. 시각적 데이터 표현

1) 표

  • 데이터 개별 값을 제공
  • 데이터 사용자와 분석가 사이에 신뢰 구축을 지향
  • 데이터의 추세 X
  • 사전주의 속성 X

 

2) 막대차트

  • 강력한 사전주의 속성을 효과적으로 사용 가능
  • 많은 사람에게 친숙
  • 세가지 이상의 범주를 한 막대차트에 누적하여 사용할 경우, 분석이 더 어려워질 수 있음
  • 한 막대에 여러개의 의미를 주기 어려움

 

3) 꺾은선

  • 데이터의 추세를 보여줌
  • 많은 사람에게 친숙
  • 너무 많은 범주의 사용은 각 선이 이리저리 교차함에 따라 차트 복잡성을 증가시킬 수 있음
  • 누적 영역 차트는 언뜻 보기에는 효과적이지만, 추세 파악은 어려움

 

4) 산점도

  • 두 지표 비교에 특히 효과적
  • 두 지표 간 상관관계 발견에 효과적
  • 너무 많은 데이터 점의 표현 X
  • 과도한 색과 데이터 점의 형태 적용 X

5) 지도차트

  • 지리적 위치에 대한 일반적인 지식 사용
  • 청중의 관심을 끌기 유리
  • 너무 많은 세부사항으로 쉽게 과부하될 수 있음
  • 지도 위 너무 다양한 지리적 요소들이 데이터 포인트를 가릴 수 있음
  • 지표 간 비교를 위한 시각화 사용에는 지양

6) 분할차트(파이, 트리 등)

  • 데이터 전체에서 특정 범주를 강조
  • 트리맵을 사용하여 많은 범주형 변수도 시각화 가능
  • 원형차트를 이용한 시간흐름에 따른 데이터 변화 표현 지양
  • 전체 분할차트를 이용한 음수 데이터 측정값의 표현은 불가

3. 시각화를 완성하는 맥락

데이터 기반 커뮤니케이션에서 맥락이란

분석이 수행되는 상황, 분석을 기반으로 하는 기준 및 둘러싼 모든 요인을 말한다

청중은 이 맥락을 통해 전달받은 정보를 머릿속에 정리, 배치 그리고 이해한다

 

  1. 제목
  2. 텍스트와 주석
  3. 맥락 관련 숫사
  4. 범례
  5. 도해와 시각적 단서
  6. 배경과 배치

 

1) 주제목

< 주제에 초점을 맞춘 제목 >

 

< 청중의 질문에 초점을 맞춘 제목 >

흥미로운 질문을 담은 제목은 청중의 관심을 끄는데 효과적

또한 데이터 사용자가 주제에 대한 전문 지식이 부족하다면 질문에 초점을 맞춘 제목을 사용하는 것이 좋음

 

< 데이터 분석 결과, 데이터 속 발견점에 초점을 맞춘 제목 >

청중은 제목을 읽고 왜 그런지 데이터를 주의깊게 살펴볼 수 있음

 

  • 제목은 데이터 주제, 데이터에 내재된 질문 또는 데이터가 내포한 주요 포인트가 될 수 있음
  • 부제목은 전체적인 데이터 시각화 정보를 이해하기 쉬운 작은 덩어리로 분리해 청중에세 제공하는데 유용함(데이터를 보는 관점과 순서, 방향 제공)
  • 차트 제목은 차트 내 메시지를 명확하게 전달하는 데 도움이 됨

2) 텍스트 서식

텍스트를 사용하여 데이터 사용자의 오해를 방지하고 명확한 정보를 전달한다

또한 주제에 맞는 텍스트 서채를 사용하여 맥락에 시각화를 강조시켰다

 

  • 주석은 복잡한 데이터 포인트에 명확성을 제공함
  • 데이터 시각화는 정보 전달에 매우 강력한 역할을 하지만, 텍스트의 중요성을 무시하면 안된다
  • 텍스트 서체와 크기를 최소한으로 사용해야 한다

3) 맥락 관련 숫자

숫자를 통해 청중은 더 자세한 세부 사항을 파악하기 전에 몇가지 주요한 질문에 답할 수 있다

  1. 얼마나 많은 사람이 본 데이터 분석 프로젝트에 참여했는가
  2. 얼마나 많은 데이터 분석 결과가 제출되었는가
  3. 참가자는 평균적으로 몇 번의 제출을 완료했는가

 

  • 간단 명료한 맥락 관련 숫자는 명확한 분석을 위한 좋은 기준선을 제공
  • 시작적인 요소가 아닌, 효과적인 데이터 전달을 위해 사용되는 강력한 요소

4) 도해와 시각적 단서

데이터 기반의 커뮤니케이션은데이터를 다루고 해석하는 능력이 조금 낮은 사람들을 포함하여, 많은 이들이 데이터 분석 결과를 더 쉽고 명확하게 이해할 수 있도록 하는 것

 

< 정보 버튼에 대한 내용 >

  • 데이터 출처
  • 설정에 따라 필터링된 데이터
  • 데이터 날짜 범위
  • 데이터 또는 시각화 자료 용어 설명
  • 데이터 사용자가 필요로 할 수 있는 세부배경 정보
  • 데이터 사용자를 위한 지침

  • 주제를 설정함으로써 청중이 데이터 분석 결과를 더 명확히 이해하고 기억하게 함
  • 청중에게 데이터 분석 결과를 어떻게 읽고, 해석해야 하는지에 대한 안내 제공

5) 방향

  • Z패턴은 기본적으로 적용되어야 함
  • 공백과 배경색을 사용하면 구성 요소들을 관련된 항목별로 분할할 수 있으며, 이는 보다 효과적으로 정보를 전달하는데 유용함

4. 메시지를 전달하는 방법 : 대시보드

 

1) 설명적 커뮤니케이션

청중에세 분석 결과를 명확하게 표현한다

 

단순히 이해 관계자가 요구하는 것만을 알면 요청 초기에는 허점이 있을 수 있다 : 5가지 why를 물어야 하는 이유

설명적 커뮤니케이션을 통해 추가적인 정보를 추가하라!

 

< 예시 >

 

 < 그래서? 뭘 어떻게 해야 할까? >

  • 전달하고자 하는 메시지가 두 개 이상의 항목으로 구성되는 가
  • 그렇다면, 어느 차트가 머시지의 다른 부분을 명확하게 설명하는가
  • 내가 포함한 모든 데이터 범주와 측정 기간이 전달하고자 하는 메시지와 일맥상통 하는가?
  • 청중이 가장 먼저 어느 부분에 집중하길 원하는가? 어느 순서로 데이터 분석을 설명할 것인가? 중요한 차트는 가장 먼저 배치하는가? 나중으로 배치하는가?
  • 청중이 꼭 이해했으면 하는 가장 중요한 메시지는 무엇인가>? 어떻게 하면 청중이 그것을 기억하도록 할 수 있을까?
  • 왜 나의 메시지가 중요한가?

상단 질문에 모두 답을 할 수 있어야 한다

청중이 당신의 데이터 분석과 함께 어떤 의사결정을 그리고 행동을 취할 수 있는지 신중히 생각해야 한다

 

2) 탐구적 커뮤니케이션

청중은 데이터 시각화를 직접 탐구할 수 있으며, 특히 관심이 있는 항목을 더 자세히 보기 위해 필터링, 대화형 옵션을 이용할 수 있다

 

다음과 같은 경우

  • 시간경과에 따른 판매 변화뿐만 아니라, 국가별 그리고 노선별 판매 추이도 알고 싶다
  • 지난 몇 년 동안의 판매를 각각 따로 볼 수 있는가?
  • 판매를 지역별로 따로 그리고 모두 같이 보고 싶다
  • 사장님이 지역별로 판매를 분류하여 보고 싶다고 했으나 구체적인 요구사항을 따로 전달하지 않았다

이때 사용되는 요소들

  • 필터링
  • 하이퍼링크
  • 데이터 업데이트를 위한 차트 클릭
  • 매개 변숫값 변경
  • 관심영역에 마우스 커서 위치시키기

< 예 : 데이터 필터링에 대한 안내, 사용할 상위 데이터 개수에 대한 안내 >

 

이러한 지침은 청중이 기울여야 할 인지 부하를

 

3) 대시보드

대시보드란 어떤 상태를 추적, 관찰하거나, 이해를 돕기 위해 사용되는 시각적 지표

효과적인 대시보드는 큰 정보를 작은 덩어리로 나누어 운전자에게 전달하여, 상황에 맞게 함께 고려할 수 있도록 돕는다

 

< 대시보드를 만들기 위해 필요한 정보 >

  • 추적, 관찰하고 싶은 것(상황)
  • 세부 항복에 대한 중요도
  • 대시보드를 채울 데이터 출처

주요 지표를 반영한 숫자는

  • 삼각형과 함께 표시한다 : 증가했는가, 감소했는가
  • 목표치(기준)를 함께 제시한다 : 위급한 상황인가?

맥락과 관련된 중요한 숫자는 먼저볼 수 있도록 상단에 위치한다

답변 가능한 질문들

  1. 이번 분기 prep air의 수익은?
  2. 신규 노선의 수익은?
  3. 다른요일보다 특히 수익이 떨어지는 요일은?>
  4. 원료일, 목요일, 금요일에 발생한 목표 이하의 실적은 새로운 추세인가?

대시보드의 요점은 청중이나 데이터 사용자가 가질 수 있는 모든 질문에 대답하는 것이 아니라

상호작용을 통해 여러 질문에 답할 수 있도록 하는 것이다.

  • 다양한 지표를 함께 관찰할 수 있다
  • 데이터 필터링을 포함한 대화형 요소의 적용으로 탐구적 분석에 적합하다
  • 청중이 오랫동안 기억할 수 있는 데이터 분석을 위한 많은 설계적 선택권을 제공한다
  • 청중이 의도한 정보를 정확하게 이해하는지 확인하기 위해서는 사전에 검증이 필요

4) 인포그래픽

인포그래픽은 데이터에 대한 특정 이야기를 전달하기 위해 단일 작업 공간 또는 페이지내의 여러 차트를 사용한다

비즈니스 맥락에서, 인포그래픽은 부서의 직원이 다른 부서의 전문 분야에 익숙하지 않을 때와 같은, 

부서간 커뮤니케이션에 매우 유용하다.

 

대시보드와 동일한 데이터를 사용하지만,

읽기 훨씬 쉽고, 더 많은 설명을 텍스트로 표시한 형태이다

대시보드는 기본적인 비즈니스와 수익데이터에 이해가 있는 사람에게 충분한 통찰을 줄 수 있지만,

인포그래픽은 모든 직원들에게 1분기 항공권 판매 수익에 대한 기본적인 이해를 쉽게 전달할 수 있다

 

  • 청중과 데이터 사용자의 눈길을 쉽게 끌 수 있음
  • 명확한 이야기를 전달하는 유용한 방법
  • 데이터셋을 업데이트 할 때에도 전체적인 주요 메시지가 변하지 않도록 주의해야함

대시보드 참고 자료

프로필 - ellen4268 | Tableau Public

 

Ellen Blackburn - Profile | Tableau Public

Ellen Blackburn's Tableau Public profile. View interactive data visualizations published by this author.

public.tableau.com

 

5. 특정 부서에 맞춰 일하기

 

1) 경영진

어떻게 고위 관료에게 의견을 제시하고 이를 이해시킬 수 있을까?

랜딩페이지는 데이터의 중요 이슈와 정보를 신속하게 찾을 수 있도록 도와준다

 

< 회사의 KPI 지표 >

  • 매출극대
  • 이익극대화
  • 고객경험향상

< 순추천 고객지수 클릭 > 분석 대시보드 >

성과지표에서 긍정/부정 의미에 따라 색을 달리하였다

자세한 대시보드는

조직을 긍정적으로 뵨화시킬 수 있는 의사결정의 기초가 될 것이기 때문에 정확해야 한다! 타 부서의 도움!!

 

데이터 시각화 연습하기

https://www.preppindata.com/

 

Preppin' Data

Preppin’ Data weekly data preparation challenge

www.preppindata.com