본문 바로가기

Study Log

[패스트캠퍼스] 데이터시각화 강의 3주차 학습 기록

태블로로 데이터 가공해서 시각화 하는 방법

태블로로 데이터 가공해서 시각화하고 있는 장면
패캠 국비지원교육 실습 화면 (태블로로 데이터 가공해서 시각화하고 있는 장면)

 

비즈니스 문제 해결을 위해 가지고 있는 데이터를 계산(활용)해서 새로운 필드를 생성할 일이 많다. 위 태블로 화면만 보더라도 그렇다. 월별로 몇 건의 주문이 발생하는지 추이를 보기 위해선 가지고 있는 데이터 원본의 [order date] 필드와 [order id] 필드를 활용해 월별로 order id 를 count 한 또다른 계산된 필드가 있어야 한다. 이번 주차에서는 비즈니스 문제 해결을 위한 계산된 필드의 기본 개념과 활용 사례에 대해 배웠다.

계산된 필드란

새로운 데이터를 만들어서 분석하기 위해 새로운 컬럼을 만들어내는 것이다. 데이터 원본의 행 수준에서 계산하는 행 수준 계산과, 데이터를 집계하여 계산하는 집계 계산이 있다. 엑셀이나 SQL 에서 통상적으로 사용하는 함수를 활용해 새로운 컬럼을 만들어낼 수 있다. 

태블로에서 계산된 필드를 만들 때 가장 많이 나타나는 오류와 해결 방법

• 집계된 필드와 집계되지 않은 필드를 혼합해서 계산된 필드를 만들려고 하는 오류

예를 들어

sum([Profit]) / [Sales]

와 같이 Profit 필드를 합계한 '집계 필드'와 집계되지 않은 필드인 [Sales] 를 계산하는 필드는 정상적으로 작동하지 않는다.

이 오류를 해결하기 위해선 1) 모든 필드를 집계하거나 2) 아예 모든 필드의 집계를 해제하는 방식으로 진행해야 한다.

 

• IF 식에서도 집계된 것과 집계되지 않은 것끼리 비교 하려는 오류

IF [Region] = 'west' THEN SUM([SALES]) END

의 경우 [Region] = 'west' 는 집계되지 않는 것인데 결과를 집계된 것으로 뱉으려고 하기 때문에 오류가 발생한다.

이럴 땐 1) 모든 필드의 집계를 해제한 후에 마지막에 한꺼번에 집계하는 방식 2) ATTR 을 활용해 비집계값을 집계값처럼 변경해서 해결한다.

 

1) 모든 필드의 집계를 해제한 후에 마지막에 한꺼번에 집계하는 방식으로 해결하는 예시

sum ( if [Region] = “West” then [Sales] END )

2) ATTR 을 활용해 비집계값을 집계값처럼 변경해서 해결하는 예시

오류식
IF [Order Date] = #2017-02-19# 
THEN COUNTD([Customer Name])
END

-----
해결식
IF ATTR([Order Date]) = #2017-02-18# 
TEHN COUNTD([Customer Name])
END