태블로에서 만들기 좋은 인터랙티브 대시보드 와 함께, 각 시각화를 위해 필요한 데이터 병합 및 전처리 전략
1. 숙소 요약 대시보드
숙소 유형, 가격대, 지역별 분포를 한눈에 보여주는 기본 대시보드
주요 시각화
- 지역(Neighbourhood)별 숙소 수 및 평균 가격 지도
- 숙소 유형(Room Type) 비율 파이차트
- 가격대별 숙소 수 히스토그램
- 숙소 수/평균 가격 트렌드 (Bar 또는 Line)
사용 파일
- listings.csv
- neighbourhoods.csv 또는 neighbourhoods.geojson
전처리 전략
- listings.csv에서 필요한 컬럼 추출:
id, neighbourhood, room_type, price, number_of_reviews, availability_365 - price는 문자열($1,234) → 숫자 변환 필요 (int 또는 float)
- neighbourhood 컬럼 기준으로 neighbourhoods.csv 또는 .geojson과 병합 → 지도 시각화
2. 예약 가능성과 수익 대시보드
예약 가능일과 가격 변화를 통해 호스트의 수익 예측을 도와주는 대시보드
주요 시각화
- 날짜별 평균 가격 변화 (Line Chart)
- 예약 가능률 변화 (Line Chart or Heatmap)
- 숙소 ID 또는 지역 선택 → 해당 숙소의 시간대별 가격 & 예약 가능 여부
사용 파일
- calendar.csv
- listings.csv (숙소 정보 병합용)
전처리 전략
- calendar.csv에서 listing_id, date, price, available 추출
- price: $, , 제거 후 숫자 변환
- available: t, f → Boolean (1, 0)
- 날짜별 그룹화: 평균 가격 및 예약률 계산
- listing_id 기준으로 listings.csv와 병합 → 숙소 속성 필터링
3. 리뷰 분석 대시보드
리뷰 수, 최신 리뷰 날짜 등을 통해 사용자 피드백을 시각화
주요 시각화
- 월별/분기별 리뷰 수 추이
- 숙소별 리뷰 수 Top N
- 리뷰 작성자 이름과 날짜 타임라인
- 지역/숙소 선택 → 해당 숙소 리뷰 표시
사용 파일
- reviews.csv
- listings.csv (숙소 이름, 지역 연결용)
전처리 전략
- reviews.csv에서 listing_id, date, reviewer_name 추출
- date: 날짜 형식 변환 → 연도, 월 컬럼 파생
- 리뷰 수 집계 (월, 숙소별)
- listing_id 기준으로 listings.csv와 병합하여 숙소 정보 연결
4. 지역 기반 분석 대시보드
특정 지역을 선택하면 해당 지역의 평균 가격, 숙소 유형, 리뷰 수 등이 동적으로 표시
주요 시각화
- 지역 선택 (Filter or 지도 클릭)
- 선택된 지역의 숙소 평균 가격, 리뷰 수, 예약 가능률 등 요약 카드
- 지역 내 숙소 분포 및 유형 히트맵
사용 파일
- 전 파일: listings, calendar, reviews, neighbourhoods
전처리 전략
- 모든 데이터의 listing_id, neighbourhood 기준 정규화
- calendar, reviews → listing_id별 집계 (예약 가능일 수, 리뷰 수 등)
- listings.csv 중심으로 병합
추천 워크플로우
- 필요 컬럼만 추출해서 작은 CSV 파일로 저장
- 숫자형 변환 및 결측치 처리
- 숙소 ID 기준 병합 (listings 중심)
- 태블로로 불러와서 관계(Relationship) 또는 병합된 파일 사용
"인터랙션 방식 대시보드"는 사용자가 특정 지역, 숙소, 날짜 등을 선택하거나 클릭할 때 관련 정보가 동적으로 반응하는 구조라서 데이터 분석의 몰입도와 가치 전달력이 아주 높습니다.
목표: 지역 기반 인터랙션 대시보드 (동적 필터링 중심)
1. 전체 구조
구성 요소 | 역할 | 태블로 시트 이름 예시 |
지도 (지역 단위) | 지역 선택 | 지도: 지역별 숙소 |
카드 (요약값) | 선택된 지역의 요약 정보 | 카드: 평균 가격, 카드: 총 리뷰 수 |
바 차트 | 숙소 유형별 수 / 평균 가격 | 막대: 숙소유형별 분석 |
라인 차트 | 날짜별 평균 가격/예약률 | 선: 가격/예약률 트렌드 |
리뷰 타임라인 | 최근 리뷰 추이 | 선: 리뷰 수 추이 |
2. 사용자 인터랙션 방식
사용자 행동 | 반응하는 시각화 |
지역 클릭 (지도) | 아래 모든 시각화가 해당 지역으로 필터됨 |
숙소 유형 선택 (필터 또는 클릭) | 평균 가격/리뷰 수 등 변화 |
날짜 범위 선택 (슬라이서) | 가격 변화 차트 및 리뷰 수 반응 |
3. 필요 데이터 병합
listings.csv를 중심으로 아래처럼 전처리합니다:
- listings.csv: 숙소 ID, 이름, 가격, 지역, 숙소 유형 등 핵심 정보
- calendar.csv: 예약 가능일 수, 날짜별 가격 → listing_id별 요약 집계
- reviews.csv: 리뷰 수, 최신 리뷰 날짜 → listing_id별 요약
- neighbourhoods.csv 또는 .geojson: 지역 좌표 지도 표시용
병합 결과 예시 (최종 테이블):
listing_id | neighbourhood | room_type | price | availability_365 | review_count | avg_daily_price | ... |
4. 태블로 시트 구성 예시
- [지도] 지역별 평균 숙소 가격
- 데이터: listing_id, neighbourhood, price
- 마크: Circle or Polygon
- 컬러: 평균 가격 (색상 강도)
- 작업: 지역 클릭 → 모든 시트에 필터 적용
- [카드] 요약 정보
- 필터: 선택된 지역
- 수치: 평균 가격, 리뷰 수, 예약 가능률 등
- 마크: 텍스트
- 여러 개의 시트로 구성 → 대시보드에 카드처럼 배치
- [막대] 숙소 유형별 숙소 수 & 평균 가격
- 필터: 선택된 지역
- 축: 숙소 유형, 값: 개수 or 평균 가격
- [선형 차트] 날짜별 평균 가격/예약률
- 데이터: calendar.csv
- 날짜 슬라이서 + 지역 필터
- 날짜별 평균 가격, 예약 가능률 (available 비율)
- [리뷰 추이] 시간대별 리뷰 수
- 데이터: reviews.csv
- 날짜 필터 및 지역 필터
- 리뷰 작성일 기준 리뷰 수 추이 (선형 차트)
5. 구현 팁
- 태블로 대시보드 → 시트 배치 후, "사용자 지정 동작 → 필터" 사용해서 인터랙션 설정
- 지도 클릭 시 neighbourhood 기준으로 다른 시트 필터링
- 날짜 필터는 calendar.csv를 활용해 범위 슬라이서로 구현
날짜 차이를 활용한 기발한 인사이트 아이디어
1. 전년 동월 대비 가격 변화 분석 (YoY Price Change)
- 같은 숙소 또는 지역에서 2024년 3월 vs 2025년 3월의 평균 가격 차이를 시각화
- 인사이트 예시: “종로구는 작년 대비 18% 가격이 상승함 → 수요 증가 or 공급 감소 추정”
2. 예약률 변화 (YoY Availability Rate)
- 숙소별 또는 지역별로 예약 가능률(available 필드) 비교
- 해석 가능성: 인기 상승/하락, 운영 종료, 계절 수요 변화
3. 리뷰 감성 변화 트렌드 분석
- 2024년 3월 vs 2025년 3월 리뷰 텍스트 감성 점수 평균 비교
- 가능한 패턴: “올해 리뷰는 긍정 비율이 줄었고 불만이 늘어남 → 서비스 저하?”
4. 특정 이벤트 전후 비교
- 3월은 졸업/입학 시즌, 봄꽃 축제 등 특수 이벤트가 많은 달
- 해당 지역(예: 여의도, 종로 등)에서 3월 중 이벤트 시점 전후 가격/리뷰 비교 가능
5. 전년대비 신규 vs 지속 숙소 비교
- listing_id가 작년에도 존재했는지 비교 → 신규 숙소 vs 운영 지속 숙소
- 신규 숙소가 더 저렴한지, 예약률이 낮은지, 감성 점수가 낮은지 등 분석
시각화 아이디어 예시 (태블로)
시각화 이름 | 분석 질문 | 시각화 유형 |
전년 동월 대비 평균 가격 변화 | “어느 지역이 가격이 가장 많이 올랐나?” | 꺾은선 or 막대 차트 |
예약 가능률 추이 | “3월 중 어떤 주차가 더 예약이 잘 되었나?” | 히트맵 or 라인차트 |
감성 점수 변화 | “2025년이 되면서 리뷰 분위기가 더 나빠졌나?” | 감성 꺾은선 비교 |
신규 vs 기존 숙소 비교 | “새로 등장한 숙소들이 더 저렴한가?” | 바이올린 차트, 박스 플롯 |
추가 추천 분석 요소
파생변수 | 활용 용도 |
is_same_day_last_year | 작년 같은 날짜의 데이터 매칭 |
price_change_pct | 가격 변화율 계산 |
sentiment_delta | 감성 점수 변화량 |
is_new_listing | 작년엔 없고 올해 생긴 숙소 식별 |
'데이터 분석가:Applied Data Analytics' 카테고리의 다른 글
태블로 시각화 프로젝트 예시 (0) | 2025.03.25 |
---|---|
데이터 시각화-Tableau(태블로) 대시보드 (0) | 2025.03.25 |
데이터 시각화, 태블로 (0) | 2025.03.21 |
데이터 시각화의 주요 단계 (0) | 2025.03.19 |
주석표시(SQL, 파이썬, 구글코렙) (0) | 2025.03.18 |