데이터 분석가:Applied Data Analytics

태블로 대시보드 작업 에이비앤비

데이터분석 2025. 3. 24. 23:04

태블로에서 만들기 좋은 인터랙티브 대시보드 와 함께, 각 시각화를 위해 필요한 데이터 병합 및 전처리 전략


1. 숙소 요약 대시보드

숙소 유형, 가격대, 지역별 분포를 한눈에 보여주는 기본 대시보드

주요 시각화

  • 지역(Neighbourhood)별 숙소 수 및 평균 가격 지도
  • 숙소 유형(Room Type) 비율 파이차트
  • 가격대별 숙소 수 히스토그램
  • 숙소 수/평균 가격 트렌드 (Bar 또는 Line)

사용 파일

  • listings.csv
  • neighbourhoods.csv 또는 neighbourhoods.geojson

전처리 전략

  1. listings.csv에서 필요한 컬럼 추출:
    id, neighbourhood, room_type, price, number_of_reviews, availability_365
  2. price는 문자열($1,234) → 숫자 변환 필요 (int 또는 float)
  3. neighbourhood 컬럼 기준으로 neighbourhoods.csv 또는 .geojson과 병합 → 지도 시각화

2. 예약 가능성과 수익 대시보드

예약 가능일과 가격 변화를 통해 호스트의 수익 예측을 도와주는 대시보드

주요 시각화

  • 날짜별 평균 가격 변화 (Line Chart)
  • 예약 가능률 변화 (Line Chart or Heatmap)
  • 숙소 ID 또는 지역 선택 → 해당 숙소의 시간대별 가격 & 예약 가능 여부

사용 파일

  • calendar.csv
  • listings.csv (숙소 정보 병합용)

전처리 전략

  1. calendar.csv에서 listing_id, date, price, available 추출
  2. price: $, , 제거 후 숫자 변환
  3. available: t, f → Boolean (1, 0)
  4. 날짜별 그룹화: 평균 가격 및 예약률 계산
  5. listing_id 기준으로 listings.csv와 병합 → 숙소 속성 필터링

3. 리뷰 분석 대시보드

리뷰 수, 최신 리뷰 날짜 등을 통해 사용자 피드백을 시각화

주요 시각화

  • 월별/분기별 리뷰 수 추이
  • 숙소별 리뷰 수 Top N
  • 리뷰 작성자 이름과 날짜 타임라인
  • 지역/숙소 선택 → 해당 숙소 리뷰 표시

사용 파일

  • reviews.csv
  • listings.csv (숙소 이름, 지역 연결용)

전처리 전략

  1. reviews.csv에서 listing_id, date, reviewer_name 추출
  2. date: 날짜 형식 변환 → 연도, 월 컬럼 파생
  3. 리뷰 수 집계 (월, 숙소별)
  4. listing_id 기준으로 listings.csv와 병합하여 숙소 정보 연결

4. 지역 기반 분석 대시보드

특정 지역을 선택하면 해당 지역의 평균 가격, 숙소 유형, 리뷰 수 등이 동적으로 표시

주요 시각화

  • 지역 선택 (Filter or 지도 클릭)
  • 선택된 지역의 숙소 평균 가격, 리뷰 수, 예약 가능률 등 요약 카드
  • 지역 내 숙소 분포 및 유형 히트맵

사용 파일

  • 전 파일: listings, calendar, reviews, neighbourhoods

전처리 전략

  1. 모든 데이터의 listing_id, neighbourhood 기준 정규화
  2. calendar, reviews → listing_id별 집계 (예약 가능일 수, 리뷰 수 등)
  3. listings.csv 중심으로 병합

추천 워크플로우

  1. 필요 컬럼만 추출해서 작은 CSV 파일로 저장
  2. 숫자형 변환 및 결측치 처리
  3. 숙소 ID 기준 병합 (listings 중심)
  4. 태블로로 불러와서 관계(Relationship) 또는 병합된 파일 사용

 "인터랙션 방식 대시보드"는 사용자가 특정 지역, 숙소, 날짜 등을 선택하거나 클릭할 때 관련 정보가 동적으로 반응하는 구조라서 데이터 분석의 몰입도가치 전달력이 아주 높습니다.


목표: 지역 기반 인터랙션 대시보드 (동적 필터링 중심)


1. 전체 구조

구성 요소 역할 태블로 시트 이름 예시
지도 (지역 단위) 지역 선택 지도: 지역별 숙소
카드 (요약값) 선택된 지역의 요약 정보 카드: 평균 가격, 카드: 총 리뷰 수
바 차트 숙소 유형별 수 / 평균 가격 막대: 숙소유형별 분석
라인 차트 날짜별 평균 가격/예약률 선: 가격/예약률 트렌드
리뷰 타임라인 최근 리뷰 추이 선: 리뷰 수 추이

 


2. 사용자 인터랙션 방식

사용자 행동 반응하는 시각화
지역 클릭 (지도) 아래 모든 시각화가 해당 지역으로 필터됨
숙소 유형 선택 (필터 또는 클릭) 평균 가격/리뷰 수 등 변화
날짜 범위 선택 (슬라이서) 가격 변화 차트 및 리뷰 수 반응

 


3. 필요 데이터 병합

listings.csv를 중심으로 아래처럼 전처리합니다:

  1. listings.csv: 숙소 ID, 이름, 가격, 지역, 숙소 유형 등 핵심 정보
  2. calendar.csv: 예약 가능일 수, 날짜별 가격 → listing_id별 요약 집계
  3. reviews.csv: 리뷰 수, 최신 리뷰 날짜 → listing_id별 요약
  4. neighbourhoods.csv 또는 .geojson: 지역 좌표 지도 표시용

병합 결과 예시 (최종 테이블):

listing_id neighbourhood room_type price availability_365 review_count avg_daily_price ...

 


4. 태블로 시트 구성 예시

  1. [지도] 지역별 평균 숙소 가격
    • 데이터: listing_id, neighbourhood, price
    • 마크: Circle or Polygon
    • 컬러: 평균 가격 (색상 강도)
    • 작업: 지역 클릭 → 모든 시트에 필터 적용
  2. [카드] 요약 정보
    • 필터: 선택된 지역
    • 수치: 평균 가격, 리뷰 수, 예약 가능률 등
    • 마크: 텍스트
    • 여러 개의 시트로 구성 → 대시보드에 카드처럼 배치
  3. [막대] 숙소 유형별 숙소 수 & 평균 가격
    • 필터: 선택된 지역
    • 축: 숙소 유형, 값: 개수 or 평균 가격
  4. [선형 차트] 날짜별 평균 가격/예약률
    • 데이터: calendar.csv
    • 날짜 슬라이서 + 지역 필터
    • 날짜별 평균 가격, 예약 가능률 (available 비율)
  5. [리뷰 추이] 시간대별 리뷰 수
    • 데이터: reviews.csv
    • 날짜 필터 및 지역 필터
    • 리뷰 작성일 기준 리뷰 수 추이 (선형 차트)

5. 구현 팁

  • 태블로 대시보드 → 시트 배치 후, "사용자 지정 동작 → 필터" 사용해서 인터랙션 설정
  • 지도 클릭 시 neighbourhood 기준으로 다른 시트 필터링
  • 날짜 필터는 calendar.csv를 활용해 범위 슬라이서로 구현

날짜 차이를 활용한 기발한 인사이트 아이디어

1. 전년 동월 대비 가격 변화 분석 (YoY Price Change)

  • 같은 숙소 또는 지역에서 2024년 3월 vs 2025년 3월의 평균 가격 차이를 시각화
  • 인사이트 예시: “종로구는 작년 대비 18% 가격이 상승함 → 수요 증가 or 공급 감소 추정”

2. 예약률 변화 (YoY Availability Rate)

  • 숙소별 또는 지역별로 예약 가능률(available 필드) 비교
  • 해석 가능성: 인기 상승/하락, 운영 종료, 계절 수요 변화

3. 리뷰 감성 변화 트렌드 분석

  • 2024년 3월 vs 2025년 3월 리뷰 텍스트 감성 점수 평균 비교
  • 가능한 패턴: “올해 리뷰는 긍정 비율이 줄었고 불만이 늘어남 → 서비스 저하?”

4. 특정 이벤트 전후 비교

  • 3월은 졸업/입학 시즌, 봄꽃 축제 등 특수 이벤트가 많은 달
  • 해당 지역(예: 여의도, 종로 등)에서 3월 중 이벤트 시점 전후 가격/리뷰 비교 가능

5. 전년대비 신규 vs 지속 숙소 비교

  • listing_id가 작년에도 존재했는지 비교 → 신규 숙소 vs 운영 지속 숙소
  • 신규 숙소가 더 저렴한지, 예약률이 낮은지, 감성 점수가 낮은지 등 분석

시각화 아이디어 예시 (태블로)

시각화 이름 분석 질문 시각화 유형
전년 동월 대비 평균 가격 변화 “어느 지역이 가격이 가장 많이 올랐나?” 꺾은선 or 막대 차트
예약 가능률 추이 “3월 중 어떤 주차가 더 예약이 잘 되었나?” 히트맵 or 라인차트
감성 점수 변화 “2025년이 되면서 리뷰 분위기가 더 나빠졌나?” 감성 꺾은선 비교
신규 vs 기존 숙소 비교 “새로 등장한 숙소들이 더 저렴한가?” 바이올린 차트, 박스 플롯

 


추가 추천 분석 요소

파생변수 활용 용도
is_same_day_last_year 작년 같은 날짜의 데이터 매칭
price_change_pct 가격 변화율 계산
sentiment_delta 감성 점수 변화량
is_new_listing 작년엔 없고 올해 생긴 숙소 식별