300x250
반응형
SMALL

태블로 9

Main Quest06_Project_Tableau 태블로 시각화 6-6

태블로 에서 최종 인터랙티브 한 동적효과 구현한 최종 결과물주간 Trend_주문수의 해당 주를 선택하면 나머지 지수와 그래프는 이에 맞게 실시간 변형됨Los Angeles CA지점을 선택하면 해당 지점의 정보와 오른쪽 센터위치의 날씨가 실시간 표시된다.Clear sky 맑은하늘물류센터를 다른쪽 선택시 오른쪽 센터위치 날씨가 실시간 바뀐다  overcast clouds : 흐린 구름아래는 로스엔젤레스 센터에서 Port Authority of New Youk센터까지의 물류이동시간과 경로가 나온다.물론 항공운송일때는 5시간10분차로 이동시에는 41시간 이다. 물류의 배송의 시급성에 따라 운송수단을 선택할 수 있다.물류센터 현황MQ06_C3_Project Lesson Learn  빅쿼리 작업연동하여 실시간 서비..

Main Quest06_Project_Tableau 태블로 시각화 6-5

기본 계산 필드1. 배송 지연 여부 (숫자 플래그)IF [delivery_status] = "지연" THEN 1 ELSE 0 END용도: 지연률 계산, 지연 수량 집계2. 날씨별 지연률SUM(IF [delivery_status] = "지연" THEN 1 ELSE 0 END)/ COUNT([order_item_id])용도: 날씨 조건별 지연률 분석3. 비 또는 눈일 때 배송 상태IF [condition] IN ("Rain", "Snow") THEN [delivery_status] ELSE NULL END용도: 궂은 날씨일 때의 배송 결과만 필터링4. 날씨 + 배송상태 조합 필드[condition] + " | " + [delivery_status]용도: 교차표, 트리맵, 바 차트용 카테고리 생성예시:"Rai..

Main Quest06_Project_Tableau 태블로 시각화 6-4

태블로에서 필요한 v_logistics_dashboard_4.csv 파일을 생성 후1. 대시보드 목적 정의목표: 배송 효율성과 고객 만족을 극대화하기 위해 주요 물류 KPI를 실시간으로 모니터링하고, 지역별/센터별 문제를 빠르게 식별2. 주요 KPI 지표 선정핵심 성과 지표(KPI):총 주문 수 (total_orders)지연 주문 수 (delayed_orders)반품 주문 수 (returned_orders)지연율 (delay_rate)반품율 (return_rate)정시배송률 (on_time_rate)SPI (Service Performance Index, spi_score)평균 배송일 (delivery_days)3. SPI 구상SPI 정의 예시 (데이터에 포함된 지수 기반):→ 이미 계산된 spi_sco..

Main Quest06_Project_Tableau 태블로 시각화 6-3

태블로용 예측결과 데이터 생성현재 머신러닝 예측 중 One-Hot Encoding으로 인해 메모리 초과(MemoryError)가 발생이유는 state, name 같은 범주형 변수가 너무 많은 고유 값을 가져서 수천 개의 열로 확장되었기 때문.해결 방안범주형 변수는 Label Encoding으로 바꾸고, 나머지는 그대로 유지하여 메모리를 줄임. 다시 예측 파일을 생성. ​​여전히 메모리 초과가 발생. 데이터 양이 많아서 모델 전체 학습에 부담이 가는 상황. 이를 해결하기 위해:해결 전략데이터의 일부만 샘플링하여 모델을 학습하고 예측.샘플 데이터(예: 10,000건)를 사용하면 빠르게 예측 가능, 태블로 테스트용으로도 충분.  ​​지속적인 메모리 초과로 인해 학습 및 저장이 어려운 상황!해결 방안 요약 (태..

Main Quest06_Project_Tableau 태블로 시각화 6-1

피그마 링크 (암호: aiffel) https://www.figma.com/design/kr6NrmqIG8QTAdVHSYTt6c/Untitled?node-id=0-1&t=iWyFTulKIA4HY72R-1 코랩 링크공동작업을 위해서는 구글빅쿼리로 작업을 진행하고 데이터마트를 만들어서 서로 공유장점 : 공동작업과 중간에 업데이트는 쿼리코드만 공유하면 쉽게 데이터나 뷰가 생성된다.     - 주의 : 사전에 이런정보를 공유하지 않으면 개인의 쿼리코드작업후 저장안된건 공유불가능 빅쿼리는 저장안한 코드는 삭제됨.         보안책 : 이럴경우 빅쿼리에서 본인이 업데이트한 뷰나 테이블을 CSV로 저장(빅쿼리 에서 저장할 수 있음) 한 후 공유하면됨이때 아래 처럼 빅쿼리 공유를 구글이메일로 권한을 줘야 액세스 거..

데이터 시각화-Tableau(태블로) 대시보드

Tableau 대시보드는 데이터를 시각화하고 분석할 수 있는 강력한 도구로, 사용자에게 다양한 데이터 소스를 통합하여 중요한 정보를 한 화면에 제공하는 기능을 제공합니다.대시보드의 주요 특징다양한 시각화 통합:대시보드는 여러 워크시트(차트, 그래프, 맵 등)를 하나의 화면에 결합하여 다양한 관점을 한눈에 볼 수 있게 합니다.여러 데이터 소스에서 가져온 정보를 하나의 대시보드에서 통합적으로 분석 가능.인터랙티브 기능:필터, 하이라이트, 액션을 추가하여 사용자가 데이터를 동적으로 탐색할 수 있습니다.특정 데이터 포인트를 클릭하면 관련된 다른 시각화가 업데이트되거나 상세 정보를 표시하는 드릴다운 기능을 제공합니다.실시간 데이터 업데이트:연결된 데이터 소스가 변경되면 대시보드가 실시간으로 업데이트되어 최신 데이..

태블로 대시보드 작업 에이비앤비

태블로에서 만들기 좋은 인터랙티브 대시보드 와 함께, 각 시각화를 위해 필요한 데이터 병합 및 전처리 전략1. 숙소 요약 대시보드숙소 유형, 가격대, 지역별 분포를 한눈에 보여주는 기본 대시보드주요 시각화지역(Neighbourhood)별 숙소 수 및 평균 가격 지도숙소 유형(Room Type) 비율 파이차트가격대별 숙소 수 히스토그램숙소 수/평균 가격 트렌드 (Bar 또는 Line)사용 파일listings.csvneighbourhoods.csv 또는 neighbourhoods.geojson전처리 전략listings.csv에서 필요한 컬럼 추출:id, neighbourhood, room_type, price, number_of_reviews, availability_365price는 문자열($1,234) ..

데이터 시각화

[출처 : 구글데이터 애널리틱스 강의중]데이터 시각화를 계획하는 단계데이터 애널리스트가 이해관계자와 공유하기 위해 데이터 시각화를 만들어야 하는 실제 상황을 예로 들어 보겠습니다. 여러분이 의류 유통업체의 데이터 애널리스트라고 가정해 보겠습니다. 이 회사는 소규모 의류 매장의 재고 관리를 지원하며 매출이 호황을 누리고 있습니다. 어느 날, 회사에서 웹사이트를 대대적으로 업데이트할 준비를 하고 있다는 소식을 듣게 됩니다. 웹사이트 업데이트에 대한 결정을 내리기 위해 기존 웹사이트의 데이터와 판매 레코드를 분석하라는 요청을 받습니다. 수행할 수 있는 단계1단계: 데이터에서 패턴 탐색하기먼저 관리자나 데이터 소유자에게 현재 판매 레코드 및 웹사이트 애널리틱스 보고서에 대한 액세스 권한을 요청합니다. 여기에는 ..

데이터 시각화, 태블로

목적 추천 차트 유형구성 요소 비율/비교(범주형) 누적 막대 차트두 변수 간 관계(연속형) 분산형(산점도) 차트누적 막대 차트(Stacked Bar Chart)는 두 변수 간의 관계를 나타내는 데는 적합하지 않습니다.정확한 이해를 위해, 다음과 같이 기억하세요:1. 누적 막대 차트의 주된 용도전체 대비 각 구성 요소의 비율(상대적 비중)을 시각화하는 데 사용됩니다.시간이나 그룹에 따른 비율의 변화나 구성요소 간 비교를 확인하는 데 효과적입니다.2. 두 변수 간 관계를 표현하는 데는 부적합한 이유누적 막대 차트는 한 변수의 세부 구성을 보여줄 뿐, 두 연속형 변수의 상관관계나 경향성을 나타낼 수 없습니다.두 변수의 상관관계를 명확히 보여주는 데는 **산점도(분산형 차트)**가 가장 적합합니다.3. 두 변수..

300x250
반응형
LIST