데이터 분석가:Applied Data Analytics/데이터 시각화 16

Dash 시각화

Python 기반의 웹 대시보드 프레임워크인 Dash 구현 주피터 노트북이나 아나콘다 프롬프트에서 다음을 실행pip install dash 아래 명령어는 Jupyter 셀이 아닌 아나콘다 프롬프트 또는 CMD/Terminal에 입력jupyter labextension install jupyterlab-plotly최근 버전에서는 JupyterLab에서 특별한 확장 없이도 mode='inline'이 작동할 수 있습니다.즉, 이 명령어 자체가 필요 없을 수도 있습니다. 다음만 실행해보고 확인아래를 JupyterLab에서 실행from jupyter_dash import JupyterDash from dash import html app = JupyterDash(__name__) app.layout = html..

Dash (by Plotly)란?

1.1 기본 개념Dash는 Python 기반의 웹 애플리케이션 프레임워크입니다.특히 데이터 시각화 대시보드를 만들기 위해 설계되었습니다.Plotly라는 시각화 라이브러리를 기반으로 동작합니다.HTML, CSS, JavaScript를 직접 다룰 필요 없이 Python 코드만으로 대시보드를 만들 수 있습니다.1.2 다른 도구들과의 비교 (Superset, Looker, Tableau)기술기반PythonSQL + UILookMLDrag & Drop실시간 인터랙션매우 강력 (Python 콜백 사용)제한적 (필터링 위주)일부 가능필터링 가능예측 모델 연동Python으로 직접 구현 가능 (sklearn, XGBoost 등)어려움Looker Action 필요외부 연동 필요커스터마이징완전 자유 (코드 기반)제한적제한적..

블로그에 작성한 보고서를 Obsidian으로

블로그에 작성한 보고서를 Obsidian으로 옮겨서 정리하고 발표자료로 활용하려면 아래와 같은 단계별 매뉴얼을 따르면 됩니다.초보자도 그대로 따라할 수 있도록 아주 쉽게 정리했습니다. 1단계. 블로그에서 글 복사웹브라우저로 블로그에 접속정리한 보고서 게시글 열기마우스로 전체 선택 후 Ctrl + C 로 복사2단계. Obsidian 설치 (이미 설치했다면 건너뛰어도 됨)Obsidian 공식 사이트 접속: https://obsidian.md/Download 버튼 클릭 → Windows용 설치 파일 다운로드다운로드한 설치 파일 실행 → 설치 완료 후 Obsidian 실행3단계. 새 Vault(노트 저장소) 만들기Obsidian 실행첫 화면에서 "Create new vault" 선택Vault 이름 입력 (예: ..

Amplitude(앰플리튜드) - 실전편

그래프 에 1, 2, 3 이 동일하게 설정되었는데 이것중 2,3번을 다른걸로 바꾸는것에 대해 설명하겠습니다.현재 화면에서 2번과 3번 세그먼트를 변경하는 방법을 아주 설명드리겠습니다. 아래 단계를 따라가시면 쉽게 변경할 수 있습니다.1. 앰플리트에서 세그먼트 변경하기:현재 상태:1번, 2번, 3번 세그먼트 모두 **"Weekly Active Users (account_id)"**로 설정되어 있습니다.2. 세그먼트 변경하기:세그먼트를 변경하려면, 2번과 3번 세그먼트 항목을 새롭게 설정해야 합니다.2.1. 2번 세그먼트 변경:2번 세그먼트 옆에 있는 세그먼트 설정 영역을 클릭합니다."Weekly Active Users (account_id)"가 선택되어 있을 것입니다.다른 값을 선택하려면, 드롭다운 메뉴에..

Amplitude (앰플리튜드) 란?

Amplitude(앰플리튜드)를 활용해 프로젝트 분석 보고서를 작성하려는 초보자를 위한 기초 사용법 매뉴얼입니다. 가능한 쉽게, 체계적으로, 단계별로 정리 했습니다.Amplitude 사용법 초보자 매뉴얼1. Amplitude란 무엇인가?Amplitude는 제품 분석(Product Analytics) 도구로, 사용자의 행동 데이터를 기반으로 사용자 흐름, 전환, 이탈, 잔존율, 이벤트 성과 등을 분석할 수 있음.Google Analytics보다 제품 내부 행동 분석에 특화되어 있음.Amplitude에서는 고객 이탈률(Churn Rate), 재방문율(Retention Rate) 등 고객 행동 분석 지표를 시각화해서 볼 수 있고,당신이 운영하는 블로그처럼 서비스 웹사이트/앱 사용자 흐름을 추적하는 데 아주 효..

클라우드 슈퍼셋 내용 외부 공유방법

클라우드 슈퍼셋 preset에서 대시보드전체 내용 탭별 내용포함 외부로 공유하는방법 ? ChatGPT의 말:클라우드 Superset (Preset)에서 대시보드 전체 내용을 탭별 내용까지 포함하여 외부에 공유하는 방법은 다음과 같은 단계로 할 수 있습니다.1. Public 공유 설정 (공개 대시보드 URL 생성)관리자 권한 필요: 공유 기능을 사용하려면 Preset 관리자 또는 해당 워크스페이스에서 공개 설정 권한이 있어야 합니다.공개 설정하기:대시보드 편집 모드로 이동우측 상단 “...” > Edit dashboard metadata 선택“Make this dashboard public” 옵션을 체크하거나, 퍼블릭 액세스 롤(Public role) 설정 확인URL 복사: 공개 설정 후 대시보드 상단 “..

클라우드 슈퍼셋 보고서 작성 발표요약

Looker Studio 활용 요약1차 EDA 시각화 작업은 Looker Studio를 통해 대시보드를 구성사용자 리텐션 흐름을 시각적으로 표현하여 전반적 패턴 이해에 도움리텐션 분석 요약 (Control vs Intervention)1. 개요목적: 리텐션 흐름 파악기간: 2016년 8월 ~ 2017년 5월출처: Google Merchandise Store 데이터2. 주요 지표 (KPI Summary)총 방문 수: 748,134첫 방문자 수: 580,671도시 수: 615, 국가 수: 218장바구니 추가 수: 40,954디바이스·운영체제·브라우저 정보 포함3. 유입 트렌드 분석Line Chart: 일별, 시간별 방문 수Heatmap: 시간대별 집중 트래픽4. 유입 채널별 리텐션Line Chart: 채널별..

Heatmap 차트 (Retention Matrix) - 클라우드슈퍼셋 시각화

1. Heatmap 차트 (Retention Matrix) – 가장 임팩트 있고 전통적인 표현목표:가입 Cohort 별로 Day 0 ~ Day 7까지의 Retention 비율을 시각화 (색상으로 유지율 차이 강조)Superset 차트 설정법:설정 항목값Chart TypeHeatmapRow (Y축)cohort_weekColumn (X축)days_since_first_visitMetric (Value)COUNT(DISTINCT fullVisitorId)FilterisFirstVisit = 0 (재방문만 포함)Normalize열 기준으로 비율 계산 (% of row total 옵션)Tooltipcountry, deviceCategory, trafficSource 추가하면 hover 시 상세 정보 표시Color..

클라우드 슈퍼셋 시각화 - 이미지 바로 보이게 하기

구글코렙에서 작성한 파일을 CSV로 저장하여 100MB이상이므로 구글스토리지에 올려서 빅쿼리에 연결하고 Json키를 만들어서클라우스 슈퍼셋에 연동한 뒤 위에 화면처럼 선택이 가능합니다.  구글코렙 ~ Json키 발급하고 클라우스슈퍼셋 연동까지는https://nesaram-health-1story.tistory.com/319 이글을 참고하세요. 1. 코호트 재방문 추이 (Line Chart)Colab 코드python복사편집plt.plot(first_cohort['days_since_first_visit'], first_cohort['n_users']) Superset 구현Chart Type: Line ChartX-axis: days_since_first_visitMetrics: COUNT_DISTINCT(..

데이터 웨어하우스에 업로드한 후 Looker와 연결후 시각화

1. CSV 파일을 데이터 웨어하우스(예: Google BigQuery)로 업로드A. Google BigQuery에 CSV 파일 업로드BigQuery 콘솔 접속:Google Cloud Console에서 BigQuery 페이지로 이동합니다.데이터셋 생성:CSV 파일을 업로드할 데이터셋이 없다면, 새 데이터셋을 생성합니다.BigQuery 왼쪽 패널에서 프로젝트명을 클릭하고 **"데이터셋 만들기"**를 선택합니다.데이터셋 ID, 위치 및 기타 옵션을 설정한 후 생성합니다.테이블 생성 및 CSV 파일 업로드:생성한 데이터셋 내에서 "테이블 만들기" 버튼을 클릭합니다.소스 유형(Source)에서 "파일 업로드"를 선택하고 CSV 파일을 선택합니다.파일 형식(File format)은 CSV로 지정합니다.대상 테이블..

Sankey 차트를 LTV 시각화에 사용하는 이유

LTV(Lifetime Value, 고객 생애 가치)는 고객 생애주기와 밀접하게 관련되어 있지만, 두 개념은 동일하지 않다.LTV(고객 생애 가치): 한 명의 고객이 기업과 관계를 맺는 동안 발생시키는 총수익을 정량적으로 평가한 지표입니다. 이는 고객이 기업에 기여하는 경제적 가치를 측정하며, 고객의 평균 구매 금액, 구매 빈도, 관계 유지 기간 등을 기반으로 계산됩니다.고객 생애주기: 고객이 기업과 관계를 맺는 기간 동안의 모든 단계를 의미합니다. 예를 들어, 고객이 처음 브랜드를 접하고, 구매하고, 재구매하거나 이탈하기까지의 과정을 포함합니다.따라서, LTV는 고객 생애주기 동안 발생하는 수익을 수치화한 결과로 볼 수 있다. 즉, LTV는 고객 생애주기를 기반으로 산출되는 경제적 지표라고 할 수 있다..

Superset 클라우드 시각화 2nd

태블로에 스토리 기능이 클라우드 슈퍼셋에도 구현이 되네요. 오히려 메뉴식으로 되어있어 더 깔끔한듯 합니다. 기능은 맨밑에 내용입니다. 클라우드 Superset 시각화 사용 후기프로그램자체가 너무 가볍네요. 협업툴로도 손색이 없고 단 클라우드 슈퍼셋은 유료입니다. 무료로는 14일 무료로 사용가능해요.차트에서 바차트나 파이차트 선택하고 Dimensions, Metric, 필요하면 Filters 에 컬럼입력하면 바로 파이차트가 됩니다.위에 창은 필터 구현은 안한거라 최소 필터 종류에 따라 3 x 4 (물론 필터에 입력한 컬럼의 내용수에 따라 정해집니다.)총 12가지 필터 수치에 의한 파이차트가 표현가능 합니다.아래처럼 레이아웃을 설정하여 메뉴처럼 넘어갈수도 있네요. 이기능은 정말 좋은것 같습니다. 아래는 A..

Superset 클라우드 시각화 1st

5. Superset 대시보드 구성 예시 (이 데이터 기반)차트 제목차트 유형필터버전별 Retention 비교Bar ChartGroup by: version유저당 평균 게임 횟수KPI 또는 Box Plot전체활동 시간대별 평균 게임 횟수Bar ChartGroup by: activity_time유료 사용자 전환율KPI (Big Number)필터 없음ARPU (사용자당 수익)KPI필터 없음 특히 제가 준비한 CSV 데이터에는 referrer, channel, signup_date 같은 유입(Acquisition) 관련 정보가 없기 때문에 AARRR의 시작점인 "획득(Acquisition)"을 분석하기엔 정보가 부족함.반대로 사용자 유지와 활성화, 수익 기여도 분석에는 매우 적합한 구조라서 RARRA 분석이 ..

클라우드 Superset 시각화

1. 실험 설계1-1. 샘플 수 및 비율 확인import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df = pd.read_csv('final_cookie_cats_for_superset_02.csv') # 버전별 샘플 수 시각화 sns.countplot(x='version', data=df) plt.title('Version별 샘플 수') plt.show() # 비율 출력 print(df['version'].value_counts(normalize=True))1-2. 가설 설정 및 t-test 수행 (예: retention_1 기준)from scipy.stats import ttest_ind # retention_1: True..

클라우드 Superset

Superset 클라우드 호스팅 서비스Preset.io: Superset을 만든 회사에서 운영하는 공식 상업용 SaaS사용자는 설치 없이 계정만 만들고 바로 협업 가능무료 플랜 제공 (기능 제한 있음)클라우드에서 Superset을 설치하면 협업에 최적화된 분석 환경 구성 가능Ubuntu 서버에 Superset을 설치해 공인 IP나 도메인을 통해 운영AWS EC2, Oracle Cloud, GCP 등이 설치 플랫폼으로 적합Nginx + HTTPS + 계정관리까지 구성하면 완전한 프로덕션 환경 가능Preset.io 계정 생성 및 사용법 Preset.io 계정 생성 및 사용법 가입한 후 한사람이 이메일 초대를 하면 서로 만날수 있다서로의 작업공간을 만들수 있다.Preset.io를 활용한 Superset 대시보..

Superset 설치

먼저 Superset이 뭔지 왜 사용하는지 설명합니다. 설치부터 보실분은 아래 구분선 부터 보시면 됩니다.Superset(슈퍼셋)의 정의 및 특징:주요 특징 및 장점:오픈소스 & 무료누구나 자유롭게 사용 가능하고 커스터마이징도 자유로움.다양한 데이터베이스 지원MySQL, PostgreSQL, BigQuery, SQLite, Hive 등 대부분의 데이터베이스 연결 가능.풍부한 시각화 기능바 차트, 라인 차트, 히트맵, 산점도, 지도 시각화 등 다양한 시각화 유형 지원.인터랙티브 대시보드대시보드를 통해 여러 데이터를 동적으로 상호작용하며 분석 가능.빠른 분석 및 협업 용이성SQL 에디터 내장, 직관적인 인터페이스로 데이터 분석 속도가 빠르고, 팀 협업도 편리.확장성과 사용자 지정 기능사용자의 필요에 맞게..

300x250
SMALL