300x250

데이터 분석가:Applied Data Analytics/데이터 시각화 9

Amplitude(앰플리튜드) - 실전편

그래프 에 1, 2, 3 이 동일하게 설정되었는데 이것중 2,3번을 다른걸로 바꾸는것에 대해 설명하겠습니다.현재 화면에서 2번과 3번 세그먼트를 변경하는 방법을 아주 설명드리겠습니다. 아래 단계를 따라가시면 쉽게 변경할 수 있습니다.1. 앰플리트에서 세그먼트 변경하기:현재 상태:1번, 2번, 3번 세그먼트 모두 **"Weekly Active Users (account_id)"**로 설정되어 있습니다.2. 세그먼트 변경하기:세그먼트를 변경하려면, 2번과 3번 세그먼트 항목을 새롭게 설정해야 합니다.2.1. 2번 세그먼트 변경:2번 세그먼트 옆에 있는 세그먼트 설정 영역을 클릭합니다."Weekly Active Users (account_id)"가 선택되어 있을 것입니다.다른 값을 선택하려면, 드롭다운 메뉴에..

Amplitude (앰플리튜드) 란?

Amplitude(앰플리튜드)를 활용해 프로젝트 분석 보고서를 작성하려는 초보자를 위한 기초 사용법 매뉴얼입니다. 가능한 쉽게, 체계적으로, 단계별로 정리 했습니다.Amplitude 사용법 초보자 매뉴얼1. Amplitude란 무엇인가?Amplitude는 제품 분석(Product Analytics) 도구로, 사용자의 행동 데이터를 기반으로 사용자 흐름, 전환, 이탈, 잔존율, 이벤트 성과 등을 분석할 수 있음.Google Analytics보다 제품 내부 행동 분석에 특화되어 있음.Amplitude에서는 고객 이탈률(Churn Rate), 재방문율(Retention Rate) 등 고객 행동 분석 지표를 시각화해서 볼 수 있고,당신이 운영하는 블로그처럼 서비스 웹사이트/앱 사용자 흐름을 추적하는 데 아주 효..

클라우드 슈퍼셋 시각화 - 이미지 바로 보이게 하기

구글코렙에서 작성한 파일을 CSV로 저장하여 100MB이상이므로 구글스토리지에 올려서 빅쿼리에 연결하고 Json키를 만들어서클라우스 슈퍼셋에 연동한 뒤 위에 화면처럼 선택이 가능합니다.  구글코렙 ~ Json키 발급하고 클라우스슈퍼셋 연동까지는https://nesaram-health-1story.tistory.com/319 이글을 참고하세요. 1. 코호트 재방문 추이 (Line Chart)Colab 코드python복사편집plt.plot(first_cohort['days_since_first_visit'], first_cohort['n_users']) Superset 구현Chart Type: Line ChartX-axis: days_since_first_visitMetrics: COUNT_DISTINCT(..

데이터 웨어하우스에 업로드한 후 Looker와 연결후 시각화

1. CSV 파일을 데이터 웨어하우스(예: Google BigQuery)로 업로드A. Google BigQuery에 CSV 파일 업로드BigQuery 콘솔 접속:Google Cloud Console에서 BigQuery 페이지로 이동합니다.데이터셋 생성:CSV 파일을 업로드할 데이터셋이 없다면, 새 데이터셋을 생성합니다.BigQuery 왼쪽 패널에서 프로젝트명을 클릭하고 **"데이터셋 만들기"**를 선택합니다.데이터셋 ID, 위치 및 기타 옵션을 설정한 후 생성합니다.테이블 생성 및 CSV 파일 업로드:생성한 데이터셋 내에서 "테이블 만들기" 버튼을 클릭합니다.소스 유형(Source)에서 "파일 업로드"를 선택하고 CSV 파일을 선택합니다.파일 형식(File format)은 CSV로 지정합니다.대상 테이블..

Sankey 차트를 LTV 시각화에 사용하는 이유

LTV(Lifetime Value, 고객 생애 가치)는 고객 생애주기와 밀접하게 관련되어 있지만, 두 개념은 동일하지 않다.LTV(고객 생애 가치): 한 명의 고객이 기업과 관계를 맺는 동안 발생시키는 총수익을 정량적으로 평가한 지표입니다. 이는 고객이 기업에 기여하는 경제적 가치를 측정하며, 고객의 평균 구매 금액, 구매 빈도, 관계 유지 기간 등을 기반으로 계산됩니다.고객 생애주기: 고객이 기업과 관계를 맺는 기간 동안의 모든 단계를 의미합니다. 예를 들어, 고객이 처음 브랜드를 접하고, 구매하고, 재구매하거나 이탈하기까지의 과정을 포함합니다.따라서, LTV는 고객 생애주기 동안 발생하는 수익을 수치화한 결과로 볼 수 있다. 즉, LTV는 고객 생애주기를 기반으로 산출되는 경제적 지표라고 할 수 있다..

Superset 클라우드 시각화 1st

5. Superset 대시보드 구성 예시 (이 데이터 기반)차트 제목차트 유형필터버전별 Retention 비교Bar ChartGroup by: version유저당 평균 게임 횟수KPI 또는 Box Plot전체활동 시간대별 평균 게임 횟수Bar ChartGroup by: activity_time유료 사용자 전환율KPI (Big Number)필터 없음ARPU (사용자당 수익)KPI필터 없음 특히 제가 준비한 CSV 데이터에는 referrer, channel, signup_date 같은 유입(Acquisition) 관련 정보가 없기 때문에 AARRR의 시작점인 "획득(Acquisition)"을 분석하기엔 정보가 부족함.반대로 사용자 유지와 활성화, 수익 기여도 분석에는 매우 적합한 구조라서 RARRA 분석이 ..

클라우드 Superset 시각화

1. 실험 설계1-1. 샘플 수 및 비율 확인import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df = pd.read_csv('final_cookie_cats_for_superset_02.csv') # 버전별 샘플 수 시각화 sns.countplot(x='version', data=df) plt.title('Version별 샘플 수') plt.show() # 비율 출력 print(df['version'].value_counts(normalize=True))1-2. 가설 설정 및 t-test 수행 (예: retention_1 기준)from scipy.stats import ttest_ind # retention_1: True..

클라우드 Superset

Superset 클라우드 호스팅 서비스Preset.io: Superset을 만든 회사에서 운영하는 공식 상업용 SaaS사용자는 설치 없이 계정만 만들고 바로 협업 가능무료 플랜 제공 (기능 제한 있음)클라우드에서 Superset을 설치하면 협업에 최적화된 분석 환경 구성 가능Ubuntu 서버에 Superset을 설치해 공인 IP나 도메인을 통해 운영AWS EC2, Oracle Cloud, GCP 등이 설치 플랫폼으로 적합Nginx + HTTPS + 계정관리까지 구성하면 완전한 프로덕션 환경 가능Preset.io 계정 생성 및 사용법 Preset.io 계정 생성 및 사용법 가입한 후 한사람이 이메일 초대를 하면 서로 만날수 있다서로의 작업공간을 만들수 있다.Preset.io를 활용한 Superset 대시보..

Superset 설치

먼저  Superset이 뭔지 왜 사용하는지 설명합니다.  설치부터 보실분은 아래 구분선 부터 보시면 됩니다.Superset(슈퍼셋)의 정의 및 특징:주요 특징 및 장점:오픈소스 & 무료누구나 자유롭게 사용 가능하고 커스터마이징도 자유로움.다양한 데이터베이스 지원MySQL, PostgreSQL, BigQuery, SQLite, Hive 등 대부분의 데이터베이스 연결 가능.풍부한 시각화 기능바 차트, 라인 차트, 히트맵, 산점도, 지도 시각화 등 다양한 시각화 유형 지원.인터랙티브 대시보드대시보드를 통해 여러 데이터를 동적으로 상호작용하며 분석 가능.빠른 분석 및 협업 용이성SQL 에디터 내장, 직관적인 인터페이스로 데이터 분석 속도가 빠르고, 팀 협업도 편리.확장성과 사용자 지정 기능사용자의 필요에 맞게..

SMALL