데이터시각화 7

Amplitude (앰플리튜드) 란?

Amplitude(앰플리튜드)를 활용해 프로젝트 분석 보고서를 작성하려는 초보자를 위한 기초 사용법 매뉴얼입니다. 가능한 쉽게, 체계적으로, 단계별로 정리 했습니다.Amplitude 사용법 초보자 매뉴얼1. Amplitude란 무엇인가?Amplitude는 제품 분석(Product Analytics) 도구로, 사용자의 행동 데이터를 기반으로 사용자 흐름, 전환, 이탈, 잔존율, 이벤트 성과 등을 분석할 수 있음.Google Analytics보다 제품 내부 행동 분석에 특화되어 있음.Amplitude에서는 고객 이탈률(Churn Rate), 재방문율(Retention Rate) 등 고객 행동 분석 지표를 시각화해서 볼 수 있고,당신이 운영하는 블로그처럼 서비스 웹사이트/앱 사용자 흐름을 추적하는 데 아주 효..

데이터 웨어하우스에 업로드한 후 Looker와 연결후 시각화

1. CSV 파일을 데이터 웨어하우스(예: Google BigQuery)로 업로드A. Google BigQuery에 CSV 파일 업로드BigQuery 콘솔 접속:Google Cloud Console에서 BigQuery 페이지로 이동합니다.데이터셋 생성:CSV 파일을 업로드할 데이터셋이 없다면, 새 데이터셋을 생성합니다.BigQuery 왼쪽 패널에서 프로젝트명을 클릭하고 **"데이터셋 만들기"**를 선택합니다.데이터셋 ID, 위치 및 기타 옵션을 설정한 후 생성합니다.테이블 생성 및 CSV 파일 업로드:생성한 데이터셋 내에서 "테이블 만들기" 버튼을 클릭합니다.소스 유형(Source)에서 "파일 업로드"를 선택하고 CSV 파일을 선택합니다.파일 형식(File format)은 CSV로 지정합니다.대상 테이블..

Sankey 차트를 LTV 시각화에 사용하는 이유

LTV(Lifetime Value, 고객 생애 가치)는 고객 생애주기와 밀접하게 관련되어 있지만, 두 개념은 동일하지 않다.LTV(고객 생애 가치): 한 명의 고객이 기업과 관계를 맺는 동안 발생시키는 총수익을 정량적으로 평가한 지표입니다. 이는 고객이 기업에 기여하는 경제적 가치를 측정하며, 고객의 평균 구매 금액, 구매 빈도, 관계 유지 기간 등을 기반으로 계산됩니다.고객 생애주기: 고객이 기업과 관계를 맺는 기간 동안의 모든 단계를 의미합니다. 예를 들어, 고객이 처음 브랜드를 접하고, 구매하고, 재구매하거나 이탈하기까지의 과정을 포함합니다.따라서, LTV는 고객 생애주기 동안 발생하는 수익을 수치화한 결과로 볼 수 있다. 즉, LTV는 고객 생애주기를 기반으로 산출되는 경제적 지표라고 할 수 있다..

데이터 마이닝 개념과 기법 4/e

데이터 마이닝 개념과 기법종합적인 학문 및 기술 분야로서 데이터 마이닝의 특징을 소개하며, 정보 기술의 진화와 데이터 마이닝의 필요성, 그리고 응용 분야의 중요성에 대해 설명한다. 먼저, 데이터 마이닝을 위한 다양한 유형의 데이터 타입에 대해 알아보고, 데이터 마이닝 작업의 주요 유형과 마이닝 지식의 종류, 사용되는 기술의 종류, 그리고 분석 환경에 따라 활용되는 다양한 기법에 대해 설명한다.저자Jiawei Han, Pei Jian, Hanghang Tong출판에이콘출판출판일2025.01.311. AARRR (Acquisition, Activation, Retention, Revenue, Referral)
AARRR은 데이터 분석을 통해 사용자 행동을 추적하고 개선하는 데 초점이 맞춰져 있습니다. 이에 ..

Superset 설치

먼저 Superset이 뭔지 왜 사용하는지 설명합니다. 설치부터 보실분은 아래 구분선 부터 보시면 됩니다.Superset(슈퍼셋)의 정의 및 특징:주요 특징 및 장점:오픈소스 & 무료누구나 자유롭게 사용 가능하고 커스터마이징도 자유로움.다양한 데이터베이스 지원MySQL, PostgreSQL, BigQuery, SQLite, Hive 등 대부분의 데이터베이스 연결 가능.풍부한 시각화 기능바 차트, 라인 차트, 히트맵, 산점도, 지도 시각화 등 다양한 시각화 유형 지원.인터랙티브 대시보드대시보드를 통해 여러 데이터를 동적으로 상호작용하며 분석 가능.빠른 분석 및 협업 용이성SQL 에디터 내장, 직관적인 인터페이스로 데이터 분석 속도가 빠르고, 팀 협업도 편리.확장성과 사용자 지정 기능사용자의 필요에 맞게..

보고서 vs 대시보드

목적과 활용보고서: 특정 이슈나 분석 결과를 상세히 서술하고 설명하는 문서 형태의 자료.대시보드: 핵심 정보를 빠르고 직관적으로 파악할 수 있도록 시각적으로 요약한 자료.정보의 표현 방식보고서: 주로 텍스트, 표, 그래프를 활용해 설명적이고 상세한 내용 전달.대시보드: 주로 그래프, 차트, 숫자 카드 등으로 시각화하여 직관적이고 즉각적인 이해 가능.정보의 양과 깊이보고서: 정보의 양이 많고 상세한 분석, 근거, 해석 등 깊이 있는 내용을 포함.대시보드: 정보가 압축적이고 핵심적이며, 한눈에 보이도록 최소한의 필수 정보만 표현.업데이트 주기 및 시간적 특성보고서: 주로 주간, 월간, 분기, 연간 등 주기적으로 작성하며 과거 데이터 중심.대시보드: 실시간 또는 매우 짧은 주기로 자동 업데이트 가능하며 현재 ..

전설의 포켓몬 찾아 삼만리

이번에는 pandas의 문법과 다양한 메서드를 활용해 본 적이 있고, 코드를 보면 어느 정도 이해할 수 있습니다.matplotlib을 활용해서 데이터 시각화를 해본 적이 있고, 코드를 보면 어느 정도 이해할 수 있습니다.데이터셋을 train/test 데이터셋으로 나누어서 모델을 학습 및 검증해본 경험이 있다.목표다양한 피처가 있는 데이터셋을 밑바닥부터 샅샅이 뜯어보고, 전설의 포켓몬을 분류하기 위한 피처에는 무엇이 있는지 생각해 보자.모델 학습을 시작하기 전 모든 컬럼에 대해 그래프 시각화, 피벗 테이블 등을 활용하며 다양한 방법으로 충분한 EDA를 진행하자.모델 학습에 넣기 위해서 전처리가 필요한 범주형/문자열 데이터에 대한 전처리를 원-핫 인코딩 등으로 적절하게 진행.전체 데이터셋을 train/tes..

300x250
SMALL