300x250

데이터 분석가:Applied Data Analytics/용어편 18

ARPU, LTV란?

ARPU(Average Revenue Per User, 평균 가입자당 매출) 한 명의 사용자(고객)로부터 평균적으로 얼마의 수익을 얻는지를 나타내는 지표입니다. 데이터 분석이나 비즈니스 성과 분석에서 매우 자주 등장하는 핵심 지표입니다.1. 정의 (What)ARPU = 총 매출 / 사용자 수일정 기간(예: 월간, 분기, 연간) 동안 발생한 총 매출을같은 기간 동안의 **총 사용자 수(고객 수)**로 나눈 값입니다.2. 용도 (Why)ARPU는 다음을 파악할 때 사용됩니다:수익성 분석: 한 명의 고객이 얼마의 수익을 창출하는지 확인비즈니스 성과 비교: 기간별, 서비스별, 국가별 ARPU 비교전략 수립: 타깃 고객군 선정, 요금제 개선, 마케팅 전략 설계 등고객 가치 평가: LTV(Lifetime Value..

P-value vs Posterior Tail-Area Probability

1. P-value와 Posterior Tail-Area Probability 비교P-value (빈도주의적 접근)귀무가설 (H0H_0H0​)이 참이라고 가정할 때, 관측된 데이터보다 극단적인 값이 나올 확률. 아래와 같은 형태.빈도주의(Frequentist) 가설 검정에서 사용.Posterior Tail-Area Probability (베이지안 접근)사후 확률 분포에서 특정 값 이상(또는 이하)의 확률. 아래와 같은 형태. 베이지안 추론에서 사용되며, 사전 정보와 데이터로부터 업데이트된 확률을 기반으로 함2. 차이점P-value: 가설(귀무가설)이 참이라는 전제 하에서 데이터를 해석.Posterior Tail-Area Probability: 가설보다는 사후 확률 분포에서 특정 값이 차지하는 비율을 의미..

피어슨 상관계수 vs 스피어만 순위 상관계수

공통점두 변수 간의 상관 관계(연관성) 를 측정하는 방법이다.결과 값은 -1 ~ 1 사이이다.1: 완벽한 양의 상관-1: 완벽한 음의 상관0: 관계 없음1. 피어슨 상관계수 (Pearson Correlation Coefficient)특징연속형(수치) 데이터에서 사용두 변수 간의 직선적(선형) 관계를 측정평균과 표준편차를 이용하여 계산이상치(극단값)에 민감함사용 예시키와 몸무게의 관계온도와 아이스크림 판매량핵심 요약"정확한 수치 데이터에서 직선 관계를 분석할 때 사용"2. 스피어만 순위 상관계수 (Spearman Rank Correlation)특징순위(서열) 데이터에서 사용 (즉, 숫자의 크기가 아니라 순서가 중요할 때)두 변수 간의 비선형 관계(곡선적 관계)도 측정 가능데이터의 크기 차이보다는 순서(랭킹..

Scikit-learn(사이-킷 런), TensorFlow(텐서플로우)

Scikit-learnscikit-learn은 "사이-킷 런"으로 발음합니다. 여기서 'sci'는 'science(과학)'를 의미하며, 'sy-kit learn'으로 발음합니다.많은 사람들이 'scikit'이나 'SciKit', 'sci-kit learn' 등으로 잘못 발음하거나 표기하지만, 정확한 프로젝트 이름은 'scikit-learn(사이킷런)'입니다. 과거에는 'scikits.learn'이나 'scikits-learn'으로 불리기도 했지만 현재는 그렇지 않다.scikit-learn은 파이썬의 대표적인 머신러닝 라이브러리로, 다양한 머신러닝 알고리즘과 모델을 제공.① 기본 개념Estimator (추정기)머신러닝 모델을 의미하며, fit() 메서드를 사용해 학습.예) LinearRegression()..

GCP란?

GCP(Google Cloud Platform)는 구글에서 제공하는 클라우드 컴퓨팅 서비스로 쉽게 말하면, 인터넷을 통해 데이터 저장, 애플리케이션 개발, 서버 관리 등의 IT 서비스를 제공하는 플랫폼클라우드란 무엇일까?클라우드는 데이터와 서비스를 내 컴퓨터가 아닌 인터넷(클라우드 서버)에서 제공하는 것을 의미.예시: 구글 드라이브, Gmail, 유튜브도 클라우드 기술을 사용. 파일을 내 컴퓨터에 저장하지 않고 인터넷에서 불러오는것을 말한다.GCP가 무엇을 도와줄까?컴퓨터 없이도 강력한 서버 사용: 내 컴퓨터에서 프로그램을 실행하지 않고, GCP의 강력한 서버를 빌려서 사용.데이터 저장: 대용량 데이터를 GCP 서버에 안전하게 저장하고 관리.애플리케이션 개발: 복잡한 소프트웨어나 앱을 개발할 때 필요한 ..

CTE (Common Table Expression) 란?

CTE (Common Table Expression)란? SQL에서 쿼리를 작성할 때, 복잡한 서브쿼리를 읽기 쉽게 표현하거나 재사용하기 위해 임시적인 이름이 부여된 결과 집합. CTE는 WITH 키워드를 사용하여 정의된다.CTE를 활용하면 쿼리를 단순화하고, 가독성을 높이며, 재사용 가능성을 증가시킬 수 있다.CTE 이름과 별칭에 대소문자가 구분되지 않으므로 컬럼과 다른 이름으로 적용해야됨.  CTE의 주요 특징임시적: CTE는 SQL 문이 실행되는 동안에만 존재합니다. (영구 저장되지 않음)가독성 향상: 복잡한 쿼리를 단계별로 작성할 수 있어 읽기 쉽습니다.재사용 가능: 정의한 CTE는 동일 쿼리 내에서 여러 번 참조할 수 있으며네이밍 가능: CTE는 이름을 부여하여 결과를 참조할 수 있다.CTE 기..

A/B 테스트 설계(A/B Test Design) 란?

A/B 테스트 설계는 테스트의 목표를 정의하고, 실험 변수를 설정하며, 데이터를 분석하기 위한 구조를 계획하는 과정을 말하며, 잘 설계된 A/B 테스트는 명확한 결과를 제공하여 비즈니스 성과를 향상시키는 데 기여합니다.A/B 테스트 설계의 주요 단계목표 정의테스트를 통해 무엇을 개선하려는지 명확히 설정합니다.예: 클릭률 증가, 전환율 향상, 구매 완료율 증가 등.변수 선택테스트할 요소(Independent Variable)를 선택합니다.예: 버튼 색상, 문구, 이미지, 레이아웃, 가격 표시 방식 등.Tip: 한 번에 하나의 변수만 변경해야 테스트 결과를 명확히 해석할 수 있습니다.대상 집단 설정테스트에 참여할 사용자 그룹을 정의합니다.균등 분할: A와 B 그룹에 테스트 대상자를 랜덤하게 나누어야 편향을 ..

CPA(Cost Per Action) 란?

디지털 마케팅 및 광고에서 특정 행동(성과)에 대해 비용을 측정하는 성과 기반 광고 모델입니다.CPA는 광고주가 성과(Conversions)에 대해 직접 비용을 지불하는 방식으로, 클릭 수나 노출 수보다 실제 행동에 초점을 맞춥니다.CPA의 주요 요소성과(Action)의 정의CPA에서 정의하는 행동은 광고주의 목표에 따라 다릅니다. 일반적인 예는 다음과 같습니다:구매(Transactions): 제품이나 서비스를 구매.회원가입(Registrations): 이메일 구독, 계정 생성 등.앱 설치(App Installs): 모바일 애플리케이션 다운로드 및 설치.양식 작성(Form Submissions): 상담 신청, 정보 요청 등.CPA 공식CPA = 총 광고 비용성과 수 (Actions)\text{CPA} =..

CTR(Click-Through Rate)이란?

주로 디지털 마케팅 및 온라인 광고에서 사용되는 지표입니다.CTR은 광고나 링크가 노출된 횟수 대비 실제로 클릭된 비율을 나타냅니다.CTR의 계산 공식CTR (%)=(클릭 수노출 수)×100\text{CTR (\%)} = \left( \frac{\text{클릭 수}}{\text{노출 수}} \right) \times 100CTR (%)=(노출 수클릭 수​)×100클릭 수: 사용자가 광고나 링크를 실제로 클릭한 횟수.노출 수: 광고나 링크가 사용자에게 표시된 총 횟수.CTR의 중요성효율성 측정광고나 콘텐츠가 사용자에게 얼마나 매력적이었는지 확인할 수 있습니다. 높은 CTR은 광고가 관련성과 흥미를 끌었다는 것을 의미합니다.광고 캠페인 최적화CTR을 기반으로 광고 소재, 키워드, 타겟팅 전략 등을 개선하여 ..

용어편 : ROI란?

투자 대비 수익을 나타내는 지표로, 투자 효율성을 측정하는 데 사용됩니다. ROI는 기업이 특정 투자에서 얻은 이익(또는 손실)을 평가하고, 투자 결정을 내릴 때 중요한 기준이 됩니다.ROI 계산 공식ROI (%)=순이익 (Net Profit)투자 비용 (Investment Cost)×100\text{ROI (\%)} = \frac{\text{순이익 (Net Profit)}}{\text{투자 비용 (Investment Cost)}} \times 100ROI (%)=투자 비용 (Investment Cost)순이익 (Net Profit)​×100용어 설명:순이익 (Net Profit):투자로 인해 발생한 총수익에서 비용을 차감한 값.순이익=총수익−투자비용\text{순이익} = \text{총수익} - \tex..

Conversion Rate(전환율)란?

특정 마케팅 또는 영업 활동에서 목표로 설정한 행동(전환)을 수행한 사용자 비율을 나타내는 지표.일반적으로 방문자 중에서 구매, 회원가입, 문의 등록, 다운로드 등 특정 목표를 완료한 사용자의 비율을 말합니다.Conversion Rate 계산 공식Conversion Rate (%)=전환 수총 방문 수×100\text{Conversion Rate (\%)}                               = \frac{\text{전환 수}}{\text{총 방문 수}} \times 100Conversion Rate (%)=총 방문 수전환 수​×100용어 설명:전환(Conversion):특정한 목표를 달성한 행동.예: 상품 구매, 이메일 가입, 앱 설치, 연락처 등록 등.총 방문 수:해당 활동에 노출되거..

리타겟팅 광고란?

리타겟팅 광고(Retargeting Ads)는 이전에 특정 웹사이트를 방문했거나, 특정 제품 또는 서비스를 탐색한 사용자에게 맞춤형 광고를 다시 노출하는 광고 전략입니다.주로 사용자가 웹사이트를 떠난 후 다른 사이트나 앱을 사용할 때 광고를 표시하여, 이들이 다시 방문하거나 전환(구매, 가입 등)하도록 유도합니다. 리타겟팅 광고의 주요 원리쿠키 기반 추적:사용자가 특정 웹사이트를 방문하면 **쿠키(cookie)**를 통해 행동 데이터를 저장합니다.이 데이터는 사용자가 방문한 페이지, 클릭한 제품, 장바구니에 담은 상품 등을 포함합니다.맞춤형 광고 노출:쿠키 정보를 활용해 사용자가 관심을 보였던 제품이나 서비스를 강조하는 맞춤형 광고를 생성합니다.광고 네트워크 활용:구글 디스플레이 네트워크(GDN), 페이..

키워드 광고란?

키워드 광고는 사용자가 검색엔진(예: 구글, 네이버)에서 특정 키워드를 검색할 때, 검색 결과 페이지에 표시되는 광고를 의미합니다. 이 광고는 주로 PPC(Pay-Per-Click, 클릭당 비용) 방식으로 운영되며, 광고주는 자신이 설정한 키워드와 관련된 검색어가 입력될 때 광고를 노출시키고, 사용자가 광고를 클릭했을 때 비용을 지불합니다. 키워드 광고의 특징검색 기반 광고:사용자가 입력한 검색어와 연관된 광고를 보여줍니다.광고는 사용자의 관심사 또는 의도를 반영합니다.성과 기반 비용 구조:광고 노출에는 비용이 발생하지 않으며, 클릭(트래픽)이 발생했을 때만 비용이 청구됩니다.타겟팅 가능:특정 키워드, 지역, 시간대, 기기 유형 등을 기준으로 광고를 타겟팅할 수 있습니다.경매 시스템:광고 위치는 광고주 ..

퍼포먼스 마케팅(Performance Marketing)이란?

퍼포먼스 마케팅은 광고나 마케팅 활동에 투자한 비용이 명확한 성과(Performance)로 연결되는지를 측정하고, 이를 바탕으로 효율성을 극대화하는 데이터 중심의 마케팅 전략을 말합니다. 성과는 주로 클릭, 전환, 구매, 설치, 구독 등 특정한 목표 달성 여부를 기준으로 측정됩니다. 퍼포먼스 마케팅의 주요 특징성과 기반 비용 구조:광고비는 성과에 따라 책정되며, 예산의 낭비를 최소화합니다.예: 클릭당 비용(CPC), 전환당 비용(CPA).데이터 중심:마케팅 캠페인의 모든 단계에서 데이터를 활용하여 성과를 분석하고 최적화합니다.명확한 목표 설정:목표는 보통 ROI(Return on Investment) 또는 ROAS(Return on Ad Spend)와 같은 측정 가능한 값입니다.실시간 최적화:성과 데이터..

마케팅 캠페인이란?

**마케팅 캠페인(Marketing Campaign)**은 특정한 비즈니스 목표를 달성하기 위해 설계된 일련의 전략적 활동과 광고 활동을 의미합니다. 이러한 캠페인은 제품, 서비스, 브랜드 등을 홍보하거나 판매를 촉진하기 위해 다양한 채널(온라인 및 오프라인)을 활용하여 실행됩니다.마케팅 캠페인의 주요 목적브랜드 인지도 향상:소비자에게 브랜드를 알리고 친숙하게 만듭니다.판매 촉진:특정 제품 또는 서비스의 판매량을 증가시키기 위한 활동.고객 유치 및 유지:신규 고객을 유치하거나 기존 고객의 충성도를 강화.시장 점유율 확대:경쟁사와의 차별화를 통해 시장 내 입지를 강화.특정 행동 유도:가입, 다운로드, 구매 등의 고객 행동을 유도.마케팅 캠페인의 구성 요소목표 설정:캠페인의 구체적인 목표를 정합니다. (예:..

젤리빈 실험(Jelly Bean Counting Experiment)

심리학과 통계에서 자주 사용되는 개념으로, **추측과 통계적 오차, 그리고 집단의 평균적인 지혜(집단 지성)**를 이해하기 위한 간단한 실험입니다. 예를 들면실험의 핵심 아이디어질문: "이 병 안에 몇 개의 젤리빈이 있을까요?"목적: 사람들이 얼마나 정확하게 숫자를 추측할 수 있는지, 개별적인 오차와 집단의 평균 추측이 얼마나 다른지 알아보는 것입니다.실험 방법젤리빈 병 준비:투명한 병에 젤리빈을 가득 채웁니다. 예를 들어, 병 안에 젤리빈이 237개 있다고 가정합니다.추측 요청:여러 사람(예: 20명)에게 병을 보여주고, 젤리빈의 개수를 추측하도록 요청합니다.각 사람이 추측한 숫자를 적어냅니다.데이터 수집:사람들이 추측한 숫자를 수집하여 평균을 계산합니다.결과 분석개별 오차:사람들은 종종 정확한 숫자를..

마크다운

개발자가 문서작업을 할 때 가장 많이 쓰는 언어Markdown은 텍스트 기반의 마크업언어로 2004년 존그루버에 의해 만들어졌으며 쉽게 쓰고 읽을 수 있으며 HTML로 변환이 가능하다. 특수기호와 문자를 이용한 매우 간단한 구조의 문법을 사용하여 웹에서도 보다 빠르게 컨텐츠를 작성, 보다 직관적으로 인식할 수 있다. 마크다운이 최근 각광받기 시작한 이유는 깃헙(https://github.com) 덕분이다. 깃헙의 저장소Repository에 관한 정보를 기록하는 README.md는 깃헙을 사용하는 사람이라면 누구나 가장 먼저 접하게 되는 마크다운 문서였다. 마크다운을 통해서 설치방법, 소스코드 설명, 이슈 등을 간단하게 기록하고 가독성을 높일 수 있다는 강점이 부각되면서 점점 여러 곳으로 퍼져가게 된다. ..

GitHub란

GitHub : 코드 버전 관리를 위한 강력한 플랫폼으로 오픈 소스 공유와 팀 협업에 최적화 되어 있다GitHub 사이트의 활동으로 잔디밭을 표현해주는데 1일 1커밋을 꾸준히 지속한다면 예쁜 잔디밭을 진하기별로 나타내줍니다. GitHub의 마스코트로 옥토켓이라고 문어(Octopus)와 고양이(Cat)의 특징을 결합한 캐릭터이다.Git : 개발을 진행하며 작성하는 소스코드가 업데이트 되는 버전을 기록해두고 관리할 수 있는 소스코드 버전 관리 시스템.GitHub : Git으로 관리하는 프로젝트를 호스팅하고, 시간과 공간의 제약 없이 협업할 수 있는 온라인 서비스.즉, 로컬(Local)에서 작업한 내용을 Git이 저장해 두었다면, 그 기록을 온라인 작업공간인 GitHub에 올려 원격(Remote)으로도 작업할..

SMALL