데이터 분석가:Applied Data Analytics 217

파이썬 설치

파이썬 설치화면에 Install Now를 클릭하여 설치 시작  파이썬 실행하는 방법중 하나 파이썬 실행하는 방법중 두번째   파이썬 실행하는 방법중 세번째 Jupyter NotebookCommand모드 : M(마크다운 입력창), Y(코드 입력창), X(잘라내기), V(붙여넣기)Edit모드 : 셀에 내용을 입력할 수 있다.pymb확장자로 저장되며 VSC에서도 실행된다. VSC설치하기 파이썬으로 무얼 할 수 있어?웹프로그램밍, 데이터베이스 프로그래밍(데이터베이스에 접근하기위한 도구 제공), 임베디드(파이썬 코드로 드론 제어), 데이터분석(파이썬을 활용한 데이터 분석 대회가 국내외 다수 있다)안드로이드, 아이폰 모바일 프로그램밍은 아직 할수 없다. 파이썬 학습에 도움되는 사이트 : CodeUp, 백준, 모두의..

데이터 분석가 관련 추천도서

데이터 분석가는 보고서작성, 시각화, 통찰력, 비즈니스/도메인 지식의 능력이 필요하다.여기서 비즈니스/도메인 지식은 특정 산업이나 회사의 주요 활동 영역에 대한 이해를 말하며, 쉽게 말해, “이 회사가 어떻게 돈을 벌고, 고객에게 어떤 가치를 제공하며, 어떤 방식으로 운영되는지”를 아는 것입니다.예를 들어, 편의점에서 수입 맥주 판매 데이터를 분석한다고 할 때, 수입 맥주가 4캔 묶음으로만 기록된다는 점을 모른다면 잘못된 결론을 내릴 수 있습니다. 따라서 이런 산업 특성을 알고 있어야 분석 결과가 실제로 유용해집니다. 이렇게 비즈니스/도메인 지식은 데이터 분석 결과를 실질적으로 활용 가능하게 만드는 핵심 요소입니다.파이썬 머신러닝 판다스 데이터 분석 (개정판)오승환 (지은이)   정보문화사   2024-..

GCP란?

GCP(Google Cloud Platform)는 구글에서 제공하는 클라우드 컴퓨팅 서비스로 쉽게 말하면, 인터넷을 통해 데이터 저장, 애플리케이션 개발, 서버 관리 등의 IT 서비스를 제공하는 플랫폼클라우드란 무엇일까?클라우드는 데이터와 서비스를 내 컴퓨터가 아닌 인터넷(클라우드 서버)에서 제공하는 것을 의미.예시: 구글 드라이브, Gmail, 유튜브도 클라우드 기술을 사용. 파일을 내 컴퓨터에 저장하지 않고 인터넷에서 불러오는것을 말한다.GCP가 무엇을 도와줄까?컴퓨터 없이도 강력한 서버 사용: 내 컴퓨터에서 프로그램을 실행하지 않고, GCP의 강력한 서버를 빌려서 사용.데이터 저장: 대용량 데이터를 GCP 서버에 안전하게 저장하고 관리.애플리케이션 개발: 복잡한 소프트웨어나 앱을 개발할 때 필요한 ..

CTE (Common Table Expression) 란?

CTE (Common Table Expression)란? SQL에서 쿼리를 작성할 때, 복잡한 서브쿼리를 읽기 쉽게 표현하거나 재사용하기 위해 임시적인 이름이 부여된 결과 집합. CTE는 WITH 키워드를 사용하여 정의된다.CTE를 활용하면 쿼리를 단순화하고, 가독성을 높이며, 재사용 가능성을 증가시킬 수 있다.CTE 이름과 별칭에 대소문자가 구분되지 않으므로 컬럼과 다른 이름으로 적용해야됨.  CTE의 주요 특징임시적: CTE는 SQL 문이 실행되는 동안에만 존재합니다. (영구 저장되지 않음)가독성 향상: 복잡한 쿼리를 단계별로 작성할 수 있어 읽기 쉽습니다.재사용 가능: 정의한 CTE는 동일 쿼리 내에서 여러 번 참조할 수 있으며네이밍 가능: CTE는 이름을 부여하여 결과를 참조할 수 있다.CTE 기..

Looker Studio 란?

Looker Studio(구 Google Data Studio)는 데이터를 시각적으로 표현하고, 보고서를 쉽게 작성하고 공유할 수 있도록 도와주는 무료 데이터 시각화 도구다. 데이터를 차트, 그래프, 대시보드 형태로 보여주며, 누구나 직관적으로 데이터를 분석하고 인사이트를 얻을 수 있도록 설계되었다.Looker Studio의 주요 특징 실시간 데이터 연결:Google Analytics, BigQuery, MySQL, CSV 등 800개 이상의 커넥터를 통해 데이터를 통합.데이터 변경 시 자동 업데이트되는 실시간 보고서 제공.사용자 정의 대시보드:KPI를 추적할 수 있는 완전 맞춤형 대시보드 설계.차트, 테이블, 지도 등 30개 이상의 시각화 옵션.팀 협업 최적화:Google Drive처럼 보고서 공유 및..

빅쿼리에서 "(double quotes)와 '(single quotes) 차이는?

각각 다른 용도로 사용됩니다.  1. ' (Single Quotes)문자열 리터럴을 정의할 때 사용합니다.용도 : 문자열 값을 나타냅니다.예시 : SELECT * FROM dataset_name.table_name WHERE column_name = 'example_value';설명 : 'example_value'는 문자열로 간주된다. 문자열 비교, 필터링 시 반드시 사용해야 한다.2. " (Double Quotes)식별자(Identifiers, 예: 컬럼명, 테이블명, 데이터셋명 등)를 정의하거나 예약어를 사용할 때 사용한다.용도 : 컬럼명이나 테이블명이 공백, 특수 문자, 또는 SQL 예약어를 포함할 때.          대소문자를 구분하는 식별자를 사용할 때.예시 : SELECT "Column Na..

A/B 테스트 설계(A/B Test Design) 란?

A/B 테스트 설계는 테스트의 목표를 정의하고, 실험 변수를 설정하며, 데이터를 분석하기 위한 구조를 계획하는 과정을 말하며, 잘 설계된 A/B 테스트는 명확한 결과를 제공하여 비즈니스 성과를 향상시키는 데 기여합니다.A/B 테스트 설계의 주요 단계목표 정의테스트를 통해 무엇을 개선하려는지 명확히 설정합니다.예: 클릭률 증가, 전환율 향상, 구매 완료율 증가 등.변수 선택테스트할 요소(Independent Variable)를 선택합니다.예: 버튼 색상, 문구, 이미지, 레이아웃, 가격 표시 방식 등.Tip: 한 번에 하나의 변수만 변경해야 테스트 결과를 명확히 해석할 수 있습니다.대상 집단 설정테스트에 참여할 사용자 그룹을 정의합니다.균등 분할: A와 B 그룹에 테스트 대상자를 랜덤하게 나누어야 편향을 ..

CPA(Cost Per Action) 란?

디지털 마케팅 및 광고에서 특정 행동(성과)에 대해 비용을 측정하는 성과 기반 광고 모델입니다.CPA는 광고주가 성과(Conversions)에 대해 직접 비용을 지불하는 방식으로, 클릭 수나 노출 수보다 실제 행동에 초점을 맞춥니다.CPA의 주요 요소성과(Action)의 정의CPA에서 정의하는 행동은 광고주의 목표에 따라 다릅니다. 일반적인 예는 다음과 같습니다:구매(Transactions): 제품이나 서비스를 구매.회원가입(Registrations): 이메일 구독, 계정 생성 등.앱 설치(App Installs): 모바일 애플리케이션 다운로드 및 설치.양식 작성(Form Submissions): 상담 신청, 정보 요청 등.CPA 공식CPA = 총 광고 비용성과 수 (Actions)\text{CPA} =..

CTR(Click-Through Rate)이란?

주로 디지털 마케팅 및 온라인 광고에서 사용되는 지표입니다.CTR은 광고나 링크가 노출된 횟수 대비 실제로 클릭된 비율을 나타냅니다.CTR의 계산 공식CTR (%)=(클릭 수노출 수)×100\text{CTR (\%)} = \left( \frac{\text{클릭 수}}{\text{노출 수}} \right) \times 100CTR (%)=(노출 수클릭 수​)×100클릭 수: 사용자가 광고나 링크를 실제로 클릭한 횟수.노출 수: 광고나 링크가 사용자에게 표시된 총 횟수.CTR의 중요성효율성 측정광고나 콘텐츠가 사용자에게 얼마나 매력적이었는지 확인할 수 있습니다. 높은 CTR은 광고가 관련성과 흥미를 끌었다는 것을 의미합니다.광고 캠페인 최적화CTR을 기반으로 광고 소재, 키워드, 타겟팅 전략 등을 개선하여 ..

용어편 : ROI란?

투자 대비 수익을 나타내는 지표로, 투자 효율성을 측정하는 데 사용됩니다. ROI는 기업이 특정 투자에서 얻은 이익(또는 손실)을 평가하고, 투자 결정을 내릴 때 중요한 기준이 됩니다.ROI 계산 공식ROI (%)=순이익 (Net Profit)투자 비용 (Investment Cost)×100\text{ROI (\%)} = \frac{\text{순이익 (Net Profit)}}{\text{투자 비용 (Investment Cost)}} \times 100ROI (%)=투자 비용 (Investment Cost)순이익 (Net Profit)​×100용어 설명:순이익 (Net Profit):투자로 인해 발생한 총수익에서 비용을 차감한 값.순이익=총수익−투자비용\text{순이익} = \text{총수익} - \tex..

Conversion Rate(전환율)란?

특정 마케팅 또는 영업 활동에서 목표로 설정한 행동(전환)을 수행한 사용자 비율을 나타내는 지표.일반적으로 방문자 중에서 구매, 회원가입, 문의 등록, 다운로드 등 특정 목표를 완료한 사용자의 비율을 말합니다.Conversion Rate 계산 공식Conversion Rate (%)=전환 수총 방문 수×100\text{Conversion Rate (\%)}                               = \frac{\text{전환 수}}{\text{총 방문 수}} \times 100Conversion Rate (%)=총 방문 수전환 수​×100용어 설명:전환(Conversion):특정한 목표를 달성한 행동.예: 상품 구매, 이메일 가입, 앱 설치, 연락처 등록 등.총 방문 수:해당 활동에 노출되거..

리타겟팅 광고란?

리타겟팅 광고(Retargeting Ads)는 이전에 특정 웹사이트를 방문했거나, 특정 제품 또는 서비스를 탐색한 사용자에게 맞춤형 광고를 다시 노출하는 광고 전략입니다.주로 사용자가 웹사이트를 떠난 후 다른 사이트나 앱을 사용할 때 광고를 표시하여, 이들이 다시 방문하거나 전환(구매, 가입 등)하도록 유도합니다. 리타겟팅 광고의 주요 원리쿠키 기반 추적:사용자가 특정 웹사이트를 방문하면 **쿠키(cookie)**를 통해 행동 데이터를 저장합니다.이 데이터는 사용자가 방문한 페이지, 클릭한 제품, 장바구니에 담은 상품 등을 포함합니다.맞춤형 광고 노출:쿠키 정보를 활용해 사용자가 관심을 보였던 제품이나 서비스를 강조하는 맞춤형 광고를 생성합니다.광고 네트워크 활용:구글 디스플레이 네트워크(GDN), 페이..

키워드 광고란?

키워드 광고는 사용자가 검색엔진(예: 구글, 네이버)에서 특정 키워드를 검색할 때, 검색 결과 페이지에 표시되는 광고를 의미합니다. 이 광고는 주로 PPC(Pay-Per-Click, 클릭당 비용) 방식으로 운영되며, 광고주는 자신이 설정한 키워드와 관련된 검색어가 입력될 때 광고를 노출시키고, 사용자가 광고를 클릭했을 때 비용을 지불합니다. 키워드 광고의 특징검색 기반 광고:사용자가 입력한 검색어와 연관된 광고를 보여줍니다.광고는 사용자의 관심사 또는 의도를 반영합니다.성과 기반 비용 구조:광고 노출에는 비용이 발생하지 않으며, 클릭(트래픽)이 발생했을 때만 비용이 청구됩니다.타겟팅 가능:특정 키워드, 지역, 시간대, 기기 유형 등을 기준으로 광고를 타겟팅할 수 있습니다.경매 시스템:광고 위치는 광고주 ..

퍼포먼스 마케팅(Performance Marketing)이란?

퍼포먼스 마케팅은 광고나 마케팅 활동에 투자한 비용이 명확한 성과(Performance)로 연결되는지를 측정하고, 이를 바탕으로 효율성을 극대화하는 데이터 중심의 마케팅 전략을 말합니다. 성과는 주로 클릭, 전환, 구매, 설치, 구독 등 특정한 목표 달성 여부를 기준으로 측정됩니다. 퍼포먼스 마케팅의 주요 특징성과 기반 비용 구조:광고비는 성과에 따라 책정되며, 예산의 낭비를 최소화합니다.예: 클릭당 비용(CPC), 전환당 비용(CPA).데이터 중심:마케팅 캠페인의 모든 단계에서 데이터를 활용하여 성과를 분석하고 최적화합니다.명확한 목표 설정:목표는 보통 ROI(Return on Investment) 또는 ROAS(Return on Ad Spend)와 같은 측정 가능한 값입니다.실시간 최적화:성과 데이터..

마케팅 캠페인이란?

**마케팅 캠페인(Marketing Campaign)**은 특정한 비즈니스 목표를 달성하기 위해 설계된 일련의 전략적 활동과 광고 활동을 의미합니다. 이러한 캠페인은 제품, 서비스, 브랜드 등을 홍보하거나 판매를 촉진하기 위해 다양한 채널(온라인 및 오프라인)을 활용하여 실행됩니다.마케팅 캠페인의 주요 목적브랜드 인지도 향상:소비자에게 브랜드를 알리고 친숙하게 만듭니다.판매 촉진:특정 제품 또는 서비스의 판매량을 증가시키기 위한 활동.고객 유치 및 유지:신규 고객을 유치하거나 기존 고객의 충성도를 강화.시장 점유율 확대:경쟁사와의 차별화를 통해 시장 내 입지를 강화.특정 행동 유도:가입, 다운로드, 구매 등의 고객 행동을 유도.마케팅 캠페인의 구성 요소목표 설정:캠페인의 구체적인 목표를 정합니다. (예:..

SQL 심화학습 PV, UV

-- 테이블 생성CREATE OR REPLACE TABLE `dev-aileron-447402-k9.modulabs.orders` (   order_id STRING NOT NULL,   user_id STRING NOT NULL,   order_timestamp TIMESTAMP);-- 테이블 생성CREATE OR REPLACE TABLE `dev-aileron-447402-k9.modulabs.payments` (   order_id STRING NOT NULL,   value FLOAT64);-- 데이터 삽입INSERT INTO modulabs.orders (order_id, user_id, order_timestamp) VALUES('order_1', 'user_1', TIMESTAMP('2018..

그룹 함수

그룹 함수란?다양한 차원에서 데이터를 분석할 수 있는 함수. 데이터를 통계 내기 위한 소계, 중계를 구하는 함수이다.SELECT col1, col2, aggregate_function(argument)        FROM table        GROUP BY GROUP_FUNCTION(col1, col2) 구조설명ROLLUP소그룹 간 소계 계산CUBE다차원적 소계 계산GROUPING SETS특정 항목의 소계 계산ROLLUP, CUBE, GROUPING SETS  CREATE OR REPLACE TABLE `dev-aileron-447402-k9.modulabs.employees` (   name STRING,   department STRING,   job STRING,   salary INT64);..

윈도우함수

SELECT 컬럼 명,WINDOW_FUNCTION(ARGUMENTS) OVER ([PARTITION BY 컬럼] [ORDER BY 절] [WINDOWING 절])FROM 테이블 명;윈도우 함수는 OVER구문이 필수.ARGUMENTS윈도우 함수에 따라서 필요한 인수PARTITION BY전체 집합에 대해 소그룹으로 나누는 기준ORDER BY소그룹에 대한 정렬 기준WINDOWING행에 대한 범위 기준 순위 함수: RANK, DENSE_RANK, ROW_NUMBERRANK()동일한 값에 동일한 순위 부여 DENSE_RANK()동일한 값에 동일한 순위 부여하나 한 건으로 취급 ROW_NUMBER()동일한 값이라도 고유한 순위 부여통상적으로 Primary Key 오름차순으로 순위 부여-- 임시 테이블 생성CREAT..

SQL 심화학습

1-1. 크리에이터 및 콘텐츠 소개빅쿼리 : 빅데이터를 분석하고 관리하는 클라우드 기반 데이터 웨어하우스.구글 클라우드 플랫폼(GCP, Google Cloud Platform)에서 사용할 수 있다.클라우드 서비스이므로 인터넷만 연결된다면 어디서든 사용할 수 있다.장점 : 데이터 유실 위험이 적을 뿐 아니라 테라바이트급 쿼리를 초 단위, 페타바이트급 쿼리는 분 단위로 빠르게 처리가능. 빅쿼리의 일반적인 용도생성형 AI데이터 웨어하우스 마이그레이션BigQuery로 데이터 전송모든 데이터 유형의 가치 창출사전 구성된 데이터 솔루션실시간 분석예측 분석로그 분석마케팅 분석데이터 클린룸 https://cloud.google.com/bigquery?hl=ko#data-clean-rooms cloud.google.co..

젤리빈 실험(Jelly Bean Counting Experiment)

심리학과 통계에서 자주 사용되는 개념으로, **추측과 통계적 오차, 그리고 집단의 평균적인 지혜(집단 지성)**를 이해하기 위한 간단한 실험입니다. 예를 들면실험의 핵심 아이디어질문: "이 병 안에 몇 개의 젤리빈이 있을까요?"목적: 사람들이 얼마나 정확하게 숫자를 추측할 수 있는지, 개별적인 오차와 집단의 평균 추측이 얼마나 다른지 알아보는 것입니다.실험 방법젤리빈 병 준비:투명한 병에 젤리빈을 가득 채웁니다. 예를 들어, 병 안에 젤리빈이 237개 있다고 가정합니다.추측 요청:여러 사람(예: 20명)에게 병을 보여주고, 젤리빈의 개수를 추측하도록 요청합니다.각 사람이 추측한 숫자를 적어냅니다.데이터 수집:사람들이 추측한 숫자를 수집하여 평균을 계산합니다.결과 분석개별 오차:사람들은 종종 정확한 숫자를..

300x250
SMALL