고객 세그멘테이션이 필요한 이유
- 고객 맞춤형 마케팅
- 모든 고객에게 동일한 마케팅을 적용하는 것보다 각 고객 그룹의 특성에 맞춘 전략을 수립하는 것이 효과적
- 예: VIP 고객에게 더 많은 혜택 제공, 신규 고객에게 할인 쿠폰 제공
- 고객 행동 패턴 분석
- 고객이 언제, 무엇을, 얼마나 자주 구매하는지에 따라 그룹을 나누어 더 깊은 인사이트를 얻을 수 있음
- 비용 절감 & 마케팅 효율성 증가
- 마케팅 비용을 모든 고객에게 동일하게 투입하는 것보다 타겟팅된 그룹에 집중 투자하면 비용 대비 효과가 높아짐
- 수익 극대화
- 특정 그룹(예: 높은 지출을 하는 고객)에게 맞춘 전략을 제공하여 매출 증대
- 1. 해결하려는 목적?
- 재구매 패턴 파악: 고객이 특정 제품을 얼마나 자주 재구매하는지 분석하여 마케팅 전략을 최적화
- 연관 상품 추천: 고객이 자주 함께 구매하는 상품을 찾아 번들 추천 및 크로스셀링 전략 적용
- 수요 예측 및 재고 관리 최적화: 특정 상품이 언제, 얼마나 많이 판매될지 예측하여 적절한 재고 유지
- 고객 맞춤형 프로모션: 특정 고객이 선호하는 제품에 대한 할인 쿠폰 제공
2. 이 분석의 목적은?- 구매 패턴 분석: 고객이 어떤 상품을 함께 구매하는지, 어떤 상품을 반복적으로 구매하는지 탐색
- 상품 추천 시스템 구축: 협업 필터링, 연관 규칙 분석(Association Rule) 등을 활용한 추천 모델 개발
- 데이터 기반 마케팅 전략 수립: 특정 고객 그룹에 대한 맞춤형 프로모션 및 할인 전략 설계
- 효율적인 재고 관리: 판매 데이터 기반으로 재고를 최적화하여 비용 절감
3. 이것을 통해서 무엇을 배울 것인가?- 데이터 전처리 (Data Cleaning & Feature Engineering)
- 결측치 처리, 데이터 병합, 새로운 피처 생성 등의 전처리 기법 학습
- 고객별 구매 패턴을 반영한 피처 엔지니어링
- 장바구니 분석 (Market Basket Analysis, MBA)
- 연관 규칙 분석(Apriori, FP-Growth) 및 제품 간 관계 분석
- Support, Confidence, Lift 등의 지표를 활용한 상품 추천
- 추천 시스템 구축 (Recommendation System)
- 협업 필터링(Collaborative Filtering), 콘텐츠 기반 필터링(Content-Based Filtering) 학습
- 베스트셀러, 트렌드 기반 추천 및 개인 맞춤 추천 시스템 설계
- 시각화 및 인사이트 도출
- 고객 구매 트렌드를 파악하고 데이터 기반 의사결정 도출
- Looker, Tableau, Matplotlib, Seaborn 등의 도구를 활용한 시각화
- 머신러닝/딥러닝 모델 적용
- 고객 세분화(Clustering), 분류(Classification), 순위 예측(Ranking) 모델 실습
- XGBoost, Random Forest, 딥러닝 모델을 활용한 제품 추천 최적화
준비 (질문에 대한 대답을 위해 필요한 데이터는?)
1. 해결하려는 목적을 위한 데이터
(장바구니 최적화 및 개인화 추천 개선을 위해 필요한 데이터)
1) 고객의 재구매 패턴 파악
- user_id : 고객 식별자
- order_id : 주문 식별자
- order_number : 고객이 몇 번째 주문을 했는지 (재구매 여부 파악)
- days_since_prior_order : 이전 주문과의 간격 (주기적 구매 패턴 분석)
- product_id : 구매한 제품 식별자
- reordered : 이전에 구매한 제품을 재구매했는지 여부
2) 연관 상품 추천을 위한 데이터
- order_id : 같은 주문 내에서 함께 구매된 제품 그룹 분석
- product_id : 특정 제품과 함께 자주 구매되는 다른 제품 찾기
- department_id, aisle_id : 제품의 카테고리 정보 (같은 카테고리 내 추천 가능)
3) 수요 예측 및 재고 관리 최적화
- order_dow : 요일별 주문 패턴 분석 (특정 요일에 많이 팔리는 제품 파악)
- order_hour_of_day : 시간대별 주문량 변화 분석 (피크 타임 예측)
- days_since_prior_order : 고객이 특정 제품을 얼마나 자주 구매하는지 확인
- product_id 및 order_id : 특정 제품의 주문 빈도
4) 고객 맞춤형 프로모션
- user_id : 특정 고객 그룹을 타겟팅
- product_id : 특정 제품에 대한 할인 쿠폰 제공 여부
- order_number : 특정 고객이 몇 번째 주문을 하는지에 따라 혜택 제공 가능
- reordered : 재구매 가능성이 높은 고객에게 타겟 광고 제공
2. 분석의 목적을 위한 데이터
(소비자 행동을 이해하고, 비즈니스 성과를 개선하기 위해 필요한 데이터)
1) 구매 패턴 분석
- user_id, product_id, order_id : 개별 고객이 어떤 제품을 얼마나 자주 구매하는지 분석
- order_number : 특정 제품을 몇 번째 주문에서 다시 구매하는지 확인
- order_dow, order_hour_of_day : 구매 트렌드 분석
2) 상품 추천 시스템 구축
- order_id, product_id : 특정 제품과 함께 자주 구매된 제품을 찾기 위한 데이터
- department_id, aisle_id : 비슷한 카테고리 내에서 추천할 수 있도록 활용
- reordered : 과거에 구매했던 제품을 다시 구매하는 고객을 대상으로 추천
3) 데이터 기반 마케팅 전략 수립
- user_id : 특정 고객군을 타겟팅
- product_id : 인기 제품을 파악하여 광고 및 프로모션 적용
- order_dow, order_hour_of_day : 특정 시간대/요일별 할인 전략 수립
- days_since_prior_order : 장기간 구매하지 않은 고객에게 리마인더 제공
4) 효율적인 재고 관리
- product_id : 수요가 높은 제품을 우선적으로 관리
- order_dow, order_hour_of_day : 시간대별 주문량 변화를 분석하여 재고 최적화
- days_since_prior_order : 특정 제품의 재구매 주기 파악
3. 학습을 위한 데이터
(데이터 분석, 머신러닝, 추천 시스템 개발을 위해 필요한 데이터)
1) 데이터 전처리 및 특징 엔지니어링
- user_id, product_id, order_id : 고객, 제품, 주문 간의 관계 분석
- order_number, days_since_prior_order : 구매 주기 파악 및 피처 생성
- department_id, aisle_id : 카테고리 기반 추천을 위한 피처 추가
2) 장바구니 분석 (MBA - Market Basket Analysis)
- order_id, product_id : 주문별로 함께 구매된 제품 리스트
- department_id, aisle_id : 동일한 카테고리 제품이 많이 구매되는지 확인
- reordered : 특정 제품의 재구매율이 높은지 확인
3) 추천 시스템 구축
- 협업 필터링을 위한 데이터
- user_id, product_id, order_id : 고객별 구매 이력
- reordered : 재구매 여부 분석
- 콘텐츠 기반 필터링을 위한 데이터
- product_id, department_id, aisle_id : 제품 속성을 기반으로 유사 제품 추천
4) 시각화 및 인사이트 도출
- order_dow, order_hour_of_day : 주문이 몰리는 시간 및 요일 분석
- product_id : 가장 많이 판매된 제품 시각화
- department_id, aisle_id : 인기 카테고리 분석
5) 머신러닝/딥러닝 모델 적용
- 분류(Classification) 모델을 위한 데이터
- user_id, product_id, reordered : 특정 고객이 특정 제품을 재구매할지 예측
- order_dow, order_hour_of_day, days_since_prior_order : 시간, 요일, 재구매 주기를 활용한 모델 학습
- 클러스터링(Clustering) 모델을 위한 데이터
- user_id, order_number, days_since_prior_order, reordered : 고객을 그룹화하여 유사한 소비 패턴을 가진 그룹 생성
정리: 최적의 분석을 위해 필요한 주요 데이터 항목
데이터 항목 | 설명 | 활용 목적 |
user_id | 고객 식별자 | 개인화 추천, 고객 세분화 |
order_id | 주문 식별자 | 장바구니 분석, 제품 연관성 파악 |
product_id | 제품 식별자 | 제품 추천, 인기 상품 분석 |
reordered | 재구매 여부 | 재구매 패턴 분석, 추천 시스템 |
order_number | 주문 횟수 | 고객별 구매 경향 분석 |
days_since_prior_order | 이전 주문과의 시간 간격 | 재구매 주기 분석, 마케팅 전략 |
order_dow | 주문한 요일 | 특정 요일의 판매량 분석 |
order_hour_of_day | 주문한 시간 | 특정 시간대의 판매량 분석 |
department_id | 제품 대분류 | 카테고리별 판매 경향 분석 |
aisle_id | 제품 소분류 | 세부 카테고리별 인기 제품 분석 |
이 데이터들을 활용하면 고객 행동을 이해하고, 추천 시스템을 최적화하며, 비즈니스 성과를 극대화하는 인사이트를 도출.
우선순위 정하기(모든걸 다할순없다 3일동안할수 있는최적은?)
- 우선순위 정하기(모든걸 다할순없다4명이3일동안할수 있는최적은?)
- 분석 결과가 실제 기업의 의사결정에 영향을 줄 수 있는가?
- 마케팅, 추천 시스템, 재고 관리, 프로모션 등 비즈니스 활용 가능성이 높은가?
- 단순한 데이터 통계가 아니라, 수익 증대, 고객 만족도 향상, 운영 최적화 등에 기여할 수 있는가?
- 3일 내에 분석이 가능한가? (데이터 전처리 부담이 적고, 빠르게 인사이트 도출 가능)
- 복잡한 모델링 없이도 의미 있는 결과를 얻을 수 있는가?
- 데이터의 가용성이 높고, 빠르게 분석할 수 있는 컬럼을 중심으로 할 것
- 보고서를 보는 사람들이 쉽게 이해할 수 있는가?
- 데이터를 직관적으로 시각화할 수 있는가?
- "숫자"만 나열하는 것이 아니라, 명확한 패턴과 트렌드를 도출할 수 있는가?
- 보고서가 흥미롭고, 기억에 남을 수 있는가?
우선순위 | 분석 주제 | 이유 |
1 | 고객 재구매 및 행동 패턴 분석 | - 재구매율이 높은 제품을 찾으면 마케팅에 직접 활용 가능 - 고객의 쇼핑 시간 및 요일 패턴 분석 → 프로모션 최적화 - 전처리가 간단하고, 빠르게 분석할 수 있음 |
2 | 장바구니 연관 분석 및 추천 모델 | - 연관 제품을 찾으면 번들 판매, 크로스셀링 전략 활용 가능 - 유사한 제품을 추천할 수 있어 개인화 추천 시스템 구축 가능 - 데이터가 명확하게 존재 (order_id, product_id) 하므로 분석 용이 |
3 | 고객 세분화 (클러스터링 분석) | - 고객을 그룹화하면 맞춤형 마케팅 가능 - "자주 쇼핑하는 고객 vs 가끔 쇼핑하는 고객"을 나누어 차별화된 전략 적용 가능 - 단, 클러스터링 모델 해석이 필요해 분석 난이도는 다소 높음 |
- 첫째 날: 고객 재구매 및 행동 패턴 분석 (가장 빠르게 인사이트 도출 가능)
- 둘째 날: 장바구니 연관 분석 (Market Basket Analysis) + 추천 시스템 (가시적인 결과가 나오는 강력한 분석)
- 셋째 날: 고객 세분화 분석 (클러스터링) + 보고서 정리 및 발표 자료 준비
추가하면 좋은 데이터
객 세분화 & 매출 기여도 분석을 위한 데이터 추가
컬럼명 | 설명 | 활용 목적 |
total_products_in_order | 해당 주문에서 구매한 총 제품 수 | 고객의 장바구니 크기 분석 (대량 구매 vs 소량 구매 고객 분류) |
average_spent_per_order | 고객이 한 번 주문할 때 평균 지출 금액 (추가 데이터 필요) | 고객 가치를 측정하여 VIP 고객 식별 |
preferred_aisle | 고객이 가장 많이 구매하는 aisle_id (가장 선호하는 제품군) | 고객 맞춤형 프로모션 적용 |
preferred_hour | 고객이 주로 쇼핑하는 시간대 | 시간대별 광고 최적화, 고객 타겟팅 |
customer_lifetime_value (CLV) | 고객 생애 가치 (주문 빈도, 평균 구매액 기반) | 충성 고객과 이탈 고객 분류, 맞춤형 혜택 제공 |
이 데이터들을 추가하면 다음이 가능해짐
- 고객 세분화 & 맞춤형 마케팅 전략 (VIP 고객, 저빈도 고객 구분)
- 매출 기여도 분석 (고객별 평균 지출 금액, 장바구니 크기 분석)
- 시간대별/요일별 맞춤 광고 최적화 (고객이 선호하는 쇼핑 시간 기반 광고 설정)
1. 역할 분배 (4인 기준)
역할 담당자 주요 업무
A: 데이터 리더 | 팀원 1 | 데이터 전처리, 피처 엔지니어링 |
B: 모델링 담당 | 팀원 2 | 머신러닝 모델 구축 및 성능 평가 |
C: 인사이트 분석 담당 | 팀원 3 | 예측 결과 분석 및 비즈니스 인사이트 도출 |
D: 보고서 및 발표 담당 | 팀원 4 | 최종 보고서 및 발표 자료 제작 |
2. 3일 일정 (하루 7시간 기준)
Day 1: 가설 설정 및 데이터 전처리
- (공통) 개별 EDA 결과 공유 (1시간)
- (A: 데이터 리더) 데이터 전처리 및 피처 엔지니어링 (4시간)
- (B: 모델링 담당) 예측 모델 기초 설계 및 베이스라인 모델 구축 (4시간)
- (C: 인사이트 담당) 데이터에서 도출할 수 있는 가설 및 분석 방향 정리 (3시간)
- (D: 보고서 담당) 프로젝트 개요 및 데이터 설명 정리 (3시간)
- (팀 전체) 주요 가설 및 모델링 목표 논의 (2시간)
Day 2: 예측 모델링 및 분석
- (A: 데이터 리더 & B: 모델링 담당) 데이터셋 정제 및 머신러닝 모델 최적화 (4시간)
- (C: 인사이트 담당) 모델 결과 해석 및 비즈니스 적용 가능성 검토 (4시간)
- (D: 보고서 담당) 보고서 및 발표 PPT 구성 기획 (3시간)
- (팀 전체) 예측 결과 확인 및 성능 개선 논의 (3시간)
Day 3: 보고서 작성 및 발표 준비
- (D: 보고서 담당) PPT 및 보고서 작성 (5시간)
- (A: 데이터 리더 & C: 인사이트 담당) 주요 시각화 자료 정리 및 발표용 그래프 제작 (3시간)
- (B: 모델링 담당) 모델 성능 요약 및 분석 내용 추가 (3시간)
- (팀 전체) 최종 리뷰 및 발표 연습 (2시간)
3. PPT 발표 및 보고서 구성
30분 발표 기준으로 15~20페이지 분량이 최적입니다.
1) PPT 발표 자료 (15~20페이지)
페이지 | 내용 | 담당자 |
1 | 제목 페이지 (프로젝트명, 팀원 소개) | D |
2 | 프로젝트 개요 (목표, 데이터셋 소개) | D |
3~4 | 데이터 EDA (주요 패턴 시각화) | A |
5 | 주요 가설 설정 | C |
6~8 | 데이터 전처리 및 피처 엔지니어링 (추가한 변수 설명) | A |
9~10 | 모델링 과정 (알고리즘, 성능 비교) | B |
11 | 최종 모델 성능 평가 (Precision, Recall 등) | B |
12~13 | 예측 결과 분석 및 시사점 | C |
14~15 | 비즈니스 인사이트 및 제안 | C |
16 | 결론 및 향후 연구 방향 | D |
17~18 | Q&A | 전체 |
2) 최종 보고서 (5~7페이지)
페이지 | 내용 | 담당자 |
1 | 프로젝트 개요 (목적, 데이터 설명) | D |
2 | 데이터 탐색 (EDA 결과 요약) | A |
3 | 가설 설정 및 예측 모델 개요 | C |
4 | 모델링 과정 및 결과 분석 | B |
5 | 인사이트 및 비즈니스 활용 방안 | C |
6 | 결론 및 한계점 | D |
4. 최적의 발표 방식
- 1분 : 프로젝트 개요
- 3분 : 데이터 EDA 및 패턴 분석
- 2분 : 가설 및 분석 목표 설명
- 4분 : 데이터 전처리 및 피처 엔지니어링 과정
- 4분 : 머신러닝 모델 구축 및 성능 비교
- 4분 : 결과 분석 및 주요 인사이트
- 3분 : 비즈니스 적용 방안
- 2분 : 결론 및 Q&A
마케팅 전략 (30일 이상 장기 미구매 고객 세분화 및 맞춤형 마케팅 적용)
30일 이상 주문 간격이 있는 고객을 세분화하여 이탈 위험 고객을 식별하고 맞춤형 프로모션 및 재구매 유도 전략을 적용하여 고객 유지율을 향상.
- 스타트업 성장 사례 벤치마팅 : 스타트업 성장 사례 비교 분석
- 유기농 제품 중심 정기구독 모델 테스트
- 첫 구매 후 30일 이내 ‘재구매 프로모션’ 제공(할인 or 포인트).
- 맞춤형 리마인드 메시지 & 추천 상품(듀링고 Shame기반 유지전략처럼 고객에서 감성적인 알림 보 감성적으로 자극하기, “마지막구매한 제품이 당신을 그리워 합니다.”
- 테슬라 전략처럼 친구초대하면 특별보상제공(친구추천시 무료 배송, 10% 할인 쿠폰 제공)
- 고객 재활성화 캠페인 번들 할인 제안 : 구매 빈도(Frequency)가 낮은 고객에게는 관련 제품 번들을 제안하여 주문 건수를 늘릴 수 있습니다. 30일이상간격 주문자 맞춤형: 첫 재구매 유도(특정유기농 제품 할인, 무료배송쿠폰) + 일정 기간 구매없으면 추가 리마인드 알림.(지난번 구매한 제품 재구매 권유 등)
- 로열티 프로그램 멤버십 방식 도입 : 유기농 제품 구매 고객에게 ‘유기농 멤버십 도입(정기적 유기농제품 구입시 리워드제공), Instacart 내 ‘유기농 구매자 커뮤니티’ 운영, 아마존 처럼 구매자에게 추가 혜택제공, 특정 제품 정기 구매시 할인 등 스타벅스 처럼 구매할수록 포인트적립되고 특별 할인 해택등 레벨업기능 추가(구매습화)
- 메모리문제
- Pandas의 read_csv() 함수에서 chunksize 옵션을 사용하면, 파일 전체를 한 번에 메모리에 올리지 않고 일정 행 단위로 읽어 처리할 수 있습니다.
- 이를 통해 데이터를 부분적으로 로드하여 처리하고, 필요한 경우 청크별로 연산 후 결과를 집계할 수 있습니다.
python 복사 import pandas as pd chunksize = 500000 # 예: 50만 행씩 읽기 result_list = [] for chunk in pd.read_csv("customer_segmentation_total_filtered.csv", chunksize=chunksize): # 예: 간단한 요약 통계 계산 후 결과 저장 summary = chunk.describe() result_list.append(summary) # 이후 result_list를 활용하여 최종 분석 수행
2. Dask, Polars, Vaex 등 대용량 데이터 처리 라이브러리 활용- Dask: Pandas와 유사한 인터페이스를 제공하며, 데이터프레임을 여러 청크로 나누어 병렬 처리할 수 있습니다.
- python
복사
import dask.dataframe as dd
ddf = dd.read_csv("customer_segmentation_total_filtered.csv")
# 예: 일부 연산 수행 (예: 그룹별 평균 계산)
result = ddf.groupby("user_id").agg({"total_orders": "mean"}).compute() - Polars: Rust 기반의 라이브러리로, 메모리 사용량과 속도가 효율적입니다.
- python
복사
import polars as pl
df = pl.read_csv("customer_segmentation_total_filtered.csv")
result = df.groupby("user_id").agg(pl.col("total_orders").mean()) - Vaex: 메모리에 전부 올리지 않고도 대용량 데이터 처리와 시각화를 할 수 있습니다.
3. 효율적인 파일 포맷으로 변환 (Parquet, HDF5)- CSV는 텍스트 형식이기 때문에 파싱 비용이 크고 메모리 사용량도 많습니다.
- Parquet나 HDF5와 같이 컬럼 기반의 이진 포맷으로 변환하면, 필요한 컬럼만 읽어오는 등 효율적인 I/O 처리가 가능합니다.
- python
복사
import pandas as pd
# CSV를 Parquet 파일로 변환
df = pd.read_csv("customer_segmentation_total_filtered.csv")
df.to_parquet("customer_segmentation_total_filtered.parquet", index=False)
# 이후 Parquet 파일을 읽어 분석
df_parquet = pd.read_parquet("customer_segmentation_total_filtered.parquet")
4. 데이터베이스로의 전환- SQLite 또는 PostgreSQL 같은 데이터베이스에 CSV 데이터를 로드하여, SQL 쿼리를 통해 필요한 데이터만 추출한 후 분석할 수도 있습니다.
- 데이터베이스는 인덱싱이나 쿼리를 통한 부분 데이터 접근에 효율적입니다.
결론- 청크 단위 처리: Pandas에서 chunksize 옵션을 사용하여 메모리 부담 없이 분석.
- 대용량 데이터 처리 라이브러리: Dask, Polars, Vaex 등을 활용하여 분산/효율적 처리.
- 효율적인 파일 포맷: Parquet, HDF5로 변환하여 I/O 성능 개선.
- 데이터베이스 활용: SQL 기반 쿼리를 통해 필요한 부분만 로드.
분석방법1
1. RFM 분석 (Recency, Frequency, Monetary) 적용
- 목적: 30일 주기로 구매하는 고객이 특정 패턴을 가지는지 확인
- 방법:
- Recency: 마지막 구매 후 경과 일 수 확인
- Frequency: 한 달 동안의 구매 횟수 분석
- Monetary: 한 번의 구매당 평균 소비 금액 분석
- 결과 활용:
- 30일 단위로 반복적으로 구매하는 고객군을 특정할 수 있음
- VIP 고객과 정기 구매 고객을 구분하여 맞춤 마케팅 전략 수립 가능
2. 고객 세그먼트 분석 (K-means 클러스터링 활용)
- 목적: 30일 구매 주기를 가진 고객군을 자동으로 분류
- 방법:
- days_since_prior_order, order_count, total_spent 등 주요 변수 사용
- K-means를 사용하여 고객을 몇 개의 그룹으로 나눔
- 30일 패턴을 가진 고객이 특정 클러스터로 묶이는지 확인
- 결과 활용:
- 월간 구매 패턴을 가진 고객을 식별하여 맞춤 프로모션 제공
- 다른 주기로 구매하는 고객군과 비교하여 차이 분석
3. 구매 주기별 생존 분석 (Survival Analysis)
- 목적: 고객이 다음 구매를 하기까지의 생존 시간(구매 주기)을 분석
- 방법:
- Kaplan-Meier 생존 분석 적용
- 30일 단위 구매 고객의 생존 곡선을 비교
- 결과 활용:
- 30일 이후에 재구매하는 고객 비율이 얼마나 되는지 확인
- 고객 리텐션을 위한 타겟 마케팅 전략 수립
4. 타임 시리즈 분석 (시계열 분석)
- 목적: 30일 주기의 패턴이 반복적으로 나타나는지 확인
- 방법:
- ARIMA 또는 Prophet 모델을 사용하여 트렌드 및 주기성 분석
- 계절성을 확인하여 특정 월, 특정 날짜에 반복적인 구매 패턴이 존재하는지 분석
- 결과 활용:
- 월말이나 월초에 정기적으로 구매하는 고객군을 찾아 마케팅 적용
- 프로모션 타이밍 최적화
5. 정기구독 고객 여부 분석
- 목적: 30일 주기로 구매하는 고객이 실제 정기구독형 소비자인지 확인
- 방법:
- 고객별 주문 패턴을 분석하여 매월 동일한 날짜에 주문하는 고객 식별
- Auto Replenishment (자동 재구매) 모델 여부 검토
- 결과 활용:
- 정기구매 유도 마케팅 진행 (예: 정기구독 할인 제공)
- 특정 제품군(예: 생필품)의 정기구매 수요 분석
6. 제품별 구매 패턴 분석
- 목적: 30일 단위 주문이 특정 제품군에서 집중되는지 확인
- 방법:
- 30일 주기로 반복 구매되는 제품 목록 추출
- 제품 카테고리별 주기성 확인 (예: 생필품, 식료품 등)
- 결과 활용:
- 특정 제품군을 중심으로 월간 프로모션 기획
- 정기구매 유도를 위한 제품 번들링 추천 시스템 개발
'데이터 분석가:Applied Data Analytics' 카테고리의 다른 글
Streamlit 설치 순서 및 주의점 (0) | 2025.03.16 |
---|---|
Streamlit 란? (0) | 2025.03.16 |
kaggle Instacart Market Basket Analysis 프로젝트 (0) | 2025.03.10 |
violinplot (0) | 2025.03.10 |
선형대수학(Linear Algebra) 개요 (0) | 2025.03.10 |