데이터 분석가:Applied Data Analytics

Instacart Market Basket Analysis

데이터분석 2025. 3. 13. 21:29

고객 세그멘테이션이 필요한 이유

  1. 고객 맞춤형 마케팅
    • 모든 고객에게 동일한 마케팅을 적용하는 것보다 각 고객 그룹의 특성에 맞춘 전략을 수립하는 것이 효과적
    • 예: VIP 고객에게 더 많은 혜택 제공, 신규 고객에게 할인 쿠폰 제공
  2. 고객 행동 패턴 분석
    • 고객이 언제, 무엇을, 얼마나 자주 구매하는지에 따라 그룹을 나누어 더 깊은 인사이트를 얻을 수 있음
  3. 비용 절감 & 마케팅 효율성 증가
    • 마케팅 비용을 모든 고객에게 동일하게 투입하는 것보다 타겟팅된 그룹에 집중 투자하면 비용 대비 효과가 높아짐
  4. 수익 극대화
    • 특정 그룹(예: 높은 지출을 하는 고객)에게 맞춘 전략을 제공하여 매출 증대

  • 1. 해결하려는 목적?
    • 재구매 패턴 파악: 고객이 특정 제품을 얼마나 자주 재구매하는지 분석하여 마케팅 전략을 최적화
    • 연관 상품 추천: 고객이 자주 함께 구매하는 상품을 찾아 번들 추천 및 크로스셀링 전략 적용
    • 수요 예측 및 재고 관리 최적화: 특정 상품이 언제, 얼마나 많이 판매될지 예측하여 적절한 재고 유지
    • 고객 맞춤형 프로모션: 특정 고객이 선호하는 제품에 대한 할인 쿠폰 제공

    2. 이 분석의 목적은?
    • 구매 패턴 분석: 고객이 어떤 상품을 함께 구매하는지, 어떤 상품을 반복적으로 구매하는지 탐색
    • 상품 추천 시스템 구축: 협업 필터링, 연관 규칙 분석(Association Rule) 등을 활용한 추천 모델 개발
    • 데이터 기반 마케팅 전략 수립: 특정 고객 그룹에 대한 맞춤형 프로모션 및 할인 전략 설계
    • 효율적인 재고 관리: 판매 데이터 기반으로 재고를 최적화하여 비용 절감

    3. 이것을 통해서 무엇을 배울 것인가?
    • 데이터 전처리 (Data Cleaning & Feature Engineering)
      • 결측치 처리, 데이터 병합, 새로운 피처 생성 등의 전처리 기법 학습
      • 고객별 구매 패턴을 반영한 피처 엔지니어링
    • 장바구니 분석 (Market Basket Analysis, MBA)
      • 연관 규칙 분석(Apriori, FP-Growth) 및 제품 간 관계 분석
      • Support, Confidence, Lift 등의 지표를 활용한 상품 추천
    • 추천 시스템 구축 (Recommendation System)
      • 협업 필터링(Collaborative Filtering), 콘텐츠 기반 필터링(Content-Based Filtering) 학습
      • 베스트셀러, 트렌드 기반 추천 및 개인 맞춤 추천 시스템 설계
    • 시각화 및 인사이트 도출
      • 고객 구매 트렌드를 파악하고 데이터 기반 의사결정 도출
      • Looker, Tableau, Matplotlib, Seaborn 등의 도구를 활용한 시각화
    • 머신러닝/딥러닝 모델 적용
      • 고객 세분화(Clustering), 분류(Classification), 순위 예측(Ranking) 모델 실습
      • XGBoost, Random Forest, 딥러닝 모델을 활용한 제품 추천 최적화

준비 (질문에 대한 대답을 위해 필요한 데이터는?)

1. 해결하려는 목적을 위한 데이터

(장바구니 최적화 및 개인화 추천 개선을 위해 필요한 데이터)

1) 고객의 재구매 패턴 파악

  • user_id : 고객 식별자
  • order_id : 주문 식별자
  • order_number : 고객이 몇 번째 주문을 했는지 (재구매 여부 파악)
  • days_since_prior_order : 이전 주문과의 간격 (주기적 구매 패턴 분석)
  • product_id : 구매한 제품 식별자
  • reordered : 이전에 구매한 제품을 재구매했는지 여부

2) 연관 상품 추천을 위한 데이터

  • order_id : 같은 주문 내에서 함께 구매된 제품 그룹 분석
  • product_id : 특정 제품과 함께 자주 구매되는 다른 제품 찾기
  • department_id, aisle_id : 제품의 카테고리 정보 (같은 카테고리 내 추천 가능)

3) 수요 예측 및 재고 관리 최적화

  • order_dow : 요일별 주문 패턴 분석 (특정 요일에 많이 팔리는 제품 파악)
  • order_hour_of_day : 시간대별 주문량 변화 분석 (피크 타임 예측)
  • days_since_prior_order : 고객이 특정 제품을 얼마나 자주 구매하는지 확인
  • product_id 및 order_id : 특정 제품의 주문 빈도

4) 고객 맞춤형 프로모션

  • user_id : 특정 고객 그룹을 타겟팅
  • product_id : 특정 제품에 대한 할인 쿠폰 제공 여부
  • order_number : 특정 고객이 몇 번째 주문을 하는지에 따라 혜택 제공 가능
  • reordered : 재구매 가능성이 높은 고객에게 타겟 광고 제공

2. 분석의 목적을 위한 데이터

(소비자 행동을 이해하고, 비즈니스 성과를 개선하기 위해 필요한 데이터)

1) 구매 패턴 분석

  • user_id, product_id, order_id : 개별 고객이 어떤 제품을 얼마나 자주 구매하는지 분석
  • order_number : 특정 제품을 몇 번째 주문에서 다시 구매하는지 확인
  • order_dow, order_hour_of_day : 구매 트렌드 분석

2) 상품 추천 시스템 구축

  • order_id, product_id : 특정 제품과 함께 자주 구매된 제품을 찾기 위한 데이터
  • department_id, aisle_id : 비슷한 카테고리 내에서 추천할 수 있도록 활용
  • reordered : 과거에 구매했던 제품을 다시 구매하는 고객을 대상으로 추천

3) 데이터 기반 마케팅 전략 수립

  • user_id : 특정 고객군을 타겟팅
  • product_id : 인기 제품을 파악하여 광고 및 프로모션 적용
  • order_dow, order_hour_of_day : 특정 시간대/요일별 할인 전략 수립
  • days_since_prior_order : 장기간 구매하지 않은 고객에게 리마인더 제공

4) 효율적인 재고 관리

  • product_id : 수요가 높은 제품을 우선적으로 관리
  • order_dow, order_hour_of_day : 시간대별 주문량 변화를 분석하여 재고 최적화
  • days_since_prior_order : 특정 제품의 재구매 주기 파악

3. 학습을 위한 데이터

(데이터 분석, 머신러닝, 추천 시스템 개발을 위해 필요한 데이터)

1) 데이터 전처리 및 특징 엔지니어링

  • user_id, product_id, order_id : 고객, 제품, 주문 간의 관계 분석
  • order_number, days_since_prior_order : 구매 주기 파악 및 피처 생성
  • department_id, aisle_id : 카테고리 기반 추천을 위한 피처 추가

2) 장바구니 분석 (MBA - Market Basket Analysis)

  • order_id, product_id : 주문별로 함께 구매된 제품 리스트
  • department_id, aisle_id : 동일한 카테고리 제품이 많이 구매되는지 확인
  • reordered : 특정 제품의 재구매율이 높은지 확인

3) 추천 시스템 구축

  • 협업 필터링을 위한 데이터
    • user_id, product_id, order_id : 고객별 구매 이력
    • reordered : 재구매 여부 분석
  • 콘텐츠 기반 필터링을 위한 데이터
    • product_id, department_id, aisle_id : 제품 속성을 기반으로 유사 제품 추천

4) 시각화 및 인사이트 도출

  • order_dow, order_hour_of_day : 주문이 몰리는 시간 및 요일 분석
  • product_id : 가장 많이 판매된 제품 시각화
  • department_id, aisle_id : 인기 카테고리 분석

5) 머신러닝/딥러닝 모델 적용

  • 분류(Classification) 모델을 위한 데이터
    • user_id, product_id, reordered : 특정 고객이 특정 제품을 재구매할지 예측
    • order_dow, order_hour_of_day, days_since_prior_order : 시간, 요일, 재구매 주기를 활용한 모델 학습
  • 클러스터링(Clustering) 모델을 위한 데이터
    • user_id, order_number, days_since_prior_order, reordered : 고객을 그룹화하여 유사한 소비 패턴을 가진 그룹 생성

정리: 최적의 분석을 위해 필요한 주요 데이터 항목

데이터 항목 설명 활용 목적
user_id 고객 식별자 개인화 추천, 고객 세분화
order_id 주문 식별자 장바구니 분석, 제품 연관성 파악
product_id 제품 식별자 제품 추천, 인기 상품 분석
reordered 재구매 여부 재구매 패턴 분석, 추천 시스템
order_number 주문 횟수 고객별 구매 경향 분석
days_since_prior_order 이전 주문과의 시간 간격 재구매 주기 분석, 마케팅 전략
order_dow 주문한 요일 특정 요일의 판매량 분석
order_hour_of_day 주문한 시간 특정 시간대의 판매량 분석
department_id 제품 대분류 카테고리별 판매 경향 분석
aisle_id 제품 소분류 세부 카테고리별 인기 제품 분석

이 데이터들을 활용하면 고객 행동을 이해하고, 추천 시스템을 최적화하며, 비즈니스 성과를 극대화하는 인사이트를 도출.


우선순위 정하기(모든걸 다할순없다 3일동안할수 있는최적은?)

  • 우선순위 정하기(모든걸 다할순없다4명이3일동안할수 있는최적은?)
    • 분석 결과가 실제 기업의 의사결정에 영향을 줄 수 있는가?
    • 마케팅, 추천 시스템, 재고 관리, 프로모션 등 비즈니스 활용 가능성이 높은가?
    • 단순한 데이터 통계가 아니라, 수익 증대, 고객 만족도 향상, 운영 최적화 등에 기여할 수 있는가?
    2. 실행 가능성 (Feasibility)
    • 3일 내에 분석이 가능한가? (데이터 전처리 부담이 적고, 빠르게 인사이트 도출 가능)
    • 복잡한 모델링 없이도 의미 있는 결과를 얻을 수 있는가?
    • 데이터의 가용성이 높고, 빠르게 분석할 수 있는 컬럼을 중심으로 할 것
    3. 인사이트의 시각적 전달력 (Storytelling & Visualization)
    • 보고서를 보는 사람들이 쉽게 이해할 수 있는가?
    • 데이터를 직관적으로 시각화할 수 있는가?
    • "숫자"만 나열하는 것이 아니라, 명확한 패턴과 트렌드를 도출할 수 있는가?
    • 보고서가 흥미롭고, 기억에 남을 수 있는가?
우선순위 분석 주제 이유
1 고객 재구매 및 행동 패턴 분석 - 재구매율이 높은 제품을 찾으면 마케팅에 직접 활용 가능 - 고객의 쇼핑 시간 및 요일 패턴 분석 → 프로모션 최적화 - 전처리가 간단하고, 빠르게 분석할 수 있음
2 장바구니 연관 분석 및 추천 모델 - 연관 제품을 찾으면 번들 판매, 크로스셀링 전략 활용 가능 - 유사한 제품을 추천할 수 있어 개인화 추천 시스템 구축 가능 - 데이터가 명확하게 존재 (order_id, product_id) 하므로 분석 용이
3 고객 세분화 (클러스터링 분석) - 고객을 그룹화하면 맞춤형 마케팅 가능 - "자주 쇼핑하는 고객 vs 가끔 쇼핑하는 고객"을 나누어 차별화된 전략 적용 가능 - 단, 클러스터링 모델 해석이 필요해 분석 난이도는 다소 높음
  • 첫째 날: 고객 재구매 및 행동 패턴 분석 (가장 빠르게 인사이트 도출 가능)
  • 둘째 날: 장바구니 연관 분석 (Market Basket Analysis) + 추천 시스템 (가시적인 결과가 나오는 강력한 분석)
  • 셋째 날: 고객 세분화 분석 (클러스터링) + 보고서 정리 및 발표 자료 준비

추가하면 좋은 데이터

객 세분화 & 매출 기여도 분석을 위한 데이터 추가

컬럼명 설명 활용 목적
total_products_in_order 해당 주문에서 구매한 총 제품 수 고객의 장바구니 크기 분석 (대량 구매 vs 소량 구매 고객 분류)
average_spent_per_order 고객이 한 번 주문할 때 평균 지출 금액 (추가 데이터 필요) 고객 가치를 측정하여 VIP 고객 식별
preferred_aisle 고객이 가장 많이 구매하는 aisle_id (가장 선호하는 제품군) 고객 맞춤형 프로모션 적용
preferred_hour 고객이 주로 쇼핑하는 시간대 시간대별 광고 최적화, 고객 타겟팅
customer_lifetime_value (CLV) 고객 생애 가치 (주문 빈도, 평균 구매액 기반) 충성 고객과 이탈 고객 분류, 맞춤형 혜택 제공

이 데이터들을 추가하면 다음이 가능해짐

  • 고객 세분화 & 맞춤형 마케팅 전략 (VIP 고객, 저빈도 고객 구분)
  • 매출 기여도 분석 (고객별 평균 지출 금액, 장바구니 크기 분석)
  • 시간대별/요일별 맞춤 광고 최적화 (고객이 선호하는 쇼핑 시간 기반 광고 설정)

1. 역할 분배 (4인 기준)

역할 담당자 주요 업무

A: 데이터 리더 팀원 1 데이터 전처리, 피처 엔지니어링
B: 모델링 담당 팀원 2 머신러닝 모델 구축 및 성능 평가
C: 인사이트 분석 담당 팀원 3 예측 결과 분석 및 비즈니스 인사이트 도출
D: 보고서 및 발표 담당 팀원 4 최종 보고서 및 발표 자료 제작

2. 3일 일정 (하루 7시간 기준)

Day 1: 가설 설정 및 데이터 전처리

  • (공통) 개별 EDA 결과 공유 (1시간)
  • (A: 데이터 리더) 데이터 전처리 및 피처 엔지니어링 (4시간)
  • (B: 모델링 담당) 예측 모델 기초 설계 및 베이스라인 모델 구축 (4시간)
  • (C: 인사이트 담당) 데이터에서 도출할 수 있는 가설 및 분석 방향 정리 (3시간)
  • (D: 보고서 담당) 프로젝트 개요 및 데이터 설명 정리 (3시간)
  • (팀 전체) 주요 가설 및 모델링 목표 논의 (2시간)

Day 2: 예측 모델링 및 분석

  • (A: 데이터 리더 & B: 모델링 담당) 데이터셋 정제 및 머신러닝 모델 최적화 (4시간)
  • (C: 인사이트 담당) 모델 결과 해석 및 비즈니스 적용 가능성 검토 (4시간)
  • (D: 보고서 담당) 보고서 및 발표 PPT 구성 기획 (3시간)
  • (팀 전체) 예측 결과 확인 및 성능 개선 논의 (3시간)

Day 3: 보고서 작성 및 발표 준비

  • (D: 보고서 담당) PPT 및 보고서 작성 (5시간)
  • (A: 데이터 리더 & C: 인사이트 담당) 주요 시각화 자료 정리 및 발표용 그래프 제작 (3시간)
  • (B: 모델링 담당) 모델 성능 요약 및 분석 내용 추가 (3시간)
  • (팀 전체) 최종 리뷰 및 발표 연습 (2시간)

3. PPT 발표 및 보고서 구성

30분 발표 기준으로 15~20페이지 분량이 최적입니다.

 1) PPT 발표 자료 (15~20페이지)

페이지 내용 담당자
1 제목 페이지 (프로젝트명, 팀원 소개) D
2 프로젝트 개요 (목표, 데이터셋 소개) D
3~4 데이터 EDA (주요 패턴 시각화) A
5 주요 가설 설정 C
6~8 데이터 전처리 및 피처 엔지니어링 (추가한 변수 설명) A
9~10 모델링 과정 (알고리즘, 성능 비교) B
11 최종 모델 성능 평가 (Precision, Recall 등) B
12~13 예측 결과 분석 및 시사점 C
14~15 비즈니스 인사이트 및 제안 C
16 결론 및 향후 연구 방향 D
17~18 Q&A 전체

2) 최종 보고서 (5~7페이지)

페이지 내용 담당자
1 프로젝트 개요 (목적, 데이터 설명) D
2 데이터 탐색 (EDA 결과 요약) A
3 가설 설정 및 예측 모델 개요 C
4 모델링 과정 및 결과 분석 B
5 인사이트 및 비즈니스 활용 방안 C
6 결론 및 한계점 D

4. 최적의 발표 방식

  • 1분 : 프로젝트 개요
  • 3분 : 데이터 EDA 및 패턴 분석
  • 2분 : 가설 및 분석 목표 설명
  • 4분 : 데이터 전처리 및 피처 엔지니어링 과정
  • 4분 : 머신러닝 모델 구축 및 성능 비교
  • 4분 : 결과 분석 및 주요 인사이트
  • 3분 : 비즈니스 적용 방안
  • 2분 : 결론 및 Q&A

마케팅 전략 (30일 이상 장기 미구매 고객 세분화 및 맞춤형 마케팅 적용)

30일 이상 주문 간격이 있는 고객을 세분화하여 이탈 위험 고객을 식별하고 맞춤형 프로모션 및 재구매 유도 전략을 적용하여 고객 유지율을 향상.

  • 스타트업 성장 사례 벤치마팅 : 스타트업 성장 사례 비교 분석
  1. 유기농 제품 중심 정기구독 모델 테스트
  2. 첫 구매 후 30일 이내 ‘재구매 프로모션’ 제공(할인 or 포인트).
  3. 맞춤형 리마인드 메시지 & 추천 상품(듀링고 Shame기반 유지전략처럼 고객에서 감성적인 알림 보 감성적으로 자극하기, “마지막구매한 제품이 당신을 그리워 합니다.”
  4. 테슬라 전략처럼 친구초대하면 특별보상제공(친구추천시 무료 배송, 10% 할인 쿠폰 제공)
  • 고객 재활성화 캠페인 번들 할인 제안 : 구매 빈도(Frequency)가 낮은 고객에게는 관련 제품 번들을 제안하여 주문 건수를 늘릴 수 있습니다. 30일이상간격 주문자 맞춤형: 첫 재구매 유도(특정유기농 제품 할인, 무료배송쿠폰) + 일정 기간 구매없으면 추가 리마인드 알림.(지난번 구매한 제품 재구매 권유 등)
  • 로열티 프로그램 멤버십 방식 도입 : 유기농 제품 구매 고객에게 ‘유기농 멤버십 도입(정기적 유기농제품 구입시 리워드제공), Instacart 내 ‘유기농 구매자 커뮤니티’ 운영, 아마존 처럼 구매자에게 추가 혜택제공, 특정 제품 정기 구매시 할인스타벅스 처럼 구매할수록 포인트적립되고 특별 할인 해택등 레벨업기능 추가(구매습화)

  • 메모리문제
    • Pandas의 read_csv() 함수에서 chunksize 옵션을 사용하면, 파일 전체를 한 번에 메모리에 올리지 않고 일정 행 단위로 읽어 처리할 수 있습니다.
    • 이를 통해 데이터를 부분적으로 로드하여 처리하고, 필요한 경우 청크별로 연산 후 결과를 집계할 수 있습니다.
    python
    복사
    import pandas as pd
    
    chunksize = 500000  # 예: 50만 행씩 읽기
    result_list = []
    
    for chunk in pd.read_csv("customer_segmentation_total_filtered.csv", chunksize=chunksize):
        # 예: 간단한 요약 통계 계산 후 결과 저장
        summary = chunk.describe()
        result_list.append(summary)
    
    # 이후 result_list를 활용하여 최종 분석 수행
    
    

    2. Dask, Polars, Vaex 등 대용량 데이터 처리 라이브러리 활용
    • Dask: Pandas와 유사한 인터페이스를 제공하며, 데이터프레임을 여러 청크로 나누어 병렬 처리할 수 있습니다.
    • python
      복사
      import dask.dataframe as dd

      ddf = dd.read_csv("customer_segmentation_total_filtered.csv")
      # 예: 일부 연산 수행 (예: 그룹별 평균 계산)
      result = ddf.groupby("user_id").agg({"total_orders": "mean"}).compute()

    • Polars: Rust 기반의 라이브러리로, 메모리 사용량과 속도가 효율적입니다.
    • python
      복사
      import polars as pl

      df = pl.read_csv("customer_segmentation_total_filtered.csv")
      result = df.groupby("user_id").agg(pl.col("total_orders").mean())

    • Vaex: 메모리에 전부 올리지 않고도 대용량 데이터 처리와 시각화를 할 수 있습니다.

    3. 효율적인 파일 포맷으로 변환 (Parquet, HDF5)
    • CSV는 텍스트 형식이기 때문에 파싱 비용이 크고 메모리 사용량도 많습니다.
    • ParquetHDF5와 같이 컬럼 기반의 이진 포맷으로 변환하면, 필요한 컬럼만 읽어오는 등 효율적인 I/O 처리가 가능합니다.
    • python
      복사
      import pandas as pd

      # CSV를 Parquet 파일로 변환
      df = pd.read_csv("customer_segmentation_total_filtered.csv")
      df.to_parquet("customer_segmentation_total_filtered.parquet", index=False)

      # 이후 Parquet 파일을 읽어 분석
      df_parquet = pd.read_parquet("customer_segmentation_total_filtered.parquet")


    4. 데이터베이스로의 전환
    • SQLite 또는 PostgreSQL 같은 데이터베이스에 CSV 데이터를 로드하여, SQL 쿼리를 통해 필요한 데이터만 추출한 후 분석할 수도 있습니다.
    • 데이터베이스는 인덱싱이나 쿼리를 통한 부분 데이터 접근에 효율적입니다.

    결론
    • 청크 단위 처리: Pandas에서 chunksize 옵션을 사용하여 메모리 부담 없이 분석.
    • 대용량 데이터 처리 라이브러리: Dask, Polars, Vaex 등을 활용하여 분산/효율적 처리.
    • 효율적인 파일 포맷: Parquet, HDF5로 변환하여 I/O 성능 개선.
    • 데이터베이스 활용: SQL 기반 쿼리를 통해 필요한 부분만 로드.
    이러한 방법들을 상황에 맞게 활용하면 2.3GB의 CSV 파일도 메모리 문제 없이 효율적으로 분석할 수 있습니다.

분석방법1

1. RFM 분석 (Recency, Frequency, Monetary) 적용

  • 목적: 30일 주기로 구매하는 고객이 특정 패턴을 가지는지 확인
  • 방법:
    1. Recency: 마지막 구매 후 경과 일 수 확인
    2. Frequency: 한 달 동안의 구매 횟수 분석
    3. Monetary: 한 번의 구매당 평균 소비 금액 분석
  • 결과 활용:
    • 30일 단위로 반복적으로 구매하는 고객군을 특정할 수 있음
    • VIP 고객과 정기 구매 고객을 구분하여 맞춤 마케팅 전략 수립 가능

2. 고객 세그먼트 분석 (K-means 클러스터링 활용)

  • 목적: 30일 구매 주기를 가진 고객군을 자동으로 분류
  • 방법:
    1. days_since_prior_order, order_count, total_spent 등 주요 변수 사용
    2. K-means를 사용하여 고객을 몇 개의 그룹으로 나눔
    3. 30일 패턴을 가진 고객이 특정 클러스터로 묶이는지 확인
  • 결과 활용:
    • 월간 구매 패턴을 가진 고객을 식별하여 맞춤 프로모션 제공
    • 다른 주기로 구매하는 고객군과 비교하여 차이 분석

3. 구매 주기별 생존 분석 (Survival Analysis)

  • 목적: 고객이 다음 구매를 하기까지의 생존 시간(구매 주기)을 분석
  • 방법:
    1. Kaplan-Meier 생존 분석 적용
    2. 30일 단위 구매 고객의 생존 곡선을 비교
  • 결과 활용:
    • 30일 이후에 재구매하는 고객 비율이 얼마나 되는지 확인
    • 고객 리텐션을 위한 타겟 마케팅 전략 수립

4. 타임 시리즈 분석 (시계열 분석)

  • 목적: 30일 주기의 패턴이 반복적으로 나타나는지 확인
  • 방법:
    1. ARIMA 또는 Prophet 모델을 사용하여 트렌드 및 주기성 분석
    2. 계절성을 확인하여 특정 월, 특정 날짜에 반복적인 구매 패턴이 존재하는지 분석
  • 결과 활용:
    • 월말이나 월초에 정기적으로 구매하는 고객군을 찾아 마케팅 적용
    • 프로모션 타이밍 최적화

5. 정기구독 고객 여부 분석

  • 목적: 30일 주기로 구매하는 고객이 실제 정기구독형 소비자인지 확인
  • 방법:
    1. 고객별 주문 패턴을 분석하여 매월 동일한 날짜에 주문하는 고객 식별
    2. Auto Replenishment (자동 재구매) 모델 여부 검토
  • 결과 활용:
    • 정기구매 유도 마케팅 진행 (예: 정기구독 할인 제공)
    • 특정 제품군(예: 생필품)의 정기구매 수요 분석

6. 제품별 구매 패턴 분석

  • 목적: 30일 단위 주문이 특정 제품군에서 집중되는지 확인
  • 방법:
    1. 30일 주기로 반복 구매되는 제품 목록 추출
    2. 제품 카테고리별 주기성 확인 (예: 생필품, 식료품 등)
  • 결과 활용:
    • 특정 제품군을 중심으로 월간 프로모션 기획
    • 정기구매 유도를 위한 제품 번들링 추천 시스템 개발