Instacart Market Basket Analysis

데이터 분석가:Applied Data Analytics

Instacart Market Basket Analysis

데이터분석 2025. 3. 13. 21:29

고객 세그멘테이션이 필요한 이유

고객 맞춤형 마케팅
- 모든 고객에게 동일한 마케팅을 적용하는 것보다 각 고객 그룹의 특성에 맞춘 전략을 수립하는 것이 효과적
- 예: VIP 고객에게 더 많은 혜택 제공, 신규 고객에게 할인 쿠폰 제공
고객 행동 패턴 분석
- 고객이 언제, 무엇을, 얼마나 자주 구매하는지에 따라 그룹을 나누어 더 깊은 인사이트를 얻을 수 있음
비용 절감 & 마케팅 효율성 증가
- 마케팅 비용을 모든 고객에게 동일하게 투입하는 것보다 타겟팅된 그룹에 집중 투자하면 비용 대비 효과가 높아짐
수익 극대화
- 특정 그룹(예: 높은 지출을 하는 고객)에게 맞춘 전략을 제공하여 매출 증대

1. 해결하려는 목적?
- 재구매 패턴 파악: 고객이 특정 제품을 얼마나 자주 재구매하는지 분석하여 마케팅 전략을 최적화
- 연관 상품 추천: 고객이 자주 함께 구매하는 상품을 찾아 번들 추천 및 크로스셀링 전략 적용
- 수요 예측 및 재고 관리 최적화: 특정 상품이 언제, 얼마나 많이 판매될지 예측하여 적절한 재고 유지
- 고객 맞춤형 프로모션: 특정 고객이 선호하는 제품에 대한 할인 쿠폰 제공
2. 이 분석의 목적은?
- 구매 패턴 분석: 고객이 어떤 상품을 함께 구매하는지, 어떤 상품을 반복적으로 구매하는지 탐색
- 상품 추천 시스템 구축: 협업 필터링, 연관 규칙 분석(Association Rule) 등을 활용한 추천 모델 개발
- 데이터 기반 마케팅 전략 수립: 특정 고객 그룹에 대한 맞춤형 프로모션 및 할인 전략 설계
- 효율적인 재고 관리: 판매 데이터 기반으로 재고를 최적화하여 비용 절감
3. 이것을 통해서 무엇을 배울 것인가?
- 데이터 전처리 (Data Cleaning & Feature Engineering)
  - 결측치 처리, 데이터 병합, 새로운 피처 생성 등의 전처리 기법 학습
  - 고객별 구매 패턴을 반영한 피처 엔지니어링
- 장바구니 분석 (Market Basket Analysis, MBA)
  - 연관 규칙 분석(Apriori, FP-Growth) 및 제품 간 관계 분석
  - Support, Confidence, Lift 등의 지표를 활용한 상품 추천
- 추천 시스템 구축 (Recommendation System)
  - 협업 필터링(Collaborative Filtering), 콘텐츠 기반 필터링(Content-Based Filtering) 학습
  - 베스트셀러, 트렌드 기반 추천 및 개인 맞춤 추천 시스템 설계
- 시각화 및 인사이트 도출
  - 고객 구매 트렌드를 파악하고 데이터 기반 의사결정 도출
  - Looker, Tableau, Matplotlib, Seaborn 등의 도구를 활용한 시각화
- 머신러닝/딥러닝 모델 적용
  - 고객 세분화(Clustering), 분류(Classification), 순위 예측(Ranking) 모델 실습
  - XGBoost, Random Forest, 딥러닝 모델을 활용한 제품 추천 최적화

준비 (질문에 대한 대답을 위해 필요한 데이터는?)

1. 해결하려는 목적을 위한 데이터

(장바구니 최적화 및 개인화 추천 개선을 위해 필요한 데이터)

1) 고객의 재구매 패턴 파악

user_id : 고객 식별자
order_id : 주문 식별자
order_number : 고객이 몇 번째 주문을 했는지 (재구매 여부 파악)
days_since_prior_order : 이전 주문과의 간격 (주기적 구매 패턴 분석)
product_id : 구매한 제품 식별자
reordered : 이전에 구매한 제품을 재구매했는지 여부

2) 연관 상품 추천을 위한 데이터

order_id : 같은 주문 내에서 함께 구매된 제품 그룹 분석
product_id : 특정 제품과 함께 자주 구매되는 다른 제품 찾기
department_id, aisle_id : 제품의 카테고리 정보 (같은 카테고리 내 추천 가능)

3) 수요 예측 및 재고 관리 최적화

order_dow : 요일별 주문 패턴 분석 (특정 요일에 많이 팔리는 제품 파악)
order_hour_of_day : 시간대별 주문량 변화 분석 (피크 타임 예측)
days_since_prior_order : 고객이 특정 제품을 얼마나 자주 구매하는지 확인
product_id 및 order_id : 특정 제품의 주문 빈도

4) 고객 맞춤형 프로모션

user_id : 특정 고객 그룹을 타겟팅
product_id : 특정 제품에 대한 할인 쿠폰 제공 여부
order_number : 특정 고객이 몇 번째 주문을 하는지에 따라 혜택 제공 가능
reordered : 재구매 가능성이 높은 고객에게 타겟 광고 제공

2. 분석의 목적을 위한 데이터

(소비자 행동을 이해하고, 비즈니스 성과를 개선하기 위해 필요한 데이터)

1) 구매 패턴 분석

user_id, product_id, order_id : 개별 고객이 어떤 제품을 얼마나 자주 구매하는지 분석
order_number : 특정 제품을 몇 번째 주문에서 다시 구매하는지 확인
order_dow, order_hour_of_day : 구매 트렌드 분석

2) 상품 추천 시스템 구축

order_id, product_id : 특정 제품과 함께 자주 구매된 제품을 찾기 위한 데이터
department_id, aisle_id : 비슷한 카테고리 내에서 추천할 수 있도록 활용
reordered : 과거에 구매했던 제품을 다시 구매하는 고객을 대상으로 추천

3) 데이터 기반 마케팅 전략 수립

user_id : 특정 고객군을 타겟팅
product_id : 인기 제품을 파악하여 광고 및 프로모션 적용
order_dow, order_hour_of_day : 특정 시간대/요일별 할인 전략 수립
days_since_prior_order : 장기간 구매하지 않은 고객에게 리마인더 제공

4) 효율적인 재고 관리

product_id : 수요가 높은 제품을 우선적으로 관리
order_dow, order_hour_of_day : 시간대별 주문량 변화를 분석하여 재고 최적화
days_since_prior_order : 특정 제품의 재구매 주기 파악

3. 학습을 위한 데이터

(데이터 분석, 머신러닝, 추천 시스템 개발을 위해 필요한 데이터)

1) 데이터 전처리 및 특징 엔지니어링

user_id, product_id, order_id : 고객, 제품, 주문 간의 관계 분석
order_number, days_since_prior_order : 구매 주기 파악 및 피처 생성
department_id, aisle_id : 카테고리 기반 추천을 위한 피처 추가

2) 장바구니 분석 (MBA - Market Basket Analysis)

order_id, product_id : 주문별로 함께 구매된 제품 리스트
department_id, aisle_id : 동일한 카테고리 제품이 많이 구매되는지 확인
reordered : 특정 제품의 재구매율이 높은지 확인

3) 추천 시스템 구축

협업 필터링을 위한 데이터
- user_id, product_id, order_id : 고객별 구매 이력
- reordered : 재구매 여부 분석
콘텐츠 기반 필터링을 위한 데이터
- product_id, department_id, aisle_id : 제품 속성을 기반으로 유사 제품 추천

4) 시각화 및 인사이트 도출

order_dow, order_hour_of_day : 주문이 몰리는 시간 및 요일 분석
product_id : 가장 많이 판매된 제품 시각화
department_id, aisle_id : 인기 카테고리 분석

5) 머신러닝/딥러닝 모델 적용

분류(Classification) 모델을 위한 데이터
- user_id, product_id, reordered : 특정 고객이 특정 제품을 재구매할지 예측
- order_dow, order_hour_of_day, days_since_prior_order : 시간, 요일, 재구매 주기를 활용한 모델 학습
클러스터링(Clustering) 모델을 위한 데이터
- user_id, order_number, days_since_prior_order, reordered : 고객을 그룹화하여 유사한 소비 패턴을 가진 그룹 생성

정리: 최적의 분석을 위해 필요한 주요 데이터 항목

데이터 항목	설명	활용 목적
user_id	고객 식별자	개인화 추천, 고객 세분화
order_id	주문 식별자	장바구니 분석, 제품 연관성 파악
product_id	제품 식별자	제품 추천, 인기 상품 분석
reordered	재구매 여부	재구매 패턴 분석, 추천 시스템
order_number	주문 횟수	고객별 구매 경향 분석
days_since_prior_order	이전 주문과의 시간 간격	재구매 주기 분석, 마케팅 전략
order_dow	주문한 요일	특정 요일의 판매량 분석
order_hour_of_day	주문한 시간	특정 시간대의 판매량 분석
department_id	제품 대분류	카테고리별 판매 경향 분석
aisle_id	제품 소분류	세부 카테고리별 인기 제품 분석

이 데이터들을 활용하면 고객 행동을 이해하고, 추천 시스템을 최적화하며, 비즈니스 성과를 극대화하는 인사이트를 도출.

우선순위 정하기(모든걸 다할순없다 3일동안할수 있는최적은?)

우선순위 정하기(모든걸 다할순없다4명이3일동안할수 있는최적은?)
- 분석 결과가 실제 기업의 의사결정에 영향을 줄 수 있는가?
- 마케팅, 추천 시스템, 재고 관리, 프로모션 등 비즈니스 활용 가능성이 높은가?
- 단순한 데이터 통계가 아니라, 수익 증대, 고객 만족도 향상, 운영 최적화 등에 기여할 수 있는가?
2. 실행 가능성 (Feasibility)
- 3일 내에 분석이 가능한가? (데이터 전처리 부담이 적고, 빠르게 인사이트 도출 가능)
- 복잡한 모델링 없이도 의미 있는 결과를 얻을 수 있는가?
- 데이터의 가용성이 높고, 빠르게 분석할 수 있는 컬럼을 중심으로 할 것
3. 인사이트의 시각적 전달력 (Storytelling & Visualization)
- 보고서를 보는 사람들이 쉽게 이해할 수 있는가?
- 데이터를 직관적으로 시각화할 수 있는가?
- "숫자"만 나열하는 것이 아니라, 명확한 패턴과 트렌드를 도출할 수 있는가?
- 보고서가 흥미롭고, 기억에 남을 수 있는가?

우선순위	분석 주제	이유
1	고객 재구매 및 행동 패턴 분석	- 재구매율이 높은 제품을 찾으면 마케팅에 직접 활용 가능 - 고객의 쇼핑 시간 및 요일 패턴 분석 → 프로모션 최적화 - 전처리가 간단하고, 빠르게 분석할 수 있음
2	장바구니 연관 분석 및 추천 모델	- 연관 제품을 찾으면 번들 판매, 크로스셀링 전략 활용 가능 - 유사한 제품을 추천할 수 있어 개인화 추천 시스템 구축 가능 - 데이터가 명확하게 존재 (order_id, product_id) 하므로 분석 용이
3	고객 세분화 (클러스터링 분석)	- 고객을 그룹화하면 맞춤형 마케팅 가능 - "자주 쇼핑하는 고객 vs 가끔 쇼핑하는 고객"을 나누어 차별화된 전략 적용 가능 - 단, 클러스터링 모델 해석이 필요해 분석 난이도는 다소 높음

첫째 날: 고객 재구매 및 행동 패턴 분석 (가장 빠르게 인사이트 도출 가능)
둘째 날: 장바구니 연관 분석 (Market Basket Analysis) + 추천 시스템 (가시적인 결과가 나오는 강력한 분석)
셋째 날: 고객 세분화 분석 (클러스터링) + 보고서 정리 및 발표 자료 준비

추가하면 좋은 데이터

객 세분화 & 매출 기여도 분석을 위한 데이터 추가

컬럼명	설명	활용 목적
total_products_in_order	해당 주문에서 구매한 총 제품 수	고객의 장바구니 크기 분석 (대량 구매 vs 소량 구매 고객 분류)
average_spent_per_order	고객이 한 번 주문할 때 평균 지출 금액 (추가 데이터 필요)	고객 가치를 측정하여 VIP 고객 식별
preferred_aisle	고객이 가장 많이 구매하는 aisle_id (가장 선호하는 제품군)	고객 맞춤형 프로모션 적용
preferred_hour	고객이 주로 쇼핑하는 시간대	시간대별 광고 최적화, 고객 타겟팅
customer_lifetime_value (CLV)	고객 생애 가치 (주문 빈도, 평균 구매액 기반)	충성 고객과 이탈 고객 분류, 맞춤형 혜택 제공

이 데이터들을 추가하면 다음이 가능해짐

고객 세분화 & 맞춤형 마케팅 전략 (VIP 고객, 저빈도 고객 구분)
매출 기여도 분석 (고객별 평균 지출 금액, 장바구니 크기 분석)
시간대별/요일별 맞춤 광고 최적화 (고객이 선호하는 쇼핑 시간 기반 광고 설정)

1. 역할 분배 (4인 기준)

역할 담당자 주요 업무

A: 데이터 리더	팀원 1	데이터 전처리, 피처 엔지니어링
B: 모델링 담당	팀원 2	머신러닝 모델 구축 및 성능 평가
C: 인사이트 분석 담당	팀원 3	예측 결과 분석 및 비즈니스 인사이트 도출
D: 보고서 및 발표 담당	팀원 4	최종 보고서 및 발표 자료 제작

2. 3일 일정 (하루 7시간 기준)

Day 1: 가설 설정 및 데이터 전처리

(공통) 개별 EDA 결과 공유 (1시간)
(A: 데이터 리더) 데이터 전처리 및 피처 엔지니어링 (4시간)
(B: 모델링 담당) 예측 모델 기초 설계 및 베이스라인 모델 구축 (4시간)
(C: 인사이트 담당) 데이터에서 도출할 수 있는 가설 및 분석 방향 정리 (3시간)
(D: 보고서 담당) 프로젝트 개요 및 데이터 설명 정리 (3시간)
(팀 전체) 주요 가설 및 모델링 목표 논의 (2시간)

Day 2: 예측 모델링 및 분석

(A: 데이터 리더 & B: 모델링 담당) 데이터셋 정제 및 머신러닝 모델 최적화 (4시간)
(C: 인사이트 담당) 모델 결과 해석 및 비즈니스 적용 가능성 검토 (4시간)
(D: 보고서 담당) 보고서 및 발표 PPT 구성 기획 (3시간)
(팀 전체) 예측 결과 확인 및 성능 개선 논의 (3시간)

Day 3: 보고서 작성 및 발표 준비

(D: 보고서 담당) PPT 및 보고서 작성 (5시간)
(A: 데이터 리더 & C: 인사이트 담당) 주요 시각화 자료 정리 및 발표용 그래프 제작 (3시간)
(B: 모델링 담당) 모델 성능 요약 및 분석 내용 추가 (3시간)
(팀 전체) 최종 리뷰 및 발표 연습 (2시간)

3. PPT 발표 및 보고서 구성

30분 발표 기준으로 15~20페이지 분량이 최적입니다.

1) PPT 발표 자료 (15~20페이지)

페이지	내용	담당자
1	제목 페이지 (프로젝트명, 팀원 소개)	D
2	프로젝트 개요 (목표, 데이터셋 소개)	D
3~4	데이터 EDA (주요 패턴 시각화)	A
5	주요 가설 설정	C
6~8	데이터 전처리 및 피처 엔지니어링 (추가한 변수 설명)	A
9~10	모델링 과정 (알고리즘, 성능 비교)	B
11	최종 모델 성능 평가 (Precision, Recall 등)	B
12~13	예측 결과 분석 및 시사점	C
14~15	비즈니스 인사이트 및 제안	C
16	결론 및 향후 연구 방향	D
17~18	Q&A	전체

2) 최종 보고서 (5~7페이지)

페이지	내용	담당자
1	프로젝트 개요 (목적, 데이터 설명)	D
2	데이터 탐색 (EDA 결과 요약)	A
3	가설 설정 및 예측 모델 개요	C
4	모델링 과정 및 결과 분석	B
5	인사이트 및 비즈니스 활용 방안	C
6	결론 및 한계점	D

4. 최적의 발표 방식

1분 : 프로젝트 개요
3분 : 데이터 EDA 및 패턴 분석
2분 : 가설 및 분석 목표 설명
4분 : 데이터 전처리 및 피처 엔지니어링 과정
4분 : 머신러닝 모델 구축 및 성능 비교
4분 : 결과 분석 및 주요 인사이트
3분 : 비즈니스 적용 방안
2분 : 결론 및 Q&A

마케팅 전략 (30일 이상 장기 미구매 고객 세분화 및 맞춤형 마케팅 적용)

30일 이상 주문 간격이 있는 고객을 세분화하여 이탈 위험 고객을 식별하고 맞춤형 프로모션 및 재구매 유도 전략을 적용하여 고객 유지율을 향상.

스타트업 성장 사례 벤치마팅 : 스타트업 성장 사례 비교 분석

유기농 제품 중심 정기구독 모델 테스트
첫 구매 후 30일 이내 ‘재구매 프로모션’ 제공(할인 or 포인트).
맞춤형 리마인드 메시지 & 추천 상품(듀링고 Shame기반 유지전략처럼 고객에서 감성적인 알림 보 감성적으로 자극하기, “마지막구매한 제품이 당신을 그리워 합니다.”
테슬라 전략처럼 친구초대하면 특별보상제공(친구추천시 무료 배송, 10% 할인 쿠폰 제공)

고객 재활성화 캠페인 번들 할인 제안 : 구매 빈도(Frequency)가 낮은 고객에게는 관련 제품 번들을 제안하여 주문 건수를 늘릴 수 있습니다. 30일이상간격 주문자 맞춤형: 첫 재구매 유도(특정유기농 제품 할인, 무료배송쿠폰) + 일정 기간 구매없으면 추가 리마인드 알림.(지난번 구매한 제품 재구매 권유 등)
로열티 프로그램 멤버십 방식 도입 : 유기농 제품 구매 고객에게 ‘유기농 멤버십 도입(정기적 유기농제품 구입시 리워드제공), Instacart 내 ‘유기농 구매자 커뮤니티’ 운영, 아마존 처럼 구매자에게 추가 혜택제공, 특정 제품 정기 구매시 할인 등 스타벅스 처럼 구매할수록 포인트적립되고 특별 할인 해택등 레벨업기능 추가(구매습화)

메모리문제
- Pandas의 read_csv() 함수에서 chunksize 옵션을 사용하면, 파일 전체를 한 번에 메모리에 올리지 않고 일정 행 단위로 읽어 처리할 수 있습니다.
- 이를 통해 데이터를 부분적으로 로드하여 처리하고, 필요한 경우 청크별로 연산 후 결과를 집계할 수 있습니다.
```
python
복사
import pandas as pd

chunksize = 500000  # 예: 50만 행씩 읽기
result_list = []

for chunk in pd.read_csv("customer_segmentation_total_filtered.csv", chunksize=chunksize):
    # 예: 간단한 요약 통계 계산 후 결과 저장
    summary = chunk.describe()
    result_list.append(summary)

# 이후 result_list를 활용하여 최종 분석 수행
```
2. Dask, Polars, Vaex 등 대용량 데이터 처리 라이브러리 활용
- Dask: Pandas와 유사한 인터페이스를 제공하며, 데이터프레임을 여러 청크로 나누어 병렬 처리할 수 있습니다.
- python
  복사
  import dask.dataframe as dd
  
  ddf = dd.read_csv("customer_segmentation_total_filtered.csv")
  # 예: 일부 연산 수행 (예: 그룹별 평균 계산)
  result = ddf.groupby("user_id").agg({"total_orders": "mean"}).compute()
- Polars: Rust 기반의 라이브러리로, 메모리 사용량과 속도가 효율적입니다.
- python
  복사
  import polars as pl
  
  df = pl.read_csv("customer_segmentation_total_filtered.csv")
  result = df.groupby("user_id").agg(pl.col("total_orders").mean())
- Vaex: 메모리에 전부 올리지 않고도 대용량 데이터 처리와 시각화를 할 수 있습니다.
3. 효율적인 파일 포맷으로 변환 (Parquet, HDF5)
- CSV는 텍스트 형식이기 때문에 파싱 비용이 크고 메모리 사용량도 많습니다.
- Parquet나 HDF5와 같이 컬럼 기반의 이진 포맷으로 변환하면, 필요한 컬럼만 읽어오는 등 효율적인 I/O 처리가 가능합니다.
- python
  복사
  import pandas as pd
  
  # CSV를 Parquet 파일로 변환
  df = pd.read_csv("customer_segmentation_total_filtered.csv")
  df.to_parquet("customer_segmentation_total_filtered.parquet", index=False)
  
  # 이후 Parquet 파일을 읽어 분석
  df_parquet = pd.read_parquet("customer_segmentation_total_filtered.parquet")
4. 데이터베이스로의 전환
- SQLite 또는 PostgreSQL 같은 데이터베이스에 CSV 데이터를 로드하여, SQL 쿼리를 통해 필요한 데이터만 추출한 후 분석할 수도 있습니다.
- 데이터베이스는 인덱싱이나 쿼리를 통한 부분 데이터 접근에 효율적입니다.
결론
- 청크 단위 처리: Pandas에서 chunksize 옵션을 사용하여 메모리 부담 없이 분석.
- 대용량 데이터 처리 라이브러리: Dask, Polars, Vaex 등을 활용하여 분산/효율적 처리.
- 효율적인 파일 포맷: Parquet, HDF5로 변환하여 I/O 성능 개선.
- 데이터베이스 활용: SQL 기반 쿼리를 통해 필요한 부분만 로드.
이러한 방법들을 상황에 맞게 활용하면 2.3GB의 CSV 파일도 메모리 문제 없이 효율적으로 분석할 수 있습니다.

분석방법1

1. RFM 분석 (Recency, Frequency, Monetary) 적용

목적: 30일 주기로 구매하는 고객이 특정 패턴을 가지는지 확인
방법:
1. Recency: 마지막 구매 후 경과 일 수 확인
2. Frequency: 한 달 동안의 구매 횟수 분석
3. Monetary: 한 번의 구매당 평균 소비 금액 분석
결과 활용:
- 30일 단위로 반복적으로 구매하는 고객군을 특정할 수 있음
- VIP 고객과 정기 구매 고객을 구분하여 맞춤 마케팅 전략 수립 가능

2. 고객 세그먼트 분석 (K-means 클러스터링 활용)

목적: 30일 구매 주기를 가진 고객군을 자동으로 분류
방법:
1. days_since_prior_order, order_count, total_spent 등 주요 변수 사용
2. K-means를 사용하여 고객을 몇 개의 그룹으로 나눔
3. 30일 패턴을 가진 고객이 특정 클러스터로 묶이는지 확인
결과 활용:
- 월간 구매 패턴을 가진 고객을 식별하여 맞춤 프로모션 제공
- 다른 주기로 구매하는 고객군과 비교하여 차이 분석

3. 구매 주기별 생존 분석 (Survival Analysis)

목적: 고객이 다음 구매를 하기까지의 생존 시간(구매 주기)을 분석
방법:
1. Kaplan-Meier 생존 분석 적용
2. 30일 단위 구매 고객의 생존 곡선을 비교
결과 활용:
- 30일 이후에 재구매하는 고객 비율이 얼마나 되는지 확인
- 고객 리텐션을 위한 타겟 마케팅 전략 수립

4. 타임 시리즈 분석 (시계열 분석)

목적: 30일 주기의 패턴이 반복적으로 나타나는지 확인
방법:
1. ARIMA 또는 Prophet 모델을 사용하여 트렌드 및 주기성 분석
2. 계절성을 확인하여 특정 월, 특정 날짜에 반복적인 구매 패턴이 존재하는지 분석
결과 활용:
- 월말이나 월초에 정기적으로 구매하는 고객군을 찾아 마케팅 적용
- 프로모션 타이밍 최적화

5. 정기구독 고객 여부 분석

목적: 30일 주기로 구매하는 고객이 실제 정기구독형 소비자인지 확인
방법:
1. 고객별 주문 패턴을 분석하여 매월 동일한 날짜에 주문하는 고객 식별
2. Auto Replenishment (자동 재구매) 모델 여부 검토
결과 활용:
- 정기구매 유도 마케팅 진행 (예: 정기구독 할인 제공)
- 특정 제품군(예: 생필품)의 정기구매 수요 분석

6. 제품별 구매 패턴 분석

목적: 30일 단위 주문이 특정 제품군에서 집중되는지 확인
방법:
1. 30일 주기로 반복 구매되는 제품 목록 추출
2. 제품 카테고리별 주기성 확인 (예: 생필품, 식료품 등)
결과 활용:
- 특정 제품군을 중심으로 월간 프로모션 기획
- 정기구매 유도를 위한 제품 번들링 추천 시스템 개발

'데이터 분석가:Applied Data Analytics' 카테고리의 다른 글

Streamlit 설치 순서 및 주의점 (0)	2025.03.16
Streamlit 란? (0)	2025.03.16
kaggle Instacart Market Basket Analysis 프로젝트 (0)	2025.03.10
violinplot (0)	2025.03.10
선형대수학(Linear Algebra) 개요 (0)	2025.03.10

현재글Instacart Market Basket Analysis

데이터분석가 기술블로그

일정분석 전문가의 데이터분석가 기술블로그입니다.

건강, 데이터 시각화, mainquest06, 태블로, 공정관리, Tableau, SQL, 데이터시각화, 베트남, mq06, 일정관리, 운동, 시각화, ADsP, 데이터분석가, 데이터분석, 파이썬, 머신러닝, 빅분기, mainquest,

Today :
Yesterday :

데이터분석가 기술블로그