데이터 분석가:Applied Data Analytics

kaggle Instacart Market Basket Analysis 프로젝트

데이터분석 2025. 3. 10. 16:51
320x100
728x90

3일 일정 및 역할 분배

4명이서 진행하는 경우, EDA는 각자 개별적으로 진행한 후, 3일 동안 가설 설정, 예측 모델링, 분석, 보고서 작성 및 발표 준비를 진행하는 최적의 역할 분배안을 정리

1. 역할 분배 (4인 기준)

역할 담당자 주요 업무
A: 데이터 리더 팀원 1 데이터 전처리, 피처 엔지니어링
B: 모델링 담당 팀원 2 머신러닝 모델 구축 및 성능 평가
C: 인사이트 분석 담당 팀원 3 예측 결과 분석 및 비즈니스 인사이트 도출
D: 보고서 및 발표 담당 팀원 4 최종 보고서 및 발표 자료 제작

 


2. 3일 일정 (하루 7시간 기준)

Day 1: 가설 설정 및 데이터 전처리

  • (공통) 개별 EDA 결과 공유 (1시간)
  • (A: 데이터 리더) 데이터 전처리 및 피처 엔지니어링 (4시간)
  • (B: 모델링 담당) 예측 모델 기초 설계 및 베이스라인 모델 구축 (4시간)
  • (C: 인사이트 담당) 데이터에서 도출할 수 있는 가설 및 분석 방향 정리 (3시간)
  • (D: 보고서 담당) 프로젝트 개요 및 데이터 설명 정리 (3시간)
  • (팀 전체) 주요 가설 및 모델링 목표 논의 (2시간)

Day 2: 예측 모델링 및 분석

  • (A: 데이터 리더 & B: 모델링 담당) 데이터셋 정제 및 머신러닝 모델 최적화 (4시간)
  • (C: 인사이트 담당) 모델 결과 해석 및 비즈니스 적용 가능성 검토 (4시간)
  • (D: 보고서 담당) 보고서 및 발표 PPT 구성 기획 (3시간)
  • (팀 전체) 예측 결과 확인 및 성능 개선 논의 (3시간)

Day 3: 보고서 작성 및 발표 준비

  • (D: 보고서 담당) PPT 및 보고서 작성 (5시간)
  • (A: 데이터 리더 & C: 인사이트 담당) 주요 시각화 자료 정리 및 발표용 그래프 제작 (3시간)
  • (B: 모델링 담당) 모델 성능 요약 및 분석 내용 추가 (3시간)
  • (팀 전체) 최종 리뷰 및 발표 연습 (2시간)

3. PPT 발표 및 보고서 구성

30분 발표 기준으로 15~20페이지 분량이 최적입니다.

1) PPT 발표 자료 (15~20페이지)

페이지 내용 담당자
1 제목 페이지 (프로젝트명, 팀원 소개) D
2 프로젝트 개요 (목표, 데이터셋 소개) D
3~4 데이터 EDA (주요 패턴 시각화) A
5 주요 가설 설정 C
6~8 데이터 전처리 및 피처 엔지니어링 (추가한 변수 설명) A
9~10 모델링 과정 (알고리즘, 성능 비교) B
11 최종 모델 성능 평가 (Precision, Recall 등) B
12~13 예측 결과 분석 및 시사점 C
14~15 비즈니스 인사이트 및 제안 C
16 결론 및 향후 연구 방향 D
17~18 Q&A 전체

 


2) 최종 보고서 (5~7페이지)

페이지 내용 담당자
1 프로젝트 개요 (목적, 데이터 설명) D
2 데이터 탐색 (EDA 결과 요약) A
3 가설 설정 및 예측 모델 개요 C
4 모델링 과정 및 결과 분석 B
5 인사이트 및 비즈니스 활용 방안 C
6 결론 및 한계점 D

 


4. 최적의 발표 방식

  • 1분 : 프로젝트 개요
  • 3분 : 데이터 EDA 및 패턴 분석
  • 2분 : 가설 및 분석 목표 설명
  • 4분 : 데이터 전처리 및 피처 엔지니어링 과정
  • 4분 : 머신러닝 모델 구축 및 성능 비교
  • 4분 : 결과 분석 및 주요 인사이트
  • 3분 : 비즈니스 적용 방안
  • 2분 : 결론 및 Q&A