데이터 분석가:Applied Data Analytics
kaggle Instacart Market Basket Analysis 프로젝트
데이터분석
2025. 3. 10. 16:51
320x100
728x90
3일 일정 및 역할 분배
4명이서 진행하는 경우, EDA는 각자 개별적으로 진행한 후, 3일 동안 가설 설정, 예측 모델링, 분석, 보고서 작성 및 발표 준비를 진행하는 최적의 역할 분배안을 정리
1. 역할 분배 (4인 기준)
역할 | 담당자 | 주요 업무 |
A: 데이터 리더 | 팀원 1 | 데이터 전처리, 피처 엔지니어링 |
B: 모델링 담당 | 팀원 2 | 머신러닝 모델 구축 및 성능 평가 |
C: 인사이트 분석 담당 | 팀원 3 | 예측 결과 분석 및 비즈니스 인사이트 도출 |
D: 보고서 및 발표 담당 | 팀원 4 | 최종 보고서 및 발표 자료 제작 |
2. 3일 일정 (하루 7시간 기준)
Day 1: 가설 설정 및 데이터 전처리
- (공통) 개별 EDA 결과 공유 (1시간)
- (A: 데이터 리더) 데이터 전처리 및 피처 엔지니어링 (4시간)
- (B: 모델링 담당) 예측 모델 기초 설계 및 베이스라인 모델 구축 (4시간)
- (C: 인사이트 담당) 데이터에서 도출할 수 있는 가설 및 분석 방향 정리 (3시간)
- (D: 보고서 담당) 프로젝트 개요 및 데이터 설명 정리 (3시간)
- (팀 전체) 주요 가설 및 모델링 목표 논의 (2시간)
Day 2: 예측 모델링 및 분석
- (A: 데이터 리더 & B: 모델링 담당) 데이터셋 정제 및 머신러닝 모델 최적화 (4시간)
- (C: 인사이트 담당) 모델 결과 해석 및 비즈니스 적용 가능성 검토 (4시간)
- (D: 보고서 담당) 보고서 및 발표 PPT 구성 기획 (3시간)
- (팀 전체) 예측 결과 확인 및 성능 개선 논의 (3시간)
Day 3: 보고서 작성 및 발표 준비
- (D: 보고서 담당) PPT 및 보고서 작성 (5시간)
- (A: 데이터 리더 & C: 인사이트 담당) 주요 시각화 자료 정리 및 발표용 그래프 제작 (3시간)
- (B: 모델링 담당) 모델 성능 요약 및 분석 내용 추가 (3시간)
- (팀 전체) 최종 리뷰 및 발표 연습 (2시간)
3. PPT 발표 및 보고서 구성
30분 발표 기준으로 15~20페이지 분량이 최적입니다.
1) PPT 발표 자료 (15~20페이지)
페이지 | 내용 | 담당자 |
1 | 제목 페이지 (프로젝트명, 팀원 소개) | D |
2 | 프로젝트 개요 (목표, 데이터셋 소개) | D |
3~4 | 데이터 EDA (주요 패턴 시각화) | A |
5 | 주요 가설 설정 | C |
6~8 | 데이터 전처리 및 피처 엔지니어링 (추가한 변수 설명) | A |
9~10 | 모델링 과정 (알고리즘, 성능 비교) | B |
11 | 최종 모델 성능 평가 (Precision, Recall 등) | B |
12~13 | 예측 결과 분석 및 시사점 | C |
14~15 | 비즈니스 인사이트 및 제안 | C |
16 | 결론 및 향후 연구 방향 | D |
17~18 | Q&A | 전체 |
2) 최종 보고서 (5~7페이지)
페이지 | 내용 | 담당자 |
1 | 프로젝트 개요 (목적, 데이터 설명) | D |
2 | 데이터 탐색 (EDA 결과 요약) | A |
3 | 가설 설정 및 예측 모델 개요 | C |
4 | 모델링 과정 및 결과 분석 | B |
5 | 인사이트 및 비즈니스 활용 방안 | C |
6 | 결론 및 한계점 | D |
4. 최적의 발표 방식
- 1분 : 프로젝트 개요
- 3분 : 데이터 EDA 및 패턴 분석
- 2분 : 가설 및 분석 목표 설명
- 4분 : 데이터 전처리 및 피처 엔지니어링 과정
- 4분 : 머신러닝 모델 구축 및 성능 비교
- 4분 : 결과 분석 및 주요 인사이트
- 3분 : 비즈니스 적용 방안
- 2분 : 결론 및 Q&A