데이터 마이닝 개념과 기법 4/e
- 저자
- Jiawei Han, Pei Jian, Hanghang Tong
- 출판
- 에이콘출판
- 출판일
- 2025.01.31
1. AARRR (Acquisition, Activation, Retention, Revenue, Referral)
AARRR은 데이터 분석을 통해 사용자 행동을 추적하고 개선하는 데 초점이 맞춰져 있습니다.
이에 적합한 목차는 다음과 같습니다:
• 6장 분류: 기본 개념과 기법
• 6.1 분류의 기본 개념
• 6.2 의사결정 트리
• 6.3 베이즈 분류
• 6.4 KNN 분류기
• 7장 분류의 고급 기법
• 7.3 서포트 벡터 머신
• 7.5 약한 지도 학습 (예: 앙상블 기법)
• 12장 데이터 마이닝 트렌드 및 최신 연구 분야
• 12.1 다양한 데이터 마이닝 (사용자 행동 분석 포함)
2. 빅데이터분석기사
빅데이터분석기사 시험은 데이터 처리, 분석, 시각화 및 데이터 모델링에 초점을 둡니다. 이에 적합한 목차는 다음과 같습니다:
• 2장 데이터, 측정, 전처리
• 2.2 데이터 분석을 위한 통계적 주요 개념
• 2.3 데이터의 비정상성 탐지 및 처리
• 3장 데이터 웨어하우스와 OLAP
• 3.1 데이터 웨어하우스 개념
• 3.4 OLAP의 주요 방법론
• 4장 패턴 마이닝의 개념과 기법
• 연관 규칙 및 FP-Growth 알고리즘
• 11장 이상치 감지
• 이상치 탐지 기법 (11.3~11.5)
3. Snowflake + Streamlit 해커톤
Snowflake와 Streamlit은 클라우드 기반 데이터 처리 및 시각화 도구로 활용됩니다. 이에 적합한 목차는 다음과 같습니다:
• 3장 데이터 웨어하우스와 OLAP
• Snowflake를 활용한 데이터 웨어하우스 구성 이해
• 8장 클러스터링의 기본 개념과 주요 기법
• K-means 및 계층적 클러스터링
• 10장 딥러닝과 CNN, RNN, GNN 모델
• Streamlit을 활용한 모델 시각화와 결과 해석
위 목차를 통해 AARRR 분석에서는 사용자 행동 예측 및 개선에 필요한 분류 기법을 익히고, 빅데이터분석기사 준비에는 통계적 분석 및 이상치 탐지를 학습하며, Snowflake + Streamlit 해커톤에서는 클라우드 기반 데이터 처리와 딥러닝 모델 시각화를 효과적으로 준비할 수 있습니다.