데이터 분석가:Applied Data Analytics/관련 도서

데이터 마이닝 개념과 기법 4/e

데이터분석 2025. 4. 8. 21:25
320x100
728x90

 
데이터 마이닝 개념과 기법
종합적인 학문 및 기술 분야로서 데이터 마이닝의 특징을 소개하며, 정보 기술의 진화와 데이터 마이닝의 필요성, 그리고 응용 분야의 중요성에 대해 설명한다. 먼저, 데이터 마이닝을 위한 다양한 유형의 데이터 타입에 대해 알아보고, 데이터 마이닝 작업의 주요 유형과 마이닝 지식의 종류, 사용되는 기술의 종류, 그리고 분석 환경에 따라 활용되는 다양한 기법에 대해 설명한다.
저자
Jiawei Han, Pei Jian, Hanghang Tong
출판
에이콘출판
출판일
2025.01.31

1. AARRR (Acquisition, Activation, Retention, Revenue, Referral)
AARRR은 데이터 분석을 통해 사용자 행동을 추적하고 개선하는 데 초점이 맞춰져 있습니다.
이에 적합한 목차는 다음과 같습니다:
• 6장 분류: 기본 개념과 기법
• 6.1 분류의 기본 개념
• 6.2 의사결정 트리
• 6.3 베이즈 분류
• 6.4 KNN 분류기
• 7장 분류의 고급 기법
• 7.3 서포트 벡터 머신
• 7.5 약한 지도 학습 (예: 앙상블 기법)
• 12장 데이터 마이닝 트렌드 및 최신 연구 분야
• 12.1 다양한 데이터 마이닝 (사용자 행동 분석 포함)

2. 빅데이터분석기사
빅데이터분석기사 시험은 데이터 처리, 분석, 시각화 및 데이터 모델링에 초점을 둡니다. 이에 적합한 목차는 다음과 같습니다:
• 2장 데이터, 측정, 전처리
• 2.2 데이터 분석을 위한 통계적 주요 개념
• 2.3 데이터의 비정상성 탐지 및 처리
• 3장 데이터 웨어하우스와 OLAP
• 3.1 데이터 웨어하우스 개념
• 3.4 OLAP의 주요 방법론
• 4장 패턴 마이닝의 개념과 기법
• 연관 규칙 및 FP-Growth 알고리즘
• 11장 이상치 감지
• 이상치 탐지 기법 (11.3~11.5)

3. Snowflake + Streamlit 해커톤
Snowflake와 Streamlit은 클라우드 기반 데이터 처리 및 시각화 도구로 활용됩니다. 이에 적합한 목차는 다음과 같습니다:
• 3장 데이터 웨어하우스와 OLAP
• Snowflake를 활용한 데이터 웨어하우스 구성 이해
• 8장 클러스터링의 기본 개념과 주요 기법
• K-means 및 계층적 클러스터링
• 10장 딥러닝과 CNN, RNN, GNN 모델
• Streamlit을 활용한 모델 시각화와 결과 해석

위 목차를 통해 AARRR 분석에서는 사용자 행동 예측 및 개선에 필요한 분류 기법을 익히고, 빅데이터분석기사 준비에는 통계적 분석 및 이상치 탐지를 학습하며, Snowflake + Streamlit 해커톤에서는 클라우드 기반 데이터 처리와 딥러닝 모델 시각화를 효과적으로 준비할 수 있습니다.