1. 데이터 분석의 정의와 목적은 무엇인가?
2. 데이터 사이언스의 주요 구성 요소는 무엇인가?
3. 빅데이터의 3V(Volume, Velocity, Variety)에 대해 설명하시오.
4. 정형 데이터와 비정형 데이터의 차이점은 무엇인가?
5. 데이터 마이닝의 주요 기법들을 나열하시오.
6. 회귀분석과 상관분석의 차이점은 무엇인가?
7. 단순 회귀분석과 다중 회귀분석의 차이점은 무엇인가?
8. 결정계수(R²)의 의미는 무엇인가?
9. p-value의 의미와 해석 방법은?
10. 가설검정의 기본 절차를 설명하시오.
11. 모수적 방법과 비모수적 방법의 차이점은 무엇인가?
12. 주성분분석(PCA)의 목적과 활용 사례는?
13. 클러스터링의 개념과 주요 알고리즘을 나열하시오.
14. K-평균(K-Means) 알고리즘의 동작 원리는?
15. 계층적 군집분석의 방법과 특징은 무엇인가?
16. 의사결정나무의 구성 요소와 장단점은?
17. 과적합(overfitting)과 과소적합(underfitting)의 차이점은?
18. 교차검증(cross-validation)의 목적과 방법은?
19. ROC 곡선의 의미와 AUC의 해석 방법은?
20. 혼동행렬(confusion matrix)의 구성 요소와 활용 방법은?
21. 정밀도(precision)와 재현율(recall)의 차이점은?
22. F1-score의 의미와 계산 방법은?
23. 로지스틱 회귀분석의 목적과 적용 사례는?
24. 시계열 분석의 기본 개념과 주요 기법은?
25. ARIMA 모델의 구성 요소를 설명하시오.
26. 데이터 전처리의 중요성과 주요 기법을 나열하시오.
27. 결측치 처리 방법과 그 영향은 무엇인가?
28. 이상치 탐지 방법과 처리 방안은?
29. 표준화(Standardization)와 정규화(Normalization)의 차이점은?
30. 피어슨 상관계수와 스피어만 상관계수의 차이점은?
31. 데이터 시각화의 중요성과 주요 기법을 나열하시오.
32. 히스토그램과 박스플롯의 용도와 차이점은?
33. 파이썬의 주요 데이터 분석 라이브러리를 나열하시오.
34. 판다스(Pandas)의 주요 기능과 활용 사례는?
35. 넘파이(NumPy)의 주요 기능과 활용 사례는?
36. 시본(Seaborn) 라이브러리의 특징과 활용 방법은?
37. 머신러닝과 딥러닝의 차이점은 무엇인가?
38. 지도학습과 비지도학습의 차이점은?
39. 서포트 벡터 머신(SVM)의 기본 개념과 활용 사례는?
40. 랜덤 포레스트(Random Forest)의 동작 원리와 장단점은?
41. 그래디언트 부스팅 머신(GBM)의 개념과 특징은?
42. 신경망(Neural Network)의 기본 구조와 학습 원리는?
43. 과적합을 방지하기 위한 정규화 기법들을 나열하시오.
44. 하이퍼파라미터 튜닝의 중요성과 방법은?
45. 피처 엔지니어링의 개념과 주요 기법은?
46. 텍스트 마이닝의 개념과 활용 사례는?
47. TF-IDF의 의미와 계산 방법은?
48. 감성 분석(Sentiment Analysis)의 개념과 적용 사례는?
49. 토픽 모델링(Topic Modeling)의 개념과 주요 알고리즘은?
50. LDA(Latent Dirichlet Allocation)의 동작 원리는?
51. 소셜 네트워크 분석(SNA)의 개념과 주요 지표는?
52. 중심성(Centrality)의 종류와 의미는?
53. 페이지랭크(PageRank) 알고리즘의 동작 원리는?
54. 연관 규칙 학습의 개념과 주요 알고리즘은?
55. 지지도(Support)와 신뢰도(Confidence)의 의미는?
56. Apriori 알고리즘의 동작 원리는?
57. 데이터 윤리의 중요성과 주요 원칙은?
58. 개인정보 보호법의 주요 내용과 데이터 분석 시 유의사항은?
59. 익명화(Anonymization)와 가명화(Pseudonymization)의 차이점은?
60. 데이터 거버넌스(Data Governance)의 개념과 구성 요소는?
61. 데이터 품질 관리의 중요성과 주요 지표는?
62. 메타데이터(Metadata)의 개념과 활용 사례는?
63. 데이터 웨어하우스(Data Warehouse)의 개념과 특징은?
64. OLAP와 OLTP의 차이점은 무엇인가?
65. 데이터 레이크(Data Lake)의 개념과 장단점은?
66. 빅데이터 기술 스택의 주요 구성 요소를 나열하시오.
67. 하둡(Hadoop)의 구성 요소와 특징은?
68. 맵리듀스(MapReduce)의 동작 원리와 활용 사례는?
69. 스파크(Spark)의 특징과 주요 기능은?
70. NoSQL 데이터베이스의 개념과 종류는?
71. 키-값 저장소(Key-Value Store)의 특징과 활용 사례는?
72. 문서 지향 데이터베이스(Document-Oriented Database)의 특징은?
73. 그래프 데이터베이스(Graph Database)의 특징과 활용 사례는?
74. 데이터 시각화 도구의 종류와 특징을 나열하시오.
1. 데이터 분석 개념 및 기초 통계
- 데이터 분석의 3단계(정의, 수집, 분석)에 대해 설명하시오.
- 정형 데이터와 비정형 데이터의 차이점은 무엇인가?
- 모수적 분석과 비모수적 분석의 차이점은?
- 평균(mean), 중앙값(median), 최빈값(mode)의 차이점은?
- 데이터의 퍼짐 정도를 나타내는 대표적인 지표 3가지는?
- 표준편차(Standard Deviation)와 분산(Variance)의 차이점은?
- 상관관계(Correlation)와 인과관계(Causation)의 차이는?
- R²(결정계수)의 의미와 해석 방법은?
- p-value의 의미와 해석 방법은?
- 정규 분포(Normal Distribution)의 특징과 중심극한정리(CLT)의 의미는?
2. 데이터 전처리 및 가설 검정
- 이상치(Outlier) 탐지 방법 3가지는?
- 결측치(Missing Value)를 처리하는 방법 3가지는?
- 데이터 정규화(Normalization)와 표준화(Standardization)의 차이점은?
- 가설 검정(Hypothesis Testing)의 기본 개념과 절차를 설명하시오.
- 1종 오류(Type I Error)와 2종 오류(Type II Error)의 차이는?
- 신뢰구간(Confidence Interval)의 의미는?
- 모집단과 표본의 차이점과, 표본이 중요한 이유는?
- 피어슨 상관계수(Pearson Correlation)와 스피어만 상관계수(Spearman Correlation)의 차이는?
- ANOVA(분산 분석)의 목적과 활용 사례는?
- 카이제곱 검정(Chi-Square Test)의 목적과 활용 사례는?
3. 회귀 분석 및 머신러닝
- 단순 회귀(Simple Regression)와 다중 회귀(Multiple Regression)의 차이점은?
- 로지스틱 회귀(Logistic Regression)의 특징과 활용 사례는?
- Lasso 회귀와 Ridge 회귀의 차이점은?
- 과적합(Overfitting)과 과소적합(Underfitting)의 차이점은?
- 머신러닝에서 훈련 데이터(Train)와 테스트 데이터(Test)의 비율을 설정하는 이유는?
- K-평균 군집화(K-Means Clustering)의 기본 원리는?
- 혼동행렬(Confusion Matrix)에서 정확도(Accuracy), 정밀도(Precision), 재현율(Recall)의 차이는?
- F1-score의 의미와 계산 방법은?
- ROC 곡선(Receiver Operating Characteristic Curve)과 AUC(Area Under Curve)의 의미는?
- 랜덤 포레스트(Random Forest) 알고리즘의 특징은?
4. 시계열 분석 및 데이터 마이닝
- 시계열 분석(Time Series Analysis)의 목적은?
- ARIMA 모델의 구성 요소(AR, I, MA)의 의미는?
- 결측치를 보완하는 대표적인 방법은?
- 데이터 마이닝(Data Mining)의 주요 기법 3가지는?
- 주성분 분석(PCA, Principal Component Analysis)의 목적은?
- 텍스트 마이닝(Text Mining)에서 가장 많이 사용하는 기법은?
- 연관 규칙 분석(Association Rule Mining)의 주요 개념 3가지는?
- Apriori 알고리즘의 목적과 특징은?
- TF-IDF(Term Frequency-Inverse Document Frequency)의 의미는?
- 소셜 네트워크 분석(SNA)의 핵심 개념은?
5. 데이터 시각화 및 활용
- 파이차트(Pie Chart)와 바차트(Bar Chart)의 차이는?
- 히스토그램(Histogram)과 박스플롯(Boxplot)의 차이는?
- 시본(Seaborn)과 매트플롯립(Matplotlib)의 차이는?
- 빅데이터의 3V(Volume, Velocity, Variety)는 무엇을 의미하는가?
- 하둡(Hadoop)의 주요 구성 요소 3가지는?
- 스파크(Spark)의 특징과 하둡과의 차이는?
- 데이터 거버넌스(Data Governance)의 개념은?
- 데이터 윤리(Data Ethics)와 개인정보 보호법에서 유의해야 할 사항은?
- NoSQL 데이터베이스와 관계형 데이터베이스(RDB)의 차이는?
- ELT(Extract, Load, Transform)와 ETL(Extract, Transform, Load)의 차이는?
해당 답변은 참고하세요. https://nesaram-health-1story.tistory.com/169
'데이터 분석가:Applied Data Analytics > ADsP' 카테고리의 다른 글
회귀분석에서 연속형 종속변수를 예측하는 방법 (0) | 2025.02.22 |
---|---|
회귀분석은 종속변수가 연속형일때 사용 (0) | 2025.02.22 |
확률과 통계 (0) | 2025.02.20 |
ADsP 내용 용어정리-(Accuracy와 Precision) (0) | 2025.02.19 |
ADsP 예상문제 내용 (0) | 2025.02.14 |