2025/02/14 4

ADsP 예상문제 내용

1. 데이터 분석 개념 및 기초 통계1. 데이터 분석의 3단계(정의, 수집, 분석)?정의: 문제를 명확히 설정수집: 데이터 확보 및 정리분석: 데이터 탐색 및 모델 적용2. 정형 데이터 vs 비정형 데이터?정형 데이터: 엑셀, 데이터베이스(SQL)처럼 구조화된 데이터비정형 데이터: 이미지, 동영상, 텍스트 등 구조화되지 않은 데이터3. 모수적 분석 vs 비모수적 분석?모수적 분석: 데이터가 정규분포를 따르는 경우 사용 (t-test, ANOVA)비모수적 분석: 데이터 분포 가정 없이 사용 (카이제곱 검정, 순위 검정)4. 평균, 중앙값, 최빈값 차이?평균(mean): 모든 값을 더한 후 개수로 나눈 값중앙값(median): 데이터를 정렬했을 때 중간 값최빈값(mode): 가장 많이 등장한 값5. 데이터 ..

ADsP의 예상 기출문제

1. 데이터 분석의 정의와 목적은 무엇인가?2. 데이터 사이언스의 주요 구성 요소는 무엇인가?3. 빅데이터의 3V(Volume, Velocity, Variety)에 대해 설명하시오.4. 정형 데이터와 비정형 데이터의 차이점은 무엇인가?5. 데이터 마이닝의 주요 기법들을 나열하시오.6. 회귀분석과 상관분석의 차이점은 무엇인가?7. 단순 회귀분석과 다중 회귀분석의 차이점은 무엇인가?8. 결정계수(R²)의 의미는 무엇인가?9. p-value의 의미와 해석 방법은?10. 가설검정의 기본 절차를 설명하시오.11. 모수적 방법과 비모수적 방법의 차이점은 무엇인가?12. 주성분분석(PCA)의 목적과 활용 사례는?13. 클러스터링의 개념과 주요 알고리즘을 나열하시오.14. K-평균(K-Means) 알고리즘의 동작 원리..

머신러닝(Machine Learning, ML)-실습

해당 실습은 정보문화사의 파이썬 머신러닝 판다스데이터분석 도서를 기반으로 정리 했습니다. # 데이터 통계 요약정보 확인 df.describe()# 누락 데이터 확인 df.isnull().sum()   #결측치가 없다.mpg 0cylinders 0displacement 0horsepower 0weight 0acceleration 0model year 0origin 0name 0dtype: int64# 중복 데이터 확인 df.duplicated().sum()  #중복행이 없다0# 상관계수 분석 - 데이터프레임 corr = df.corr(numeric_only=True) corr# 상관계수 분석 -..

머신러닝(Machine Learning, ML)-용어편

머신러닝과 관련된 개념과 분석방법들에 대해 미리 용어들의 내용을 정리 했습니다.정리하다 보니 너무 내용이 이해가 안되서 다시 아래 □안에 핵심정리로 따로 정리 해보았습니다. 1. 머신러닝 전체 프로세스머신러닝 프로젝트는 보통 다음과 같은 과정으로 진행된다.문제 정의 및 목표 설정데이터 수집 및 전처리데이터 탐색 및 분석모델 선택 및 학습모델 평가 및 성능 개선모델 배포 및 활용이제 각 단계를 구체적으로 설명하고, 사용되는 분석 방법을 소개하겠다.2. 머신러닝 프로세스 상세 설명 & 분석 방법1) 문제 정의 및 목표 설정머신러닝을 적용할 문제를 정의하고, 목표를 설정하는 단계이다.예제:이메일이 스팸인지 아닌지 분류고객이 제품을 구매할지 예측집의 크기와 위치를 보고 집값을 예측머신러닝 유형 선택문제 유형에 ..

300x250
SMALL