데이터 분석가:Applied Data Analytics/ADsP 8

선형 회귀모델

선형 회귀모델의 기본 개념선형 회귀는 독립변수(x)와 종속변수(y) 간의 선형적 관계를 모델링하는 통계적 방법입니다.주요 유형1. 단순선형회귀수식: y = β₀ + β₁x + ε독립변수가 1개인 경우가장 기본적인 선형 회귀 모델주택 가격 예측 모델종속변수(y): 주택 가격독립변수(x): 주택 면적수식: 주택가격 = 5000만원 + 150만원×면적(평)학생 성적 예측 모델종속변수(y): 기말고사 점수독립변수(x): 공부 시간수식: 기말점수 = 40점 + 5점×공부시간(시간)월별 매출 예측 모델종속변수(y): 월 매출액독립변수(x): 광고 비용수식: 월매출 = 1000만원 + 2×광고비용2. 다중선형회귀수식: y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxₙ + ε독립변수가 2개 이상인 경우여러 ..

비선형 회귀 모델

비선형 회귀 모델의 개념비선형 회귀는 독립변수와 종속변수 간의 관계가 곡선 형태를 띄는 경우 사용하는 분석 방법입니다.주요 비선형 회귀 모델 유형1. 로지스틱 회귀x축: 독립 변수 (입력 값)y축: 종속 변수 (확률, 0~1 범위)곡선은 0과 1 사이에서 변화하며, 특정 값을 기준으로 **두 개의 범주(예: 성공/실패, 참/거짓)**로 구분하는 역할을 합니다.중앙 부분에서 급격히 변하며, 이는 결정 경계(Decision Boundary)를 의미합니다.로지스틱 회귀는 분류 문제에서 이진 분류(예/아니오, 스팸/정상 등)를 수행할 때 자주 사용종속변수가 0과 1 사이의 확률값을 가질 때 사용S자 형태의 곡선 패턴 모델링주로 분류 문제에 활용주요 특징1. 수학적 구조시그모이드(로지스틱) 함수 사용: f(x) ..

회귀분석에서 연속형 종속변수를 예측하는 방법

회귀분석에서 연속형 종속변수를 예측하는 주요 방법들1. 선형 회귀 모델단순선형회귀: 독립변수가 1개인 경우다중선형회귀: 독립변수가 2개 이상인 경우다항회귀: 독립변수의 차수를 높여 비선형 관계를 모델링2. 비선형 회귀 모델로지스틱 회귀지수회귀로그회귀스플라인 회귀3. 정규화 기법을 적용한 회귀Ridge(L2 정규화)Lasso(L1 정규화)Elastic Net(L1+L2 정규화)4. 머신러닝 기반 회귀결정트리 회귀랜덤 포레스트 회귀XGBoost, LightGBM서포트 벡터 회귀(SVR)5. 딥러닝 기반 회귀인공신경망(ANN)순환신경망(RNN)합성곱신경망(CNN)각 방법은 데이터의 특성과 문제의 성격에 따라 선택적으로 사용된다.

회귀분석은 종속변수가 연속형일때 사용

회귀분석에서 연속형 종속변수란 실수(Real number)로 표현할 수 있는 값을 의미하며, 길이, 전류, 압력, 온도, 시간과 같이 연속적으로 측정 가능한 수치를 말합니다.이는 범주형 변수와는 다른데, 범주형 변수는 꽃잎의 수나 불량의 개수처럼 정수로만 표현되거나, 복막염 동반 여부처럼 이산적인 값을 가지는 경우를 말합니다. 회귀분석의 주요 특징은 다음과 같습니다:독립변수(x)와 종속변수(y) 사이의 관계를 수학적으로 모델링합니다.예측값이 연속형 숫자 값으로 나타납니다.데이터를 가장 잘 설명하는 최적의 회귀식을 찾는 것이 목적입니다.예를 들어, 아파트 가격 예측에서 가격은 연속형 종속변수이며, 이는 방의 개수, 아파트 크기, 주변 편의시설 등의 독립변수들에 의해 영향을 받습니다. 회귀분석에서 종속변수가..

확률과 통계

고등학교 확률과 통계는 사건의 경우의 수 계산 → 확률 분석 → 데이터의 특성 분석 → 통계적 검정의 흐름을 가집니다.ADsP 시험에서도 확률, 통계, 가설 검정이 핵심 개념이므로 이 기본기를 다지면 큰 도움이 됩니다.1. 경우의 수합의 법칙: 둘 이상의 사건 중 하나가 발생하는 경우 → 더하기곱의 법칙: 연속적으로 선택해야 하는 경우 → 곱하기순열(Permutation, P(n,r)P(n, r)P(n,r))서로 다른 nnn개 중 rrr개를 순서 있게 배열하는 방법공식: P(n,r)=n!(n−r)!P(n, r) = \frac{n!}{(n-r)!}P(n,r)=(n−r)!n!​조합(Combination, C(n,r)C(n, r)C(n,r))서로 다른 nnn개 중 rrr개를 순서 없이 선택하는 방법공식: C(..

ADsP 내용 용어정리-(Accuracy와 Precision)

ADsP시험 내용 중 용어 중심으로 정리 하였습니다. Accuracy와 Precision1) Accuracy (정확도) : "전체 중에서 맞춘 것", "중앙을 맞췄는가?"전체 데이터 중에서 정답을 맞춘 비율을 의미함.공식: TP (True Positive) ↑ : 실제 긍정(Positive)이고 예측도 Positive(긍정), Accuracy가 높으므로 TP가 많은 편TN (True Negative) ↑ : 실제 Negative(부정)이고, 예측도 Negative(부정), Accuracy가 높으므로 TN도 많은 편  FP (False Positive) ↑ : 실제 Negative(부정)인데, 예측을 Positive(긍정), Precision이 낮다는 것은 긍정으로 예측한 것 중에서 틀린 비율(FP)이 높..

ADsP 예상문제 내용

1. 데이터 분석 개념 및 기초 통계1. 데이터 분석의 3단계(정의, 수집, 분석)?정의: 문제를 명확히 설정수집: 데이터 확보 및 정리분석: 데이터 탐색 및 모델 적용2. 정형 데이터 vs 비정형 데이터?정형 데이터: 엑셀, 데이터베이스(SQL)처럼 구조화된 데이터비정형 데이터: 이미지, 동영상, 텍스트 등 구조화되지 않은 데이터3. 모수적 분석 vs 비모수적 분석?모수적 분석: 데이터가 정규분포를 따르는 경우 사용 (t-test, ANOVA)비모수적 분석: 데이터 분포 가정 없이 사용 (카이제곱 검정, 순위 검정)4. 평균, 중앙값, 최빈값 차이?평균(mean): 모든 값을 더한 후 개수로 나눈 값중앙값(median): 데이터를 정렬했을 때 중간 값최빈값(mode): 가장 많이 등장한 값5. 데이터 ..

ADsP의 예상 기출문제

1. 데이터 분석의 정의와 목적은 무엇인가?2. 데이터 사이언스의 주요 구성 요소는 무엇인가?3. 빅데이터의 3V(Volume, Velocity, Variety)에 대해 설명하시오.4. 정형 데이터와 비정형 데이터의 차이점은 무엇인가?5. 데이터 마이닝의 주요 기법들을 나열하시오.6. 회귀분석과 상관분석의 차이점은 무엇인가?7. 단순 회귀분석과 다중 회귀분석의 차이점은 무엇인가?8. 결정계수(R²)의 의미는 무엇인가?9. p-value의 의미와 해석 방법은?10. 가설검정의 기본 절차를 설명하시오.11. 모수적 방법과 비모수적 방법의 차이점은 무엇인가?12. 주성분분석(PCA)의 목적과 활용 사례는?13. 클러스터링의 개념과 주요 알고리즘을 나열하시오.14. K-평균(K-Means) 알고리즘의 동작 원리..

300x250
SMALL