데이터 분석가:Applied Data Analytics/ADsP

회귀분석은 종속변수가 연속형일때 사용

데이터분석 2025. 2. 22. 18:04
320x100
728x90

회귀분석에서 연속형 종속변수란 실수(Real number)로 표현할 수 있는 값을 의미하며, 길이, 전류, 압력, 온도, 시간과 같이 연속적으로 측정 가능한 수치를 말합니다.

이는 범주형 변수와는 다른데, 범주형 변수는 꽃잎의 수나 불량의 개수처럼 정수로만 표현되거나, 복막염 동반 여부처럼 이산적인 값을 가지는 경우를 말합니다.

 

회귀분석의 주요 특징은 다음과 같습니다:

  • 독립변수(x)와 종속변수(y) 사이의 관계를 수학적으로 모델링합니다.
  • 예측값이 연속형 숫자 값으로 나타납니다.
  • 데이터를 가장 잘 설명하는 최적의 회귀식을 찾는 것이 목적입니다.

예를 들어, 아파트 가격 예측에서 가격은 연속형 종속변수이며, 이는 방의 개수, 아파트 크기, 주변 편의시설 등의 독립변수들에 의해 영향을 받습니다.

 

회귀분석에서 종속변수가 연속형인 것이 중요한 이유는 다음과 같습니다:

선형 관계 모델링이 가능하기 때문입니다. 연속형 변수는 실수로 표현되어 변수들 간의 함수적 관계를 탐색하고 선형 관계로 표현하기에 적합합니다.

정확한 예측값 도출이 가능합니다. 가격이나 나이와 같이 연속된 값의 범위를 가지므로 종속변수의 실제 값을 정확하게 예측할 수 있습니다.

영향력의 크기를 정확하게 측정할 수 있습니다. 독립변수가 1단위 증가할 때 종속변수가 얼마나 변화하는지 정확하게 측정이 가능합니다.

변수 간의 관계와 연관성을 명확하게 파악할 수 있습니다. 연속형 스케일을 가진 목표변수이기 때문에 변수들 사이의 관계를 정밀하게 분석할 수 있습니다.