
다중 선형 회귀 모델 생성 방법
·
Machine Learning
다중 선형 회귀(Multiple Linear Regression) 모델 생성 방법모두 포함(All-in)설명 모든 독립 변수를 그대로 포함하여 모델을 학습한다.변수의 유의성 검증을 하지 않고, 주어진 데이터 그대로 학습한다.장점빠르고 간단하다.변수를 선택하는 추가 절차가 필요 없다.단점불필요한 변수가 포함되어 다중공선성 문제가 발생 가능하다.모델이 복잡해지고 해석이 어려워질 수 있다.언제 사용할까 ?독립 변수가 모두 중요한 변수임이 확실할 때설명보다는 단순한 예측이 목적일 때 후진 제거법(Backward Elimination)설명모든 변수를 포함한 상태에서 시작한다.통계적으로 가장 유의하지 않은 변수(p-value가 가장 높은 변수)를 제거한다.제거 후 다시 모델을 학습하고 p-value를 확인한다.모든..