01. 2분 안에 말하기

우선 선형회귀는 단순선형회귀, 다중선형회귀로 나뉘는데 다중선형회귀는 여러 개의 독립변수에 대한 하나의 종속변수를 파악하고자 합니다. 변수를 그대로 사용하게 되면 불필요한 정보들이 포함되거나 극단적인 결과가 나올 수 있는 문제점이 발생합니다.

이를 규제하 기 위해 다양한 회귀방법이 나타났는데 그것이 릿지, 라쏘, 엘라스틱 회귀 입니다. 선형회귀에 제약 조건을 추가한 값이 최소가 되도록 합니다.

릿지 회귀(L2)는 가중치의 제곱의 합이 특정 값 이하가 되도록 규제하는 방식입니다. 여기서 쓰인 α는 규제의 강도를 조절하는 역할로 모델의 복잡도를 조정합니다. 즉, 사용자가 파라미터를 설정할 수 있습니다. 그래서 α값을 크게 설정하면 가중치들의 절대값은 작아지면서 데이터의 평균을 지나는 수평선이 됩니다. 반면에 α가 작아지면서 0에 수렴할 경우 사실상 선형회귀와 같아집니다.

MSE : Mean Squared Error(평균 제곱 오차, 오차를 제곱한 값의 평균)

MSE : Mean Squared Error(평균 제곱 오차, 오차를 제곱한 값의 평균)

라쏘회귀(L1)는 릿지 회귀와 원리가 같지만 가중치의 절대값의 합이 특정 값 이하가 되도록 규제하는 방식으로 이들의 궁극적인 목표는 α값을 조절하여 과적합을 피하는 모델을 만드는 것입니다. α가 너무 작으면 과대적합이되고 너무 커지면 과소적합이 됩니다.

Untitled

엘라스틱 넷은 릿지회귀와 라쏘회귀를 혼합한 모델입니다. 두 규제항의 혼합 비율 r을 사용해 모델을 만듭니다. 극단적으로 변수의 수가 훈련 샘플의 수보다 많거나 변수들 간의 다중공선성이 의심이 되는 경우(라쏘의 한계) 엘라스틱 넷을 주로 사용합니다.

Untitled

02. 추가 학습 포인트

Untitled