Least Square Method

개요

  • 최소자승법(최소제곱법, Least Square Method)은 관측된 데이터가 있을 때, 이 데이터를 가장 잘 설명하는 모델(직선/곡선/다항식/파라미터) 을 찾는 방법.
  • 예측값과 실제값의 차이(오차/잔차 제곱합)가 최소가 되도록 모델 파라미터를 찾는 방법.
  • RANSAC과 다르게 모든 데이터를 사용하여 에러를 최소화 하므로, 노이즈는 있지만 outlier가 거의 없는 데이터에 용이하다.


Linear Least Square

  • 선형 회귀(Linear Regression)에서 최소자승법은 주어진 데이터 가장 잘 맞는 선형 모델을 찾는 것을 목표로 한다.

선형 모델 및 목적 함수 정의

선형 모델

  • 선형 모델(직선)은 아래와 같이 정의할 수 있다.
  • : 직선의 기울기 (Slope)
  • : 절편 (Intercept)
  • : 에 대한 모델의 예측값

오차

  • 실제 데이터 값 와 예측값 사이의 오차(잔차, Residual)를 다음과 같이 정의한다.

목적 함수

  • 최소자승법은 오차들의 제곱합을 최소화하는 를 찾는 것을 목표로 한다.
  • 오차 제곱의 총 합을 목적함수 로 두어 아래와 같이 정의한다.

최소화를 위한 미분 정리

  • 목적 함수 가 최소가 되기 위해서는 각각의 미지수 에 대해 편미분한 값이 0이 되도록 해야 한다.

에 대한 편미분

  • 목적함수 내부의 항을 라고 할 때, 합성함수의 체인 룰(Cahin rule)에 의해 다음과 같이 분리된다.
  • 분리된 두 항을 곱하여 최종 에 대한 편미분은 다음과 같다.
  • 를 적용하여 정리하면 다음과 같다.
  • 양변을 로 나누고, 를 전개한다.

에 대한 편미분

  • 에 대한 편미분과 마찬가지로 에 대한 편미분은 다음과 같이 계산할 수 있다.
  • 를 적용하여 정리하면 다음과 같다.
  • 양변을 로 나누고, 를 각 항으로 분배한다.
  • 를 우변으로 이항하고, 양변을 데이터 개수 으로 나눈다.
  • 여기서, 첫번 째 항과 두번 째 항은 각각 에 대한 평균 이므로 최종 식은 아래와 같다.

연립방정식 정리

  • 에 대한 편미분 식에 에 대한 편미분 식을 대입하면 아래와 같다.
  • 이것을 에 대해 정리하면 다음과 같다.

공분산과 분산을 이용한 표현

  • 연립방정식을 통해 정리한 에 대한 식에서 수학적 성질에 의해 분모를 분산(Variance), 분자를 공분산(Covariance)로 나타낼 수 있다.
  • 의 분산(편차 제곱의 합)은 다음과 같이 표현할 수 있다.
  • 의 공분산(두 변수 간의 관계)은 다음과 같이 표현할 수 있다.
  • 따라서, 최종 는 다음과 같이 나타낼 수 있다.

정규 방정식을 이용한 정리

  • 정규 방정식(Normal Equation)은 최소자승법의 해를 직접 계산하기 위한 대수적 방법이다.

행렬 표현

  • 데이터 집합을 행렬로 표현하여 다음과 같이 나타낼 수 있다.
  • 이것을 선형대수학의 행렬 곱셉 로 나타내면 다음과 같다.
  • 를 정확히 만족하는 해는 존재하지 않으므로, 가 되도록하는 최적해를 찾아야 한다.

최소자승 문제 정의

  • 오차 벡터를 다음과 같이 정의한다.
  • 최소자승법은 를 최소화 하므로 비용함수 를 다음과 같이 나타낼 수 있다.
  • 비용함수를 전개하면 다음과 같다.

최소점 조건

  • 최소점에서는 기울기가 0이므로 에 대한 편미분을 아래와 같이 할 수 있다.
  • 정리하면 아래의 정규방정식 형태가 나온다.

최종 해 구하기

  • 만약 의 역행렬이 존재한다면(Full Rank인 경우) 양변에 를 곱하여 최소자승의 해를 구할 수 있다.
  • 정규방정식을 이용하면 입력 데이터의 차원이 늘어나도 대수적 표현에 의해 간결하게 해를 구할 수 있다.

기하학적 의미

  • 정규방정식은 직교 투영(Otrhogonal Projection)의 관점으로 해석할 수 있다.
  • 열공간(Column Space) - Column Space는 모든 열 벡터의 선형결합으로 만들 수 있는 벡터들의 집합.
  • 에서 는 열벡터들의 집합이고 에 곱해지는 계수이므로, 의 열벡터들의 선형결합이므로 항상 의 열공간 안에 존재한다.
  • 하지만 가 모든 데이터에 만족하는 해를 가진다면 역시 의 열공간 안에 존재해야 겠지만 일반적으로 의 열공간과 잔차(Residual)만큼 떨어져 있을 것이다.
  • 따라서 잔차만큼 떨어진 와 가장 가까운 점 의 열공간 안에서 찾는다. 이때, 잔차 의 열공간과 직교한다.
  • 즉, 열공간에 직교 투영 했을 때 만나는 열공간 내부의 점이 잔차를 최소화하는 가 되고, 이때의 가 해가 된다.

기하학적 의미 - 예시

  • 예를 들어 가 다음과 같으면 의 열공간은 2차원(평면)을 나타낼 수 있다.
  • 로 2차원 평면 위의 모든 점을 표현할 수 있다.
  • 가 다음과 같이 구성되어 평면 밖에 있다고 할 때,
  • 잔차 벡터는 다음과 같이 정의되며, 의 열공간과 직교한다.
  • 벡터 내적의 성질에 의해 서로 직교하는 벡터의 내적 값은 0이 나온다.
  • 이 식을 정리하면 정규 방정식과 같게 된다.