Supervised Variable Selection

Published: Dec 27, 2020 by Dev-hwon

이 내용은 고려대학교 강필성 교수님의 Business Analytics 수업을 보고 정리한 것입니다.

아래 이미지 클릭 시 강의 영상 Youtube URL로 넘어갑니다.

01-2: Dimensionality Reduction - Supervised Selection

Supervised Variable Selection


  • 가능한 모든 조합을 확인하는 방법

  • 변수 선택을위한 성능 기준:
    • Akaike Information Criteria(AIC)
    • Bayesian Information Criteria(BIC)
    • Adjusted \(R^2\)
    • Mallow’s \(C_p\)
    • etc
  • Global Optimum을 확보할 수 있으나 현실적으로 사용 불가하다.

Forward Selection

  • 변수가 없는 모델에서 중요한 변수를 순차적으로 추가하는 방법

  • 변수를 선택하면 제거되지 않는다. (변수 수 점차 증가)

Backward Elimination

  • 모든 변수가 있는 모델에서 관련 없는 변수를 순차적으로 제거

  • 변수가 제거되면 다시 선택되지 않는다. (변수 수 점차 감소)

Stepwise Selection

  • 변수가 없는 모델에서 순방향 선택과 역방향 제거를 번갈아 수행

  • Forward Selection/Backward Elimination보다 시간이 오래 걸리지만 최적의 변수 집합을 찾을 수 있는 기회가 더 많다.

  • Forward Selection/Backward Elimination과는 다르게 선택/제거 된 변수는 선택/제거를 위해 다시 고려할 수 있다.

Machine Learning Dimensionality Reduction Supervised Variable Selection Exhaustive Search Forward Selection Backward Elimination Stepwise Selection 머신러닝 차원축소