수학/Statistical Learning

[ISLR] 트리와 선형 모델, 트리의 장단점

AI 꿈나무 2021. 7. 30. 14:07
반응형

트리와 선형모델

 선형 회귀는 다음 형태의 모델을 가정합니다.

 

 

 회귀 트리는 다음 형태의 모델을 가정합니다.

 

 

 만약 반응 변수와 설명 변수 사이의 관계가 선형이라면 선형 모델이 더 좋은 성능을 갖습니다. 관계가 비선형인 경우에 트리가 더 좋은 성능을 갖습니다.

 

 

 모델을 선택하는데에 정확도를 제외하고 해석력과 시각화를 고려할 수 있습니다. 트리의 경우 해석력과 시각화가 선형모델보다 뛰어납니다. 위 그림을 보면 데이터가 선형 관계인 경우에 선형 모델이 결정경계를 잘 형성하고, 데이터가 비선형 관계인 경우에 트리가 결정경계를 잘 형성합니다.

 

트리의 장단점

  • 트리는 설명하기 쉽습니다. 선형 회귀보다 설명하기 더 쉽습니다.
  • 의사결정트리가 다른 기법들보다 인간의 의사결정 과정을 더 밀접하게 반영합니다.
  • 트리는 비전문가도 쉽게 해석할 수 있으며 그래픽으로 나타내기도 싶습니다.
  • 트리는 더미변수(가변수)를 만들지 않고도 질적 설명변수들을 쉽게 처리할 수 있습니다.
  • 트리는 회귀 및 분류 기법들과 동일한 수준의 정확도를 제공하지 않습니다.

 

 트리의 성능은 배깅, 부스팅, 랜덤 포레스트 같은 방법을 사용하여 향상될 수 있습니다.

 


참고자료 및 그림 출처

Gareth James의 An Introduction to Statistical Learning

반응형

'수학 > Statistical Learning' 카테고리의 다른 글

[ISLR] 랜덤 포레스트(Random Forests)  (0) 2021.07.31
[ISLR] 배깅(Bagging)  (0) 2021.07.31
[ISLR] 분류 트리(Classification Tree)  (0) 2021.07.30
[ISLR] Tree Pruning  (0) 2021.07.28
[ISLR] 회귀 트리(Regression Trees)  (0) 2021.07.28