728x90
반응형
랜덤 포레스트는 무작위로 추출한 사례의 잡합들을 이용하여 많은 수의 의사결정나무를 생성하고 생성된 여러 의사결정나무의 판별 클래스 들을 가중투표하여 최종 클래스를 결정하는 분류기법이다. 각각의 의사결정나무는 작은 편차를 가지기 위해 가지치기를 하지않고 완전하게 생성된다. 랜덤 포레스트는 다른 분류 기법과 비교해 여러가지 장점을 지닌다. 랜덤 포레스트는 부트스트랩기법을 이용하여 랜덤 포레스트 학습에 필요한 훈련 데이터를 생성하므로 적은 수의 임상 사례만으로도 일정 수준 이상의 정확성을 가지는 분류기를 생성할 수 있다. 또한 훈련 과정에서 무작위하게 추출된 훈련데이터로 많은 수의 의사 결정 나무를 생성하여 다양한 패턴을 포괄하기 때문에 훈련 데이터가 아닌 새로운 데이터가 판별을 위하여 분류기에 입력되었을 경우에도 높은 수준의 정확성을 가질 수 있다. 이외에도 랜덤 포레스트는 많은 수의 입력데이터를 처리할 수 있고, missing value을 예측할 수 있으며 overfitting 문제가 발생하지않고, variable Importance를 제공한다.
728x90
반응형
'컴퓨터쟁이 > Algorithm' 카테고리의 다른 글
Ensemble Learning - Bootstrap aggregating, Boosting (0) | 2015.12.14 |
---|---|
결정트리 Decision Tree 1 - entropy (0) | 2015.11.30 |