반응형 컴퓨터쟁이90 random forest 랜덤 포레스트는 무작위로 추출한 사례의 잡합들을 이용하여 많은 수의 의사결정나무를 생성하고 생성된 여러 의사결정나무의 판별 클래스 들을 가중투표하여 최종 클래스를 결정하는 분류기법이다. 각각의 의사결정나무는 작은 편차를 가지기 위해 가지치기를 하지않고 완전하게 생성된다. 랜덤 포레스트는 다른 분류 기법과 비교해 여러가지 장점을 지닌다. 랜덤 포레스트는 부트스트랩기법을 이용하여 랜덤 포레스트 학습에 필요한 훈련 데이터를 생성하므로 적은 수의 임상 사례만으로도 일정 수준 이상의 정확성을 가지는 분류기를 생성할 수 있다. 또한 훈련 과정에서 무작위하게 추출된 훈련데이터로 많은 수의 의사 결정 나무를 생성하여 다양한 패턴을 포괄하기 때문에 훈련 데이터가 아닌 새로운 데이터가 판별을 위하여 분류기에 입력되었을 경.. 2016. 1. 19. overfitting In statistics and machine learning, overfitting occurs when a statistical model describes random error or noise instead of the underlying relationship. Overfitting generally occurs when a model is excessively complex, such as having too many parameters relative to the number of observations. A model that has been overfit will generally have poor predictive performance, as it can exaggerate minor.. 2015. 12. 18. Ensemble Learning - Bootstrap aggregating, Boosting Ensemble methods use multiple learning algorithms to obtain better predictive performance than could be obtained from any of the constituent learning algorithms. 앙상블 학습법은 여러 학습 알고리즘들을 사용하여서 하나의 알고리즘보다 더 나은, 정확도가 높은 예측 결과를 내기위한 학습법이다. 앙상블이라는 뜻 자체가 전체적인 분위기나 짜임에 맞는 어울림이나 통일이라는 뜻을 지니고 있다. 이 단어의 뜻처럼 앙상블 학습법은 여러 학습 알로리즘을 짜임에 맞게 만들어서 정확도가 높은 예측결과를 나타낸다. 앙상블은 여러학습 알고리즘들을 사용하기 때문에 단일 학습 알고리즘보다 좀더 유연하게 그.. 2015. 12. 14. entropy 또다시 늦게 돌아왔네요. 게을러서 어쩌면 좋을까요 ㅠㅠ decision tree를 설명하려면 entropy에 대한 개념이 필요해요. 그래서 정의 부분에서 가져왔어요. 오늘은 짧게 설명을 쓸게요. entropy는 주어진 데이터 집합의 complexity를 의미해요. 즉, 주어진 데이터 집합에 레코드들이 서로 다른 종류(class)들이 많이 섞여있으면 entropy가 높고 2015. 12. 11. 이전 1 ··· 19 20 21 22 23 다음 728x90 반응형