본문 바로가기
반응형

컴퓨터쟁이/Algorithm3

random forest 랜덤 포레스트는 무작위로 추출한 사례의 잡합들을 이용하여 많은 수의 의사결정나무를 생성하고 생성된 여러 의사결정나무의 판별 클래스 들을 가중투표하여 최종 클래스를 결정하는 분류기법이다. 각각의 의사결정나무는 작은 편차를 가지기 위해 가지치기를 하지않고 완전하게 생성된다. 랜덤 포레스트는 다른 분류 기법과 비교해 여러가지 장점을 지닌다. 랜덤 포레스트는 부트스트랩기법을 이용하여 랜덤 포레스트 학습에 필요한 훈련 데이터를 생성하므로 적은 수의 임상 사례만으로도 일정 수준 이상의 정확성을 가지는 분류기를 생성할 수 있다. 또한 훈련 과정에서 무작위하게 추출된 훈련데이터로 많은 수의 의사 결정 나무를 생성하여 다양한 패턴을 포괄하기 때문에 훈련 데이터가 아닌 새로운 데이터가 판별을 위하여 분류기에 입력되었을 경.. 2016. 1. 19.
Ensemble Learning - Bootstrap aggregating, Boosting Ensemble methods use multiple learning algorithms to obtain better predictive performance than could be obtained from any of the constituent learning algorithms. 앙상블 학습법은 여러 학습 알고리즘들을 사용하여서 하나의 알고리즘보다 더 나은, 정확도가 높은 예측 결과를 내기위한 학습법이다. 앙상블이라는 뜻 자체가 전체적인 분위기나 짜임에 맞는 어울림이나 통일이라는 뜻을 지니고 있다. 이 단어의 뜻처럼 앙상블 학습법은 여러 학습 알로리즘을 짜임에 맞게 만들어서 정확도가 높은 예측결과를 나타낸다. 앙상블은 여러학습 알고리즘들을 사용하기 때문에 단일 학습 알고리즘보다 좀더 유연하게 그.. 2015. 12. 14.
결정트리 Decision Tree 1 - entropy 큼큼 .......핑계를 대자면 놀아버렸네요. 네. 놀았어요.작심삼일이라는데.... 삼일도 못가는 저에게 좌절도 한번 느꼈습니다.그래서 오늘은 좀 더 빡세게 정리를 해보려고합니다. 오늘은 알고리즘인 결정트리를 이야기해보려고해요. 그리고 결정트리를 이야기하려면 엔트로피를 알아야하죠.열역학 제2법칙 엔트로피도 있지만, 여기서 이야기하는 엔트로피는 정보엔트로피, information entropy라고 불리우는 것이죠!위키피디아에서 검색을 하니까 엄청 알차게 영어로 나오는데요,(한국말보다 알차게 되어있어요) 눈이 팽팽 돌아가는 줄 알았어요. 우선 제가 최대한 이해한만큼 여기 오신분들에게 이해를 시켜드릴 수 있었으면 좋겠다는 생각이 드네요. 열심히 설명을 해보겠습니다. 자 이제 시작해보도록할까요??========.. 2015. 11. 30.
728x90
반응형