본문 바로가기
컴퓨터쟁이/Definition

predictive modelling,weak learner, strong leanrner

by 빙글빙글이 2015. 11. 18.
728x90
반응형

위키피디아에서 나온 내용을 해석하고 있는 나. 첫글이지만 부끄럽다.

언제쯤 영어실력이 쑥쑥 올라서 이런짓을 안해도 될지 걱정이다. 우선 시작했으니 무라도 자르겠다는 마음으로 시작한 빙글!


언제든 제 글을 보시고 댓글로 틀렸다고 하셔도 됩니다. 바로바로 수정하겠습니다.욕설은 안돼요ㅠㅠ

그리고 이 글을 참고 하시고 싶은 분들도 분명히 말씀드립니다. 

정확한 정보가 아닐 수 있으니 참조하는 것은 ............ 헉헉 왠만하면.......안하시는게 나을거에요.


얼른 제가 더 섹시해지도록 하겠습니다.(저는 똑똑하지않으니 똑똑해지려고하는건 무리인거같아요, 그러니 섹시해지는걸로 표현하겠습니다)



Predictive modelling

예측 모형

Predictive modeling leverages statistics to predict outcomes. Most Often the event one wants to predict is in the future,

예측 모형은 예측 결과의 통계를 상승시켜준다. 대부분 자주있는 사건을 통해 미래를 예측할 수 있다. 

but predictive modelling can be applied to any type of unknown event, regardless of when it occurred.

하지만 예측 모형은 어떤 알지못하는 사건도 적용할수있다. 언제 그사건이 일어났든지간에 관계없이

For example, predictive models are often used to detect crimes and identify suspects, after the crime has taken place.

예를들어서, 예측모델은 종종 범죄를 조사하거나 혐의자의 신원을 찾을 때 사용된다. 사건이 일어난 후의 장소에서. 


=> 이걸 정리하자면, 한마디로 예측모형은 하나의 결과를 예측하기 좀 더 쉽게 하기위해 있는 것을 말한다.

그렇다면 예측은 무엇일까?

미래를 바라보는 것을 예측이라고한다.(당연히 알겠지만)

하지만 data mining 쪽에서, 특히 decision tree에서는 classification이 prediction이라고 표현된다고 보면된다.

글을 보다보면 classification과 prediction에 대한 차이도 없고 어디선 이렇게 어디선 저렇게 쓰여서 헷갈린다.

나는 그래서 classification을 쓸것이다! 뭔가 좀 더 확실하게 말해주고 있는 느낌이 든다. decision tree에 내가 집중하고 있어서 인지도 모르지만.

classification은 다음에 다시 글을 올리겠다. 우선은........ weak learner와 strong learner부터 가보자.


A weak learner is defined to be a classifier which is only slightly correlated with the true classification. 

 -it can label examples better than random guessing.

해석대로 하자면 약한 학습자이다.하지만 약한 예측 모형이라고 한국어로는 하는거 같다.

하지만 그냥 나는 weak learner를 분류하는 정확도가 떨어지는 녀석으로.탕탕!

임의적 추측보단 그래도 낫다고 한다. 

예를 들어보면 weak learner는 내가 100점 만점에 80점을 원해서 분류를 하면, 60~100사이의 값을 준다. 너무 오차가 크기 때문에 분류 정확도가 떨어진다는 것이다.

임의적 추측은 0~100점 중에 아무값이나 나오기 때문에 이게 weak learner보다 더 덜떨어지는것이다.


A strong learner is a classifier that is arbitrarily well-correlated with the true classification.

이건 반대로 강한 예측 모형이라고 한다. 강한 예측 모형이란 임의로 분류를 했는데 아주 잘~해서 딱 분류가 되도록 하는것을 말한다.

말그대로 내가 원했던 결과를 바로 딱 보여주는거다!

다시 같은 예로 내가 80점을 말하면 75~85점 사이의 값을 주는 것으로 오차가 아주 작아지는 것이다!




아 정말 쉬운거라고 생각했는데 벌써부터 한숨이 나오고 숨이찬다. 하지만 꿋꿋하게 써보겠다. 





728x90
반응형

'컴퓨터쟁이 > Definition' 카테고리의 다른 글

프레임은 정의다.  (0) 2020.10.20
overfitting  (0) 2015.12.18
entropy  (0) 2015.12.11