반응형 소소한 일상/소소한 책5 핸즈온 머신러닝 2판 - 4.7 연습문제 1. 수백만 개의 특성을 가진 훈련 세트에서는 어떤 선형 회귀 알고리즘을 사용할 수 있을까요? 2. 훈련 세트에 있는 특성들이 각기 아주 다른 스케일을 가지고 있습니다. 이런 데이터에 잘 작동하지 않는 알고리즘은 무엇일까요? 그 이유는 무엇일까요? 이 문제를 어떻게 해결할 수 있을까요? 3. 경사 하강법으로 로지스틱 회귀 모델을 훈련 시킬 때 지역 최솟값에 갇힐 가능성이 있을까요? 4. 충분히 오랫동안 실행하면 모든 경사 하강법 알고리즘이 같은 모델을 만들어낼까요? 5. 배치 경사 하강법을 사용하고 에포크마다 검증 오차를 그래프로 나타내봤습니다. 검증 오차가 일정하게 상승되고 있다면 어떤 일이 일어나고 있는 걸까요? 이 문제를 어떻게 해결 할 수 있나요? 6. 검증 오차가 상승하면 미니배치 경사 하강법을.. 2021. 2. 4. 핸즈온 머신러닝 2판 - 3.8 연습문제 1. MNIST 데이터셋으로 분류기를 만들어 테스트 세트에서 97% 정확도를 달성해보세요. 힌트 : KNeighborsClassifier가 이 작업에 아주 잘 맞습니다. 좋은 하이퍼파라미터 값만 찾으면 됩니다. (weights와 n_neighbors 하이퍼파라미터로 그리드 탐색을 시도해보세요.) 2. MNIST 이미지를 (왼, 오른, 위, 아래) 어느 방향으로든 한 픽셀 이동시킬 수 있는 함수를 만들어보세요. 그런 다음 훈련 세트에 있는 각 이미지에 대해 네 개의 이동 된 복사본(방향마다 한 개씩)을 만들어 훈련 세트에 추가하세요. 마지막으로 이 확장된 데이터셋에서 앞에서 찾은 최선의 모델을 훈련 시키고 테스트 세트에서 정확도를 측정해보세요. 모델 성능이 더 높아졌는지 확인해보세요! 인위적으로 훈련 세트.. 2021. 1. 27. 핸즈온 머신러닝 2판 - 2.10 연습문제 1. 서포트 벡터 머신 회귀(sklearn.svm.SVR)를 kernel="linear"(하이퍼파라미터 C를 바꿔가며) 나 kernel="rdf"(하이퍼파라미터 C와 gamma를 바꿔가며) 등의 다양한 하이퍼파라미터 설정으로 시도해보세요. 지금은 이 하이퍼파라미터가 무엇을 의미하는지 너무 신경쓰지마세요. 최상의 SVR 모델은 무엇인가요? 2. GridSearchCV를 RandomizedSearchCV로 바꿔보세요. 3. 가장 중요한 특성을 선택하는 변환기를 준비 파이프라인에 추가해보세요. 4. 전체 데이터 준비 과정과 최종 예측을 하나의 파이프라인으로 만들어보세요. 5. GridSearchCV를 사용해 준비 단계의 옵션을 자동으로 탐색해보세요. 2021. 1. 18. 핸즈온 머신러닝 2판 -1.7 연습문제 - 답 1. 머신러닝을 어떻게 정의할 수 있나요? 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상 도ㅒㅆ다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다. - 1997, 톰 미첼 머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구분야다 - 1959, 아서 새뮤얼 [예시] 스팸 필터는 사용자가 스팸이라고 지정한 스팸 메일과 일반 메일의 샘플을 이용해 스팸 메일을 구분한다. training set(훈련 세트): N개, 시스템이 학습하는 데 사용하는 샘플 training instance(=sample, 훈련 사례) :N개의 training set의 각 훈련 데이터 작업 T : 새로운 메일이 스팸인지 구분하는 것.. 2021. 1. 13. 이전 1 2 다음 728x90 반응형