[혼공] ch 3. 회귀 알고리즘과 모델 규제
1. K-최근접 이웃 회귀 농의 높이, 길이 등의 수치로 농어의 무게를 예측하라 1) k-최근접 이웃 회귀 - 지도 학습은 분류와 회귀(regression)로 나뉜다. - 회귀는 클래스 중 하나로 분류하는 것이 아니라 임의의 어떤 숫자를 예측하는 문제 - 이웃한 샘플의 타깃은 어떤 클래스가 아니라 임의의 수치 - 샘플의 수치를 이용해 새로운 샘플 X의 타깃을 에측하기 위해 수치들의 평균을 구함 - 가장 먼저 가까운 k개의 이웃을 찾고 이웃 샘플의 타깃값을 평균하여 이 샘플의 예측값으로 사용 2) 데이터 준비 import numpy as npperch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21..
[혼공] ch 2. 데이터 다루기
1. 훈련 세트와 테스트 세트 - 지도 학습 알고리즘은 훈련하기 위한 데이터와 정답이 필요 - 지도 학습에서는 데이터와 정답을 입력(input)과 타깃(target)이라고 하고, 이 둘을 합쳐 훈련 데이터(training data)라고 부름 - 머신러닝 알고리즘의 성능을 제대로 평가하려면 훈련 데이터와 평가에 사용할 데이터가 각각 달라야 함 - 테스트 세트(test set) : 평가에 사용하는 데이터 - 훈련 세트(train set) : 훈련에 사용되는 데이터 - 생선 길이와 무게를 위한 리스트 준비 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0..