[2.1 사이킷런 소개와 특징]

사이킷런: 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리로 머신러닝을 위한 가장 쉽고 효율적인 개발 라이브러리 제공

[2.2 첫번째 머신러닝 만들어보기 - 붓꽃 품종 예측하기]

피처: 데이터 속성의 일반 속성, 머신러닝은 2차원 이상의 다차원 데이터에서도 많이 사용되므로 타켓값을 제외한 나머지 속성을 모두 피처로 지정

타겟값: 지도 학습시 데이터의 학습을 위해 주어지는 정답 데이터, 레이블 또는 클래스로 지칭하기도 함

<붖꽃 품종 예측 PROCESS>

데이터 세트 분리모델 학습예측 수행평가

[2.3 사이킷런의 기반 프레임워크 익히기]

Estimator = Classification + Regression

Estimator에서는 학습(fit)과 예측(predict)수행

ML에서는 피처 처리, ML알고리즘 학습/예측 수행, 모델 평가의 단계 반복적으로 수행

[2.4 Model Selection모듈 소개]

import pandas as pd
iris_df = pd.DataFrame(iris_data.data, columns=iris_data.feature_names)
iris_df['target']=iris_data.target
ftr_df = iris_df.iloc[:,:-1]
tgt_df = iris_df.iloc[:,-1]
X_train, X_test, y_train, y_test = train_test_split(ftr_df, tgt_df,
test_size=0.3, random_state=121)