scikit learn
-
10. Grid Search: 머신러닝 모델 하이퍼파라미터 튜닝, 최적화 손쉽게 하기(feat. scikit learn)Data & ML & AI/Pandas & Scikit-Learn 2023. 3. 30. 00:37
하이퍼파라미터를 하나하나 바꿔가며 모델을 테스트 하는 것은 참 귀찮은 일입니다. 그래서 scikit learn은 그리드탐색(Grid Search)과 랜덤탐색(Random Search)를 지원합니다. 이미지출처 Grid Search 그리드 탐색은 주어진 하이퍼파라미터들 중, 최적의 조합을 찾아내는 기법입니다. 사용자(분석자)가 미리 하이퍼파라미터 세트들을 정의함 모든 경우의 수로 하이퍼파라미터 조합을 생성, 모든 경우에 대해 머신러닝을 수행 가장 우수한 성능을 가진 하이퍼파라미터 조합이 최종적으로 선택됨 sklearn의 toy data인 iris data를 활용한 예시 코드입니다. from sklearn.datasets import load_iris from sklearn.model_selection im..
-
9. Scikit Learn을 활용한 train-test 데이터셋 나누기 (cross validation, K-fold)Data & ML & AI/Pandas & Scikit-Learn 2022. 8. 11. 01:08
모델학습의 정확도, 과적합 여부를 확인하기 위해 데이터셋을 훈련용(train), 테스트용(test) 데이터셋으로 나누곤 합니다. 더 나아가서는 검증용(valid) 데이터셋으로 구분하기도 하죠. 앞서 6.scikit-learn을 활용한 간단한 분류모델, 7.회귀모델에서도 잠깐 다루긴 했었지만, 아주 조금만 더 자세히 살펴볼까 합니다. 1. 데이터 가져오기 sklearn의 toy data 중 와인데이터를 사용해보겠습니다. import pandas as pd from sklearn.datasets import load_wine wine = load_wine() X = wine['data'] Y = wine['target'] feature_names = wine['feature_names'] df = pd.Da..