반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- pmf
- tableau
- 데이터분석
- 데이터모델링
- 딥러닝
- Market
- 태블로
- omtm
- 언어지능딥러닝
- OKR
- 모델링
- dl
- productmarketfit
- 데이터시각화
- 컴퓨터비전
- nlp
- 자연어처리
- DACON
- 머신러닝
- 데이콘
- 파인튜닝
- 그로스해킹
- product
- 시각화
- fit
- Computer Vision
- ERD
- 인공지능
Archives
- Today
- Total
블로그
[머신러닝] #4 K-Fold Cross Validation 본문
반응형
K - Fold Cross Validation
from sklearn.model_selection import cross_val_score
# 사용할 모델 선언
model = MODEL()
cv_score = cross_val_score(model, x_train, y_train, cv=10)
- K-분할 교차 검증
- 모든 데이터가 평가에 한 번, 학습에 k-1번 사용됨
- k개의 분할(Fold)에 대한 성능을 예측 → 평균, 표준편차 계산, 일반화 성능
- 단 k는 2 이상이어야 함(k가 1일 경우, 학습 데이터로 평가까지 하게 됨)
- 장점
- 모든 데이터를 학습과 평가에 사용할 수 있음
- 반복 학습과 평가를 통해 정확도를 향상시킬 수 있음
- 데이터가 부족해서 발생하는 과소적합 문제를 방지할 수 있음
- 평가에 사용되는 데이터의 편향을 막을 수 있음
- 좀 더 일반화된 모델을 만들 수 있음
- 단점
- 반복 횟수가 많아서 모델 학습과 평가에 많은 시간이 소요됨
728x90
반응형
'공부 > ML' 카테고리의 다른 글
[머신러닝] #6 앙상블(Ensemble) (2) | 2024.03.15 |
---|---|
[머신러닝] #5 Hyperparameter 튜닝 (0) | 2024.03.14 |
[머신러닝] #3 기본 알고리즘 - 1(Linear Regression, K-Nearest Neighbor, Decision Tree, Logistic Regression) (0) | 2024.03.13 |
[머신러닝] #2 성능평가 (0) | 2024.03.12 |
[머신러닝] #1 (0) | 2024.03.12 |