블로그
[머신러닝] #1 본문
반응형
- 컬럼이 너무 많아질 경우 One-Hot Encoding 하지 않음
- Label Encoding => 컬럼이 y에 얼마나 영향을 주는지 알 수 있음
- One-Hot Encoding => 컬럼의 범주별로 y에 얼마나 영향을 주는지 알 수 있음
- 데이터 컬럼이 너무 많아지면(너무 복잡해지면) 모델 성능이 떨어질 수 있음
- x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3)
- test_size 정수로 주면 개수 지정하는 것 (3을 주면 하위 3행을 테스트 셋으로 설정함)
728x90
반응형
'공부 > ML' 카테고리의 다른 글
[머신러닝] #6 앙상블(Ensemble) (2) | 2024.03.15 |
---|---|
[머신러닝] #5 Hyperparameter 튜닝 (0) | 2024.03.14 |
[머신러닝] #4 K-Fold Cross Validation (0) | 2024.03.14 |
[머신러닝] #3 기본 알고리즘 - 1(Linear Regression, K-Nearest Neighbor, Decision Tree, Logistic Regression) (0) | 2024.03.13 |
[머신러닝] #2 성능평가 (0) | 2024.03.12 |