관리 메뉴

블로그

[머신러닝] #1 본문

공부/ML

[머신러닝] #1

beenu 2024. 3. 12. 10:48
반응형

 

  • 컬럼이 너무 많아질 경우 One-Hot Encoding 하지 않음
    • Label Encoding => 컬럼이 y에 얼마나 영향을 주는지 알 수 있음
    • One-Hot Encoding => 컬럼의 범주별로 y에 얼마나 영향을 주는지 알 수 있음

 

  •  데이터 컬럼이 너무 많아지면(너무 복잡해지면) 모델 성능이 떨어질 수 있음
    • x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3)
    • test_size 정수로 주면 개수 지정하는 것 (3을 주면 하위 3행을 테스트 셋으로 설정함)
728x90
반응형