관리 메뉴

블로그

[학습] 불균형한 데이터 학습 시 클래스 비율 지정 본문

공부

[학습] 불균형한 데이터 학습 시 클래스 비율 지정

beenu 2023. 9. 21. 01:57
반응형
train_test_split(filtered_data, test_size=0.2, stratify=filtered_data['column'])
  • 데이터 분할할 때 stratify 옵션 추가하기
    • 아무리 특정 클래스에 대해 train을 많이 시켜도 test set에 그 클래스 데이터가 포함되지 않으면 검증이 되지 않음 -> over fitting 여부 확인X
    • 옵션에 클래스 컬럼을 넣어주면 비율에 따라 나눠줌
728x90
반응형