반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 파인튜닝
- 머신러닝
- tableau
- 태블로
- 인공지능
- 딥러닝
- 데이터모델링
- 그로스해킹
- product
- DACON
- 컴퓨터비전
- pmf
- nlp
- fit
- dl
- 자연어처리
- Computer Vision
- omtm
- 데이터분석
- 시각화
- OKR
- productmarketfit
- 데이터시각화
- Market
- 모델링
- 데이콘
- ERD
- 언어지능딥러닝
Archives
- Today
- Total
블로그
[학습] 불균형한 데이터 학습 시 클래스 비율 지정 본문
반응형
train_test_split(filtered_data, test_size=0.2, stratify=filtered_data['column'])
- 데이터 분할할 때 stratify 옵션 추가하기
- 아무리 특정 클래스에 대해 train을 많이 시켜도 test set에 그 클래스 데이터가 포함되지 않으면 검증이 되지 않음 -> over fitting 여부 확인X
- 옵션에 클래스 컬럼을 넣어주면 비율에 따라 나눠줌
728x90
반응형
'공부' 카테고리의 다른 글
[학습] 분류 모델 불균형 데이터 평가지표 (0) | 2023.10.03 |
---|---|
[학습] PyTorch 토크나이저 저장 (0) | 2023.10.03 |
[학습] Pandas apply 메소드 (5) | 2023.09.11 |
[논문 리뷰] Application of Machine Learning for Assessment of HS Code Correctness (0) | 2023.09.08 |
[논문 리뷰] Neural Machine Translation for Harmonized System Codes prediction (0) | 2023.09.08 |