목록머신러닝 (3)
블로그
데이콘에서 간단해보이는 대회 발견 "수업 내용 좀 복기해서 분석 연습 좀 해보자" 하고 시작했다. 연습할 때는 코드가 빨리빨리 잘 쳐지는데 실전에선 항상 어떻게 해야 할 지 잘 모르겠다 .. 연습을 많이 해봐야겠지? 목표개인의 특성과 관련된 다양한 데이터를 활용하여 개인 소득 수준을 예측할 수 있는 AI 모델을 개발 데이터ID : 학습 데이터 고유 IDAge : 나이Gender : 성별Education_Status : 교육 상태Employment_Status : 고용 상태Working_Week(Yearly) : 연간 근무 주Industry_Status : 산업 상태Occupation_Status : 직업 상태Race : 인종Hispanic_Organic : 히스패닉 유무(히스패닉: 스페인어권 국가 출신 ..
Review Feature Representation : 연결된 것으로부터 새로운 feature들을 만듦 (재표현) Dense : 고수준 피처 개수 조절 Node : 피처 개수 조절 Image Data Augmentation 현실 세계에서는 가지고 있는 데이터가 매우 부족함 갖고있는 적은 데이터라도 최대한 활용하기 위해 augmentation 사용 Transfer Learning Augmentation의 한계 원본과 확연히 다른 새로운 특징은 만들어낼 수 없음 애초에 양과 질 모두 충족하는 적절한 데이터여야 학습에 도움이 됨 개인이 수집 불가능할 정도의 데이터 + 성능이 훌륭한 모델 구조와 가중치를 가진 모델을 가져와 사용 Pretrained Model : 가져온 그 상태 그대로 사용 Fine Tunin..
1. Linear Regression from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_absolute_error, r2_score 실젯값과의 오차가 최소가 되는 직선 y햇 = w0 +w1x1 w0 : 편향 w1 : 가중치(회귀 계수) 최선의 회귀모델 : 전체 데이터의 오차 합이 최소가 되는 모델 # 회귀계수 확인 model.coef_ model.intercept_ model.coef_ : 모델 가중치(회귀 계수) 확인 model.intercept_ : 편향 확인 단순 회귀(Simple Regression) 독립변수 하나가 종속변수에 영향을 미치는 선형회귀 x값 하나만으로 y값을 설명할 수 있는 경우 회귀식..