목록공부 (55)
블로그
✨ 태블로 신병훈련소 3일차 정리 ✨ 매개변수계산, 필터 및 참조선에서 상수 값을 동적으로 바꿀 수 있는 변수매개변수 생성 > 계산식 생성 > 분석에 활용 대시보드 동작동적인 대시보드를 제작하기 위한 다양한 동작을 제공하고 있음필터, 하이라이트, URL로 이동, 특정 시트/대시보드로 이동, 시트에 있는 값을 이용해서 매개변수나 집합 값 변경 인터랙티브 시각화 및 대시보드 제작 1. 매개변수를 사용하여 측정값 변경 , 마크 색상 표현선택한 측정값을 기준으로 그래프 그리기 매개변수를 만들고 이걸 활용한 계산된 필드를 만들어야 매개변수를 활용한 시각화를 할 수 있음 2. 매개변수를 사용하여 측정값 변경하기 2열과 행에 들어갈 속성을 매개변수로 만들어서 동적으로 바꿀 수 있도록 함 원의 크기와 색상은 칼로리..
✨ 태블로 신병훈련소 2일차 정리 ✨ 계산식행 수준 계산식모든 행에 대해 계산 후 결과 값을 집계[수익] / [매출] 모든 행에 대해 결과 값이 실체화(materialized) 되기 때문에 처리 로직을 다시 실행할 필요가 없음열과 열의 연산 (+, -, *, /, %), 문자열 처리, 형 변환, 날짜/시간 계산 집계 수준 계산식각 필드 값을 집계 후에 계산SUM([수익]) / SUM([매출]) 뷰에 사용된 차원(정성적 값)에 따라 집계 값이 달라지기 때문에 Tableau 데이터 추출에서 실체화(materialized) 될 수 없음[집계 인수 및 집계되지 않은 인수를 이 함수와 혼합할 수 없습니다.] => 그냥 필드 값과 집계된 필드 값을 함께 사용하는 경우 발생하는 오류1. 워드 클라우드색상이 붉고 크기..
💫태블로 동작 원리 복습💫 필드는 차원(정성적인 값)과 측정값(정량적인 값)으로 구분된다.측정값은 차원을 기준으로 집계되어 표현된다.집계란?합계, 평균, 중앙값, 카운트, 최솟값, 최댓값, 백분위수, 표준편차, 분산 등하나의 측정값을 어떤 기준으로 집계하느냐에 따라 다양한 분석을 할 수 있음필드를 행 선반에 놓으면 Y축, 열 선반에 놓으면 X축에 표현된다.마크 선반에 있는 다양한 속성을 활용해 원하는 형태로 다양한 시각화를 할 수 있다.필요한 값은 필터 선반을 통해 필터링할 수 있다. => "필터 표시"를 사용하면 더 간편하게 필터링을 할 수 있다.1. 카테고리 별 평균 칼로리 & 평균 카페인막대 차트를 이용하는 이유?막대 차트는 값의 크기를 비교하는데 유용한 시각화이다.우리의 뇌는 크기나 너비보다는..
✨ 태블로 신병훈련소 1일차 정리 ✨ 태블로 및 Visual Analytics 소개 Tableau는 데이터 시각화 툴로 많이 알려져 있다.데이터 분석가 채용 공고를 봤을 때 자격요건에 시각화 툴에 대한 내용이 거의 포함되어 있기 때문에 데이터 분석가가 되기 위해서는 꼭 갖추어야 할 역량이다. 왜 데이터를 시각적으로 다루어야 할까 ?색상이나 사이즈와 같은 시각적인 요소를 데이터에 적용하면 내가 원하는 데이터를 더 빠르고 정확하게 찾아낼 수 있기 때문이다. 데이터 시각화(Data Visualization)는 데이터를 시각적으로 표현해내는 것을 말하는데, 태블로가 궁극적으로 하려는 것은 이 시각화를 분석 과정(Visual Analytics)에 녹여내는 것이다. 즉, 시각화가 결과물에서 끝나는 것이 아니고 분..
왜 언어 처리라고 하지 않고 자연어 처리라고 할까? 형식에 맞춰 쓰는 언어 : 형식 언어(대표적인 예는 프로그래밍 언어) 사람이 쓰는 말을 형식 언어와 구분하기 위해 자연어 처리라고 함 TF-IDF (term frequency-inverse document frequency) Document Summarization 문서를 읽지 않고도 문서를 요약하고 싶다 ! TF-IDF TF : 자주 등장하는 키워드는 이 문서의 중요한 키워드일거야 ! IDF : 너무 자주 등장하는 키워드는 이 문서만의 대표적인 특징이 될 수 없어 ! 특정 문서에서 키워드 등장 횟수 * (1 / 전체 문서에서 키워드 등장 횟수) TF(t, d) * IDF(t, D) t : 키워드 등장 횟수 d : 내가 보고있는 문서 D : 문서들의 전..
데이콘에서 간단해보이는 대회 발견 "수업 내용 좀 복기해서 분석 연습 좀 해보자" 하고 시작했다. 연습할 때는 코드가 빨리빨리 잘 쳐지는데 실전에선 항상 어떻게 해야 할 지 잘 모르겠다 .. 연습을 많이 해봐야겠지? 목표개인의 특성과 관련된 다양한 데이터를 활용하여 개인 소득 수준을 예측할 수 있는 AI 모델을 개발 데이터ID : 학습 데이터 고유 IDAge : 나이Gender : 성별Education_Status : 교육 상태Employment_Status : 고용 상태Working_Week(Yearly) : 연간 근무 주Industry_Status : 산업 상태Occupation_Status : 직업 상태Race : 인종Hispanic_Organic : 히스패닉 유무(히스패닉: 스페인어권 국가 출신 ..
YOLO v8이 요구하는 폴더 구조 Dataset 폴더 Train 폴더 images labels Test 폴더 images labels Yaml에 있어야 할 정보 train : train set images 폴더 경로 val : val set images 폴더 경로 nc : 클래스의 숫자 기입 names : ['클래스0', '클래스1', ...] 순서대로 기입 Colab과 연결되었을 떄, 가상 pc의 기본 경로 : /content/ UltraLystics 라이브러리 설치 후 import setting한 후 datasets_dir = /content/로 수정 roboflow에서 데이터셋 생성 image 업로드 후 클래스 정의 annotation, preprocessing, augmentation 수행
Object Detection 컴퓨터는 동영상을 프레임 단위로 인식함 물체 A가 오른쪽에서 왼쪽으로 이동하면 사람은 바로 인지할 수 있지만, 컴퓨터는 오른쪽 A와 왼쪽 A를 같은 것이라고 인지하지 못함 => 인식이 됐다가 안됐다가 함 Localization : 단 하나의 Object 위치를 Bounding Box로 지정하여 찾음 Object Detection : 여러 개의 Object들의 위치를 Bounding Box로 지정하여 찾음 Bounding Box 하나의 Object가 포함된 최소 크기 박스 구성 요소 : x, y(좌표), w, h(크기) => 모두 합쳐서 위치 정보라고 할 수 있음 Ground-truth Bounding Box : 정답 박스 Prediction Bounding Box : 모델이..