일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Computer Vision
- 머신러닝
- productmarketfit
- OKR
- 언어지능딥러닝
- pmf
- DACON
- 데이콘
- omtm
- Market
- 데이터모델링
- tableau
- 자연어처리
- 시각화
- nlp
- dl
- 인공지능
- 태블로
- 데이터시각화
- 파인튜닝
- 그로스해킹
- fit
- 데이터분석
- ERD
- 딥러닝
- 모델링
- product
- 컴퓨터비전
- Today
- Total
목록전체 글 (77)
블로그

SaaS, IaaS 전성시대 !!Cloud Service대시보드, BIAttributionAnalyticsCRMData Integration & PipelineA/B test Cloud Service 4~5년 전에는 빅데이터 분석/관리할 환경을 만들기 위해 하둡과 스파크 먼저 시작했음하지만 최근에는 데이터 관리, 분석을 위한 환경을 클라우드 서비스에서 빌려 사용할 수 있는 환경이 잘 구축되어 있음대표 3사 : AWS, Azure, GCP : 3사 모두 기능이 상향평준화 됨 대시보드 / BI (Business Intelligence)SQL 문을 이용한 데이터 추출, 조회대시보드 구성 및 시각화우리 서비스 특성이나 예산의 제약을 고려해서 한 두 개 정도 사용하면 좋음 Attribution인스톨/가입 매체..

데이터 파이프라인 만들기Data Source 가져오고 -> Warehouse 만들고 -> 분석하기 편하게 전처리 해서 Data Mart 만들고 -> 데이터 활용데이터가 흐르는 Flow 만들기 => 데이터 파이프라인 구축 과정 데이터 파이프라인도 기획과 설계가 필요함 데이터 엔지니어와 데이터 분석가의 긴밀한 협업이 필요함 어떤 데이터가 필요한 지어떻게 수집할 지배치와 스트리밍을 어떻게 활용할 지(실시간 처리가 필요한 지)분석하기 편한 형태로 만들려면 어떤 전처리를 해야할 지대시보드 등 데이터 사용자를 위한 Visualization은 어떻게 할 지파이프라인 설계/구축을 위해 어느 정도의 리소스와 비용을 투자할 지 기술 Stack 선택은 개발자의 몫이지만, 데이터 사용자의 의견이 반영되어야 하는 것들이 훨씬..
등장 배경지금까지 AARRR 단계별로 어떤 지표를 볼 수 있는지 확인했음확인할 수 있는 지표가 엄청나게 많은데 모든 지표를 똑같은 비중으로 바라보고 관리할 것인가?제일 중요한 지표를 파악해야 함모든 지표를 관리하는 건 현실적으로 엄청난 리소스 낭비임 지표간 우선순위가 명확하지 않으면 서비스 방향을 directing 할 수 없음 지금 우리 서비스가 어디에 집중해야 하는지가 명확하지 않거나 부서별로 이것을 다르게 생각하고 있으면 안 됨이러한 측면에서 강조되는게 OMTMOne Metric That Matters = North Star Metric성장을 위해 지금 우리가 꼭 집중해야 하는 하나의 지표리소스 배분, 우선순위 의사결정의 기준이 되는 지표임"단 하나"라는 숫자에 매몰되지 말 것. 소수의 지표라고 생각..

1. Vanity metric (허무지표)Vanity metric vs. Actionable metric Vanity metric - make you feel good, but they don't offer clear guidance for what to do보면은 기분 좋은데 의사결정을 하거나 실적을 판단할 수 없는 지표쉽게 변화시킬 수 있음 (Easily manipulated)돈을 투자하거나 사용자들에게 노출해서 쉽게 변화 가능실제로 중요한 숫자들과는 크게 상관없음이 지표를 다른 사람들에게 얘기하면 열심히 일하는 것처럼 어필할 수 있음아예 의미가 없는 것은 아니지만 이로 인해 오도되지 않도록 조심해야 함 vanity metric을 측정 / 관리하는 사례는 주변에서 진짜 많이 볼 수 있음 Eg)Do..

1. 지표의 속성 이해하기Stock저량 - 데이터를 수집한 그 순간에 남아있는 특정 시점의 스냅샷Stock은 허무 지표인 경우가 많음 Eg) 누적 회원수, 누적 거래액, 누적 메시지 수 등Flow유량 - 시작과 끝이 있는, 특정한 시간 동안의 변화량대체로 의미있는 데이터는 Flow 데이터인 경우가 많음Eg) 1월 1일 가입자, 일 매출, 일 평균 메시지 수 2. 지표를 명확하게 정의하기MAU, 크로스셀과 같은 지표를 명확하게 정의하지 않으면 사람마다 생각하는 기준이 달라 혼란이 생김 !!모든 사람이 같은 지표 개선에 집중하기 위해서는 명확한 지표 정의가 우선되어야 함 3. 선행지표를 찾기머니볼 : 당시 타자를 판단하던 기준과는 다른 지표에 집중해서 구단을 성공으로 이끌어 냄But 이젠 출루율과 장타율이..

vlookup을 사용해서 사용자의 가입월 컬럼을 만든다. 가입월 컬럼까지 추가된 시트를 다시 피벗해서 분석을 진행했다 !가입월을 행으로, 월별 결제자 수와 가입월별 매출 합계를 값으로 두었다 .그 후에 이전에 retention 확인하면서 만들었던 시트에서 월별 가입자 수와 활동회원(12월 기준 잔존 회원수)을 가져왔다.가입자 수와 활동회원 수로 잔존율을 만들어낼 수 있는 건 이전 실습에서 배웠다 . 수식 써서 잔존율을 계산해준다 그다음 결제자 수를 활동회원 수로 나누어 결제 비율을 계산한다.ARPPU는 1월 가입자 매출합을 결제자수로 나눈 값이다. 조건부 서식 탭을 활용해서 막대그래프로 표현할 수 있다.이렇게 분석하면 다양한 요소들로 종합적인 판단을 할 수 있게 된다.

쌍체표본 t 검정은 같은 집단에서 두 시점 또는 두 조건에서 측정된 데이터의 평균을 비교할 때 사용하는 통계 검정이다.독립표본 t 검정과 달리 두 표본이 서로 연관있는 경우에 사용한다. [ 쌍체표본 T - 검정 공식 ]1) 각 쌍의 차이를 계산한다2) 차이의 평균과 표준오차를 구한다3) 평균차이를 표준오차로 나누어 t 검정통계량을 구한다 [ 쌍체표본 t-검정 vs 독립표본 t-검정 ]특징독립표본 t-검정쌍체표본 t-검정데이터 관계두 집단이 독립적두 집단이 종속적(쌍으로 연결됨)사용 예시두 그룹 간 평균 비교전후 또는 조건 간 평균 비교분산 고려equal_var 옵션 사용 가능분산 비교 불필요

11월 1~3일 사이에 사전 과제를 해야하는데DAE가 현업에서 자주 마주하는 업무를 간소화한 데이터 모델링 문제와 쿼리(SQL) 테스트라는 거임...그거 어떻게 하는건데... 그래서 ERD 실습 문제를 풀어보려고 합니다^^이 분이 올려둔 문제 5개를 풀어보려고 한다 https://rang22.tistory.com/21 [DB] 데이터 모델링 - ERD 실습 문제실습1. 학적과 수강신청 ▷ 학적과에는 각 과목을 강의하는 강사, 등록한 학생, 강의가 이루어지는 시간(여러개의 값) 및 장소 등의 데이터가 유지된다. ▷ 한 강사가 여러 개의 과목을 강의할 수rang22.tistory.com 실습1. 학적과 수강신청[ 업무 처리 규정 ]학적과에는 각 과목을 강의하는 강사, 등록한 학생, 강의가 이루어지는 시간..