일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 그로스마케터
- 코테
- 리텐션
- 이전행
- SQL
- ABTest
- 특정컬럼
- 데이터분석가
- dataanalysis
- data
- WAU
- onehot
- DAU
- warehouser
- dataanalyst
- 전처리
- engagement
- pvalue
- 데이터분석
- 데이터가공
- categorical
- row추가
- 데이터
- Python
- 그룹
- 표본
- 통계
- INSERTINTO
- sql로데이터
- GTM
- Today
- Total
목록데이터 분석(data analyst) (6)
Meiren

학습 기록용 컨텐츠 복붗 및 요약한 내용임. 아래 참고 자료(링크)가 원본임 목차 1. p-value와 a/b test 1-1. 결과 해석 시 유의점 1-2. 가설검정 1-3. 두 가지 오류 1-4. p-value 1-5. 유의하지 않은 결과, 그 후 2. 문제 제기(결과 및 실험 과정에 대한) 2-1. 효과 크기를 무시한 유의성 검정 2-2. 적절한 표본 크기 정하기 2-3. 실험이 안 끝났는데 결과 살펴보기 2-4. 현실적인 문제 3. 결론 Summary p-value는 통계적 유의성 확보를 위한 도구이지, 실험 결과의 중요성을 평가하는 지표가 아니다. 실험 결과가 현실적으로 어떤 중요성을 갖는지 판단해야한다. 결과를 얼마나 믿을 수 있는지는 다음 문제다. 1. p-value와 a/b test 1-1..
A/B test 통계적 검정시 t - Test가 자주 사용됨 독립표본 t검정 사용의 조건 1. 독립성 - 두 그룹간 상호 독립성이 만족되어야 함 - MECE 2. 등분산성 - 두 그룹간의 분포가 동일하다 - python : 바틀렛 검정, 플리그너 검정, 레빈 검정 - 이분산인 경우, 이분산 t검정 (welch's test)로 대체하는 방법이 존재함 3. 정규성 - 이러한 통계적 검정 기준을 맞추다보면... 실제 데이터 중에 남는 데이터가 없다 - 그래서 이러한 기준을 완화한 유의미한 기준에 관한 논문이 나옴 아래의 수준에 든다면 어느정도 정규분포를 크게 벗어나지 않을 것으로 추정 - 왜도(skewness, 분포의 비대칭 정도) < 2 - 첨도(kurtosis, 분포의 꼬리부분의 길이와 중앙부분의 뾰족함에..
WAU(engagement) 분석에 필요한 쿼리문 출처 Engagement Analysis with SQL Navigate Tables SELECT * FROM tutorial.yammer_events e LIMIT 5 Event-level Aggregation (이벤트 레벨 분할) 1. engagement로 분류되는 이벤트 리스트 확인 SELECT DISTINCT event_name, event_type FROM tutorial.yammer_events ORDER BY event_type, event_name 2. 7월과 8월의 engagement 차이 추론 with one as( SELECT EXTRACT('month' FROM occurred_at) as month, count(event_name)..

이미지를 포함한 모든 내용의 출처는 태블로 기초 30분 완정 정복입니다. 개인 학습용으로 작성한 게시물입니다. 데이터 원본을 태블로에 연결하면 컬럼에 따라 필드 역할과 유형이 결정됨 역할(Role) : 필드는 차원 또는 측정값으로 역할이 부여됨 유형(type) : 필드의 유형은 자동으로 문자열, 정수, 날짜와 같은 타입이 설정됨 단 해당 유형은 다른 유형으로 변경이 가능함 태블로 기본 컨셉 측정값 : 기본적으로 숫자형식, 액션을 통해 집계가 되면서 한 덩어리로 만들어짐 자원 : 한 덩어리의 측정값을 어떻게 나누어서 볼 것인지 결정 1. 태블로에 데이터 업로드 좌측 상단 > 데이터(패널?) > '데이터 연결' > 파일에 연결 :엑셀 > 다운로드 한 데이터(엑셀) 선택 > 연결 좌측 > 시트 > 특정 시트(..
개인공부 필기용 블로그입니다 :) [데이터 분석] 컨텐츠 목차 1. 퍼널분석 1-1. AARRR 1-2. 리텐션 2. 코호트 2-1. 리텐션차트 3. A/B test 3-1. 신뢰구간 3-2. P-value 4. RFM 분석 배경 들어와서 여기저기 클릭도 하는데 왜 이 서비스를 그냥 두고 떠나는걸까? 1. 퍼널분석 1) 의미 시간의 흐름에 따라 유저의 유입과 이탈을 분석 사용자가 서비스를 사용하면서 마주하는 각 단계별 전환율을 숫자로 나타내는 것 유저들이 우리 서비스에 들어온 시점 ~ 서비스를 나가는 시점까지를 구간에 대한 데이터 분석하여 나가는 시점과 이유를 밝힘 2) 분석 포인트 이탈률이 높은 시점을 집중해서 분석하고 개선 3) Funnel 분석 특징 고품질 방문자 유입 경로 확인 가능함 변환 트래픽..