일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 데이터분석
- 표본
- 그룹
- 데이터분석가
- 통계
- warehouser
- sql로데이터
- DAU
- onehot
- WAU
- dataanalyst
- GTM
- 전처리
- ABTest
- 특정컬럼
- 이전행
- 데이터
- engagement
- dataanalysis
- Python
- SQL
- 그로스마케터
- INSERTINTO
- data
- categorical
- pvalue
- 데이터가공
- 코테
- 리텐션
- row추가
- Today
- Total
목록그룹 (2)
Meiren
A/B test 통계적 검정시 t - Test가 자주 사용됨 독립표본 t검정 사용의 조건 1. 독립성 - 두 그룹간 상호 독립성이 만족되어야 함 - MECE 2. 등분산성 - 두 그룹간의 분포가 동일하다 - python : 바틀렛 검정, 플리그너 검정, 레빈 검정 - 이분산인 경우, 이분산 t검정 (welch's test)로 대체하는 방법이 존재함 3. 정규성 - 이러한 통계적 검정 기준을 맞추다보면... 실제 데이터 중에 남는 데이터가 없다 - 그래서 이러한 기준을 완화한 유의미한 기준에 관한 논문이 나옴 아래의 수준에 든다면 어느정도 정규분포를 크게 벗어나지 않을 것으로 추정 - 왜도(skewness, 분포의 비대칭 정도) < 2 - 첨도(kurtosis, 분포의 꼬리부분의 길이와 중앙부분의 뾰족함에..
목차 1. Summary 2. PARTITION BY 2-1. 역할 2-2. 구문 2-3.사용예시 3. 그 외 순위구하는 함수 구문 1. Summary 대충 느낌은 아래와 같음 row_number + over + partition by == group by & order by & 순위 매겨줌 ROW_NUMBER() OVER() : ()안의 내용에서 순서/순위를 부여함 PRAITION BY : 순위를 매길 그룹을 구분해줌 2. PARTITION BY 2-1. 역할 그룹 내 순위 및 그룹 별 집계 구할 떄 사용 주로 집계함수() + over()과 함께 쓰인다. 2-2. 구문 SELECT 집계함수([컬럼명]) OVER (PARTITION BY [컬럼명]) FROM [테이블명] 2-3. 사용 예시 학급별 등수 ..