Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 데이터
- 데이터가공
- ABTest
- dataanalyst
- dataanalysis
- 그룹
- engagement
- 이전행
- 데이터분석
- 데이터분석가
- 전처리
- categorical
- 특정컬럼
- INSERTINTO
- 그로스마케터
- DAU
- 표본
- 리텐션
- 통계
- warehouser
- SQL
- pvalue
- 코테
- sql로데이터
- onehot
- row추가
- WAU
- Python
- GTM
- data
Archives
- Today
- Total
Meiren
[데이터 분석] A/B test 통계적 검정 & t-test 전제 조건 본문
A/B test 통계적 검정시 t - Test가 자주 사용됨
독립표본 t검정 사용의 조건
1. 독립성
- 두 그룹간 상호 독립성이 만족되어야 함
- MECE
2. 등분산성
- 두 그룹간의 분포가 동일하다
- python : 바틀렛 검정, 플리그너 검정, 레빈 검정
- 이분산인 경우, 이분산 t검정 (welch's test)로 대체하는 방법이 존재함
3. 정규성
- 이러한 통계적 검정 기준을 맞추다보면... 실제 데이터 중에 남는 데이터가 없다
- 그래서 이러한 기준을 완화한 유의미한 기준에 관한 논문이 나옴
아래의 수준에 든다면 어느정도 정규분포를 크게 벗어나지 않을 것으로 추정
- 왜도(skewness, 분포의 비대칭 정도) < 2
- 첨도(kurtosis, 분포의 꼬리부분의 길이와 중앙부분의 뾰족함에 대한 정보) < 7
그렇다면
t-test는 무엇인가?
두 집단의 평균이 얼마나 다른지/ 다르다고 할 수 있는지 알아보는 테스트
t ?
그룹 간 평균 차이에 비례하는 변수
평균 차이가 클수록 큰 값을 가지는 변수
표본 평균 차이 / 불확실도
- 불확실도 : 확실도를 계산할 수 없으니, 불확실도로 나눠버림
- 평균차가 클 수록 t 값은 커진다.
- 불확실도가 적을 수록 t값은 커진다.
t-test의 종류
독립표본 : 두 그룹의 사람들이 전혀 다른 사람들
대응표본 : 두 그룹의 사람이 같은 사람이다. 뚜렷한 효과를 확인할 수 있다.
https://www.youtube.com/watch?v=mQXj456SWco
'데이터 분석(data analyst)' 카테고리의 다른 글
[데이터 분석] A/B test와 p-value 는 매번 같이 나오던데 대체 무엇인지 정리해보자(통계 유의성) (0) | 2023.01.16 |
---|---|
[SQL로 데이터분석] 1.주간활성유저(WAU) 감소 분석 - 2.WAU 분석 (0) | 2023.01.15 |
[시각화] 태블로 기초(Tableau/visualization) - 막대차트(bar chart) (1) | 2023.01.08 |
[데이터 분석] 프로덕트 분석 기법 - 기본(퍼널,AARRR,코호트,리텐션,A/B) (0) | 2023.01.08 |
분석에 어떠한 툴을 활용할지에 대한 판단(GA, Amplitude, Mixpanel) (0) | 2022.07.27 |