일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- INSERTINTO
- WAU
- Python
- pvalue
- 데이터분석가
- ABTest
- warehouser
- 데이터분석
- row추가
- onehot
- 통계
- categorical
- dataanalyst
- 데이터
- 그룹
- 코테
- 그로스마케터
- 특정컬럼
- 전처리
- engagement
- 리텐션
- 이전행
- 표본
- DAU
- 데이터가공
- SQL
- GTM
- data
- sql로데이터
- dataanalysis
- Today
- Total
목록데이터분석 (11)
Meiren

구글태그매니저를 활용해 데이터를 수집하는 방법엔 여러가지가 있겠지만, 자바스크립트로 태그와 변수, 트리거를 설정해야하는 상황이라면 이 카테고리의 글이 많이 도움이 되실겁니다ㅎㅎ 다들 파이팅하세요!

학습 기록용 컨텐츠 복붗 및 요약한 내용임. 아래 참고 자료(링크)가 원본임 목차 1. p-value와 a/b test 1-1. 결과 해석 시 유의점 1-2. 가설검정 1-3. 두 가지 오류 1-4. p-value 1-5. 유의하지 않은 결과, 그 후 2. 문제 제기(결과 및 실험 과정에 대한) 2-1. 효과 크기를 무시한 유의성 검정 2-2. 적절한 표본 크기 정하기 2-3. 실험이 안 끝났는데 결과 살펴보기 2-4. 현실적인 문제 3. 결론 Summary p-value는 통계적 유의성 확보를 위한 도구이지, 실험 결과의 중요성을 평가하는 지표가 아니다. 실험 결과가 현실적으로 어떤 중요성을 갖는지 판단해야한다. 결과를 얼마나 믿을 수 있는지는 다음 문제다. 1. p-value와 a/b test 1-1..
A/B test 통계적 검정시 t - Test가 자주 사용됨 독립표본 t검정 사용의 조건 1. 독립성 - 두 그룹간 상호 독립성이 만족되어야 함 - MECE 2. 등분산성 - 두 그룹간의 분포가 동일하다 - python : 바틀렛 검정, 플리그너 검정, 레빈 검정 - 이분산인 경우, 이분산 t검정 (welch's test)로 대체하는 방법이 존재함 3. 정규성 - 이러한 통계적 검정 기준을 맞추다보면... 실제 데이터 중에 남는 데이터가 없다 - 그래서 이러한 기준을 완화한 유의미한 기준에 관한 논문이 나옴 아래의 수준에 든다면 어느정도 정규분포를 크게 벗어나지 않을 것으로 추정 - 왜도(skewness, 분포의 비대칭 정도) < 2 - 첨도(kurtosis, 분포의 꼬리부분의 길이와 중앙부분의 뾰족함에..
목차 1. Summary 2. PARTITION BY 2-1. 역할 2-2. 구문 2-3.사용예시 3. 그 외 순위구하는 함수 구문 1. Summary 대충 느낌은 아래와 같음 row_number + over + partition by == group by & order by & 순위 매겨줌 ROW_NUMBER() OVER() : ()안의 내용에서 순서/순위를 부여함 PRAITION BY : 순위를 매길 그룹을 구분해줌 2. PARTITION BY 2-1. 역할 그룹 내 순위 및 그룹 별 집계 구할 떄 사용 주로 집계함수() + over()과 함께 쓰인다. 2-2. 구문 SELECT 집계함수([컬럼명]) OVER (PARTITION BY [컬럼명]) FROM [테이블명] 2-3. 사용 예시 학급별 등수 ..
목차 1. with 란? 1-1. CTEs? 1-2. CTEs의 장점 2. 사용 예시 2-1. having & with 2-2. from subquery & with as 3. with 옵션 4. 임시 테이블과 유효기간 설정 1. WITH 란? CTEs의 문법이다 1-1. CTEs? withcommon table expressions 쿼리를 통해 만들어낸 임시적인 데이터 세트 WITH 테이블 이름 AS (테이블 만들 쿼리문) 1-2. CTEs의 장점 - subquery에 비해 가독성이 높음 - subquery와 달리 재사용이 가능함 - 반복된 쿼리에서 성능 높이기 위해 사용됨 - 임시테이블 생성(메모리 사용) - 장시간 걸리는 쿼리의 결과를 저장해두어 해당 결과(데이터)에 바로 액세스할 수 있도록함 + ..

포스트 내용 출처 데이터리안 SQL 실전 분석 How to use MODE MODE에서 SQL 에디터 사용하기 MODE > SQL Tutorial > Investigation a Drop in User Engagement(document) - The problem > view mode analysis > dot*3 > view query results in mode > click here to view the latest (user the latest data) > > dot*3 - view query results > (데이터 복사 : results > copy to clipboard > ) > SQL (Source code) : 대시보드 쿼리문 확인 위치 새로운 SQL 코드로 분석 및 결과 확인 방법..
포스트 내용의 출처 : 데이터리안 SQL 실전 분석 목차 1. Problem Backgound : 현상파악, 문제 인식 배경 2. Problem Definition : 문제 정의 3. Tables : 활용할 수 있는 데이터 정보 4. WAU query : 대시보드에 사용된 wau쿼리, 분석시 알아야 할 기본적 내용 다음글 : 주간활성유저(WAU) 감소 분석 - 2. MODE의 SQL 에디터 1. Problem Background (분석해야하는 이유) 주간활성유저의 수가 감소하고 있음 (대시보드를 통해 파악) user engagement DAU / WAU / MAU 특정 액션을 한 로그의 수 (이 프로젝트에서의 정의) having made some type of server call by interacti..

이미지를 포함한 모든 내용의 출처는 태블로 기초 30분 완정 정복입니다. 개인 학습용으로 작성한 게시물입니다. 데이터 원본을 태블로에 연결하면 컬럼에 따라 필드 역할과 유형이 결정됨 역할(Role) : 필드는 차원 또는 측정값으로 역할이 부여됨 유형(type) : 필드의 유형은 자동으로 문자열, 정수, 날짜와 같은 타입이 설정됨 단 해당 유형은 다른 유형으로 변경이 가능함 태블로 기본 컨셉 측정값 : 기본적으로 숫자형식, 액션을 통해 집계가 되면서 한 덩어리로 만들어짐 자원 : 한 덩어리의 측정값을 어떻게 나누어서 볼 것인지 결정 1. 태블로에 데이터 업로드 좌측 상단 > 데이터(패널?) > '데이터 연결' > 파일에 연결 :엑셀 > 다운로드 한 데이터(엑셀) 선택 > 연결 좌측 > 시트 > 특정 시트(..