일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- dataanalysis
- WAU
- 특정컬럼
- 표본
- 데이터분석가
- 통계
- 전처리
- 데이터가공
- data
- 데이터분석
- 그로스마케터
- row추가
- categorical
- onehot
- GTM
- pvalue
- warehouser
- sql로데이터
- engagement
- 이전행
- 리텐션
- Python
- 코테
- SQL
- INSERTINTO
- ABTest
- 데이터
- DAU
- 그룹
- dataanalyst
- Today
- Total
목록data (4)
Meiren
목차 1. Summary 2. PARTITION BY 2-1. 역할 2-2. 구문 2-3.사용예시 3. 그 외 순위구하는 함수 구문 1. Summary 대충 느낌은 아래와 같음 row_number + over + partition by == group by & order by & 순위 매겨줌 ROW_NUMBER() OVER() : ()안의 내용에서 순서/순위를 부여함 PRAITION BY : 순위를 매길 그룹을 구분해줌 2. PARTITION BY 2-1. 역할 그룹 내 순위 및 그룹 별 집계 구할 떄 사용 주로 집계함수() + over()과 함께 쓰인다. 2-2. 구문 SELECT 집계함수([컬럼명]) OVER (PARTITION BY [컬럼명]) FROM [테이블명] 2-3. 사용 예시 학급별 등수 ..

이미지를 포함한 모든 내용의 출처는 태블로 기초 30분 완정 정복입니다. 개인 학습용으로 작성한 게시물입니다. 데이터 원본을 태블로에 연결하면 컬럼에 따라 필드 역할과 유형이 결정됨 역할(Role) : 필드는 차원 또는 측정값으로 역할이 부여됨 유형(type) : 필드의 유형은 자동으로 문자열, 정수, 날짜와 같은 타입이 설정됨 단 해당 유형은 다른 유형으로 변경이 가능함 태블로 기본 컨셉 측정값 : 기본적으로 숫자형식, 액션을 통해 집계가 되면서 한 덩어리로 만들어짐 자원 : 한 덩어리의 측정값을 어떻게 나누어서 볼 것인지 결정 1. 태블로에 데이터 업로드 좌측 상단 > 데이터(패널?) > '데이터 연결' > 파일에 연결 :엑셀 > 다운로드 한 데이터(엑셀) 선택 > 연결 좌측 > 시트 > 특정 시트(..
개인공부 필기용 블로그입니다 :) [데이터 분석] 컨텐츠 목차 1. 퍼널분석 1-1. AARRR 1-2. 리텐션 2. 코호트 2-1. 리텐션차트 3. A/B test 3-1. 신뢰구간 3-2. P-value 4. RFM 분석 배경 들어와서 여기저기 클릭도 하는데 왜 이 서비스를 그냥 두고 떠나는걸까? 1. 퍼널분석 1) 의미 시간의 흐름에 따라 유저의 유입과 이탈을 분석 사용자가 서비스를 사용하면서 마주하는 각 단계별 전환율을 숫자로 나타내는 것 유저들이 우리 서비스에 들어온 시점 ~ 서비스를 나가는 시점까지를 구간에 대한 데이터 분석하여 나가는 시점과 이유를 밝힘 2) 분석 포인트 이탈률이 높은 시점을 집중해서 분석하고 개선 3) Funnel 분석 특징 고품질 방문자 유입 경로 확인 가능함 변환 트래픽..
클래스 불균형을 해결하기 위한 다양한 샘플링 기법 under sampling - 다수의 클래스 데이터 제거하여 > 처리 속도 증대 - 클래스 오버랩 감소 - 데이터 제거로 인한 정보 손실 over sampling - 소수의 클래스 데이터 수를 증대시켜 불균형 해소\ - 데이터 중복 생성인해 -> overfitting 문제가 있음 - 데이터 증대에 따른 학습 시간 증대의 단점 RandomOverSampling - 소수 클래스 샘플을 랜덤하게 선택 > 그 수를 늘림 - 데이터가 단순히 복제됨 - 따라서 데이터의 값이 변하지 않고 수가 늘어 > 가중치가 높아짐 - 과적합 문제 야기 - 연속형 변수만 가능 SMOTE - oversampling - 소수 클래스에서 knn을 활용해 가상의 데이터 생성 - 각 샘플의..