Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- dataanalyst
- 코테
- 리텐션
- 데이터분석가
- 데이터가공
- 통계
- GTM
- 표본
- warehouser
- SQL
- categorical
- data
- 이전행
- 그룹
- dataanalysis
- 그로스마케터
- ABTest
- DAU
- 데이터분석
- pvalue
- 전처리
- onehot
- row추가
- INSERTINTO
- sql로데이터
- engagement
- WAU
- 특정컬럼
- 데이터
- Python
Archives
- Today
- Total
목록categorical (1)
Meiren

Categorical Encoding 범주형 변수를 머신러닝에 사용하려면, numerical 변수로 바꿔야한다. 그 방법에는 2가지가 있다. - label encoding : 순서가 있을 때, 고유값의 개수가 많아 one-hot 의 경우 메모리 소비가 많을 때 - One-Hot Encoding : 순서가 없을 때, 고유값 개수가 많지 않아 효율적인 경우 Label Encoding 순서를 가진 categorical feature - 의미 : 범주형 변수를 수치형 변수로 변경하는 것 - 표현 : n개의 범주형 데이터를 0부터 n-1까지의 연속적 수치 데이터로 표현 - 유의 : 인코딩 결과가 수치적 차이를 의미하진 않음 LabelEncoder from sklearn.preprocessing import Lab..
머신러닝(machine learning)
2022. 11. 29. 16:05