Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- warehouser
- 전처리
- 이전행
- onehot
- data
- dataanalysis
- 코테
- 그룹
- ABTest
- 데이터가공
- 데이터
- GTM
- WAU
- categorical
- 표본
- DAU
- 특정컬럼
- Python
- dataanalyst
- 그로스마케터
- row추가
- SQL
- sql로데이터
- engagement
- INSERTINTO
- pvalue
- 데이터분석가
- 통계
- 데이터분석
- 리텐션
Archives
- Today
- Total
목록데이터가공 (1)
Meiren
[Big Data] 데이터 설계 및 파이프라인 for OCR
목차 1. 데이터 설계 목적 2. 파이프라인의 단계 및 유의점 1) 데이터 정의 2) 데이터 수량/단가/기간 설정 3) 작업자 모집 및 교육 4) 파일럿 프로젝트 진행 5) 프로젝트 진행 및 완료 1. 데이터 설계의 목적 OCR 서비스 구현을 위한 학습데이터셋 구축 2. 파이프라인의 단계 및 유의점 1) [외부] 필요한 데이터에 대한 정의 - 가공 조건 : 고객사와의 미팅을 통해 요구사항을 정의하고 협의함 - 특정 언어 가능 및 구사 정도 - 공백 제거 - 태깅 순서 재배열 등 - 유의점 : 추후 파일럿 프로젝트를 진행하여 결과데이터에 고객사의 니즈가 모두 포함되었는지 재확인이 필요함 2) [내/외부] 데이터 셋 수량/단가/기간 설정 2-1) 데이터 가공/생산하는데 드는 단가(비용) 측정 - 가공 조건에..
카테고리 없음
2023. 1. 20. 19:50