You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
1.6 KiB
1.6 KiB
데이터셋 분류
지침
이 과제의 프롬프트에 따라 다음 데이터 타입 중 하나로 데이터를 식별하고 분류합니다.
구조 유형: 구조화, 반구조화 또는 비구조화
값 유형: 정성적 또는 정량적
소스 유형: Primary 또는 Secondary
- 회사가 인수되었고, 현재 모회사가 있습니다. 데이터 과학자들은 모회사로부터 고객 전화번호 스프레드시트를 받았습니다.
구조 유형:
값 유형:
소스 유형:
- 스마트 워치는 착용자로부터 심박수 데이터를 수집하고 있으며 원시 데이터는 JSON 형식입니다.
구조 유형:
값 유형:
소스 유형:
- CSV 파일에 저장된 직원 사기의 직장 설문 조사.
구조 유형:
값 유형:
소스 유형:
- 천체 물리학자들은 우주 탐사선에 의해 수집된 은하 데이터베이스에 접근하고 있습니다. 데이터에는 각 은하에 있는 행성의 수가 포함됩니다.
구조 유형:
값 유형:
소스 유형:
- 개인 금융 앱은 API를 사용하여 사용자의 금융 계정에 연결하여 순자산을 계산합니다. 행과 열 형식으로 모든 거래를 볼 수 있으며 스프레드시트와 유사하게 보입니다.
구조 유형:
값 유형:
소스 유형:
기준표
모범 | 충분 | 개선 필요 |
---|---|---|
모든 구조, 값 및 소스를 올바르게 식별 | 모든 구조, 값 및 소스를 3개 모두 올바르게 식별 | 2개 이하의 모든 구조, 값 및 소스를 올바르게 식별 |