21 KiB
초보자를 위한 데이터 과학 - 커리큘럼
Microsoft의 Azure Cloud Advocates는 데이터 과학에 관한 10주, 20강의 커리큘럼을 제공합니다. 각 강의는 사전 및 사후 퀴즈, 강의를 완료하기 위한 서면 지침, 솔루션, 과제를 포함하고 있습니다. 프로젝트 기반 학습법을 통해 배우면서 실제로 만들어보는 방식은 새로운 기술을 효과적으로 익히는 검증된 방법입니다.
저자들에게 깊은 감사의 말씀을 드립니다: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 특별히 감사드립니다 🙏 Microsoft Student Ambassador 저자, 리뷰어 및 콘텐츠 기여자들, 특히 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
초보자를 위한 데이터 과학 - 스케치노트: @nitya |
🌐 다국어 지원
GitHub Action을 통한 지원 (자동화 및 항상 최신 상태)
프랑스어 | 스페인어 | 독일어 | 러시아어 | 아랍어 | 페르시아어 (파르시) | 우르두어 | 중국어 (간체) | 중국어 (번체, 마카오) | 중국어 (번체, 홍콩) | 중국어 (번체, 대만) | 일본어 | 한국어 | 힌디어 | 벵골어 | 마라티어 | 네팔어 | 펀자브어 (구르무키) | 포르투갈어 (포르투갈) | 포르투갈어 (브라질) | 이탈리아어 | 폴란드어 | 터키어 | 그리스어 | 태국어 | 스웨덴어 | 덴마크어 | 노르웨이어 | 핀란드어 | 네덜란드어 | 히브리어 | 베트남어 | 인도네시아어 | 말레이어 | 타갈로그어 (필리핀어) | 스와힐리어 | 헝가리어 | 체코어 | 슬로바키아어 | 루마니아어 | 불가리아어 | 세르비아어 (키릴) | 크로아티아어 | 슬로베니아어 | 우크라이나어 | 버마어 (미얀마)
추가 번역 언어를 원하시면 여기에서 확인하세요.
커뮤니티에 참여하세요
학생이신가요?
다음 리소스를 통해 시작해보세요:
- 학생 허브 페이지 이 페이지에서는 초보자를 위한 리소스, 학생 팩, 무료 인증 바우처를 얻는 방법 등을 찾을 수 있습니다. 이 페이지는 즐겨찾기에 추가하고 정기적으로 확인하세요. 콘텐츠는 최소 월 1회 변경됩니다.
- Microsoft Learn Student Ambassadors 글로벌 학생 앰배서더 커뮤니티에 참여하세요. Microsoft에 참여할 수 있는 기회가 될 수 있습니다.
시작하기
교사: 이 커리큘럼을 사용하는 방법에 대한 몇 가지 제안을 포함했습니다. 토론 포럼에서 피드백을 주시면 감사하겠습니다!
학생: 이 커리큘럼을 스스로 사용하려면, 전체 저장소를 포크하고 사전 강의 퀴즈부터 시작하여 스스로 연습 문제를 완료하세요. 강의를 읽고 나머지 활동을 완료하세요. 솔루션 코드를 복사하기보다는 강의를 이해하며 프로젝트를 만들어보세요. 하지만 솔루션 코드는 각 프로젝트 기반 강의의 /solutions 폴더에 제공됩니다. 또 다른 방법으로는 친구들과 스터디 그룹을 만들어 함께 콘텐츠를 학습하는 것도 좋습니다. 추가 학습을 위해 Microsoft Learn을 추천합니다.
팀 소개
Gif 제작: Mohit Jaisal
🎥 위 이미지를 클릭하면 프로젝트와 제작자들에 대한 비디오를 볼 수 있습니다!
교육 방법론
이 커리큘럼을 설계할 때 두 가지 교육 원칙을 채택했습니다: 프로젝트 기반 학습과 빈번한 퀴즈 포함. 이 시리즈가 끝날 때쯤 학생들은 데이터 과학의 기본 원칙, 윤리적 개념, 데이터 준비, 데이터 작업 방법, 데이터 시각화, 데이터 분석, 데이터 과학의 실제 사례 등을 배우게 됩니다.
또한, 수업 전 간단한 퀴즈는 학생이 주제에 집중하도록 도와주며, 수업 후 퀴즈는 학습 내용을 더 잘 기억하도록 돕습니다. 이 커리큘럼은 유연하고 재미있게 설계되었으며, 전체 또는 일부만 학습할 수 있습니다. 프로젝트는 작게 시작하여 10주 과정이 끝날 때쯤 점점 더 복잡해집니다.
각 강의는 다음을 포함합니다:
- 선택적 스케치노트
- 선택적 보충 영상
- 강의 전 워밍업 퀴즈
- 작성된 강의 자료
- 프로젝트 기반 강의의 경우, 프로젝트를 구축하는 단계별 가이드
- 지식 점검
- 도전 과제
- 추가 읽기 자료
- 과제
- 강의 후 퀴즈
퀴즈에 대한 참고 사항: 모든 퀴즈는 Quiz-App 폴더에 포함되어 있으며, 총 40개의 퀴즈가 각 3개의 질문으로 구성되어 있습니다. 퀴즈는 강의 내에서 링크로 연결되어 있지만, 퀴즈 앱은 로컬에서 실행하거나 Azure에 배포할 수 있습니다.
quiz-app
폴더의 지침을 따르세요. 퀴즈는 점진적으로 현지화되고 있습니다.
강의 목록
![]() |
---|
데이터 과학 초보자를 위한 로드맵 - @nitya의 스케치노트 |
강의 번호 | 주제 | 강의 그룹 | 학습 목표 | 연결된 강의 | 저자 |
---|---|---|---|---|---|
01 | 데이터 과학 정의 | 소개 | 데이터 과학의 기본 개념과 인공지능, 머신러닝, 빅데이터와의 관계를 학습합니다. | 강의 영상 | Dmitry |
02 | 데이터 과학 윤리 | 소개 | 데이터 윤리 개념, 도전 과제 및 프레임워크를 학습합니다. | 강의 | Nitya |
03 | 데이터 정의 | 소개 | 데이터가 어떻게 분류되는지와 일반적인 출처를 학습합니다. | 강의 | Jasmine |
04 | 통계 및 확률 소개 | 소개 | 데이터를 이해하기 위한 확률 및 통계의 수학적 기법을 학습합니다. | 강의 영상 | Dmitry |
05 | 관계형 데이터 작업 | 데이터 작업 | 관계형 데이터 소개 및 SQL(“씨퀄”로 발음됨)을 사용하여 관계형 데이터를 탐색하고 분석하는 기본 사항을 학습합니다. | 강의 | Christopher |
06 | NoSQL 데이터 작업 | 데이터 작업 | 비관계형 데이터의 다양한 유형과 문서 데이터베이스를 탐색하고 분석하는 기본 사항을 학습합니다. | 강의 | Jasmine |
07 | Python 작업 | 데이터 작업 | Pandas와 같은 라이브러리를 사용하여 데이터를 탐색하는 Python 사용의 기본 사항을 학습합니다. Python 프로그래밍에 대한 기초 이해가 권장됩니다. | 강의 영상 | Dmitry |
08 | 데이터 준비 | 데이터 작업 | 누락되거나 부정확하거나 불완전한 데이터를 처리하기 위한 데이터 정리 및 변환 기술에 대해 학습합니다. | 강의 | Jasmine |
09 | 수량 시각화 | 데이터 시각화 | Matplotlib을 사용하여 새 데이터 🦆를 시각화하는 방법을 학습합니다. | 강의 | Jen |
10 | 데이터 분포 시각화 | 데이터 시각화 | 구간 내 관찰 및 추세를 시각화합니다. | 강의 | Jen |
11 | 비율 시각화 | 데이터 시각화 | 개별 및 그룹화된 백분율을 시각화합니다. | 강의 | Jen |
12 | 관계 시각화 | 데이터 시각화 | 데이터 세트와 변수 간의 연결 및 상관관계를 시각화합니다. | 강의 | Jen |
13 | 의미 있는 시각화 | 데이터 시각화 | 효과적인 문제 해결 및 통찰력을 위한 시각화를 가치 있게 만드는 기술과 지침을 학습합니다. | 강의 | Jen |
14 | 데이터 과학 라이프사이클 소개 | 라이프사이클 | 데이터 과학 라이프사이클과 데이터 획득 및 추출의 첫 번째 단계에 대해 학습합니다. | 강의 | Jasmine |
15 | 분석 | 라이프사이클 | 데이터 과학 라이프사이클의 이 단계에서는 데이터를 분석하는 기술에 초점을 맞춥니다. | 강의 | Jasmine |
16 | 커뮤니케이션 | 라이프사이클 | 데이터 과학 라이프사이클의 이 단계에서는 데이터에서 얻은 통찰력을 의사 결정자가 이해하기 쉽게 제시하는 데 초점을 맞춥니다. | 강의 | Jalen |
17 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | 클라우드에서의 데이터 과학과 그 이점을 소개하는 강의 시리즈입니다. | 강의 | Tiffany 및 Maud |
18 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | 로우 코드 도구를 사용하여 모델을 훈련합니다. | 강의 | Tiffany 및 Maud |
19 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | Azure Machine Learning Studio를 사용하여 모델을 배포합니다. | 강의 | Tiffany 및 Maud |
20 | 실제 환경에서의 데이터 과학 | 실제 환경 | 실제 세계에서 데이터 과학 기반 프로젝트를 학습합니다. | 강의 | Nitya |
GitHub Codespaces
이 샘플을 Codespace에서 열려면 다음 단계를 따르세요:
- 코드 드롭다운 메뉴를 클릭하고 Codespaces로 열기 옵션을 선택합니다.
- 창 하단에서 + 새 Codespace를 선택합니다. 자세한 내용은 GitHub 문서를 확인하세요.
VSCode Remote - Containers
로컬 머신과 VSCode를 사용하여 VS Code Remote - Containers 확장을 통해 이 저장소를 컨테이너에서 열려면 다음 단계를 따르세요:
- 개발 컨테이너를 처음 사용하는 경우, 시스템이 사전 요구 사항을 충족하는지 확인하세요(예: Docker 설치). 시작 문서를 참조하세요.
이 저장소를 사용하려면 다음 중 하나를 선택하세요:
참고: 내부적으로, 이는 Remote-Containers: Clone Repository in Container Volume... 명령을 사용하여 소스 코드를 로컬 파일 시스템 대신 Docker 볼륨에 복제합니다. 볼륨은 컨테이너 데이터를 지속적으로 저장하는 데 선호되는 메커니즘입니다.
또는 로컬에 복제하거나 다운로드한 저장소를 엽니다:
- 이 저장소를 로컬 파일 시스템에 복제합니다.
- F1을 누르고 Remote-Containers: Open Folder in Container... 명령을 선택합니다.
- 복제된 폴더를 선택하고 컨테이너가 시작될 때까지 기다린 후 테스트를 진행합니다.
오프라인 액세스
Docsify를 사용하여 이 문서를 오프라인으로 실행할 수 있습니다. 이 저장소를 포크하고, 로컬 머신에 Docsify를 설치한 다음, 이 저장소의 루트 폴더에서 docsify serve
를 입력하세요. 웹사이트는 localhost의 포트 3000에서 제공됩니다: localhost:3000
.
참고, 노트북은 Docsify를 통해 렌더링되지 않으므로 노트북을 실행해야 할 때는 Python 커널을 실행하는 VS Code에서 별도로 실행하세요.
기타 커리큘럼
우리 팀은 다른 커리큘럼도 제작합니다! 확인해보세요:
- Generative AI for Beginners
- Generative AI for Beginners .NET
- Generative AI with JavaScript
- Generative AI with Java
- AI for Beginners
- Data Science for Beginners
- ML for Beginners
- Cybersecurity for Beginners
- Web Dev for Beginners
- IoT for Beginners
- XR Development for Beginners
- Mastering GitHub Copilot for Paired Programming
- Mastering GitHub Copilot for C#/.NET Developers
- Choose Your Own Copilot Adventure
면책 조항:
이 문서는 AI 번역 서비스 Co-op Translator를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있지만, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서의 원어 버전이 권위 있는 출처로 간주되어야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 당사는 책임을 지지 않습니다.