|
|
3 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 4 weeks ago | |
| 2-Working-With-Data | 4 weeks ago | |
| 3-Data-Visualization | 4 weeks ago | |
| 4-Data-Science-Lifecycle | 4 weeks ago | |
| 5-Data-Science-In-Cloud | 4 weeks ago | |
| 6-Data-Science-In-Wild | 4 weeks ago | |
| docs | 4 weeks ago | |
| examples | 4 weeks ago | |
| quiz-app | 4 weeks ago | |
| sketchnotes | 4 weeks ago | |
| .co-op-translator.json | 3 weeks ago | |
| AGENTS.md | 4 weeks ago | |
| CODE_OF_CONDUCT.md | 4 weeks ago | |
| CONTRIBUTING.md | 4 weeks ago | |
| INSTALLATION.md | 4 weeks ago | |
| README.md | 3 weeks ago | |
| SECURITY.md | 4 weeks ago | |
| SUPPORT.md | 4 weeks ago | |
| TROUBLESHOOTING.md | 4 weeks ago | |
| USAGE.md | 4 weeks ago | |
| for-teachers.md | 4 weeks ago | |
README.md
초보자를 위한 데이터 과학 - 커리큘럼
마이크로소프트의 Azure Cloud Advocates는 데이터 과학에 관한 10주간 20개의 강의로 구성된 커리큘럼을 기쁘게 제공합니다. 각 강의에는 강의 전후 퀴즈, 강의를 완성하는 데 도움이 되는 서면 지침, 솔루션, 과제가 포함되어 있습니다. 프로젝트 기반 교수법을 통해 배우면서 직접 구축할 수 있어, 새로운 기술을 '정착'시키는 입증된 방법입니다.
저자분들께 진심으로 감사드립니다: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 특별한 감사의 말씀을 전합니다 🙏 저희 Microsoft Student Ambassador 저자, 리뷰어, 콘텐츠 기여자분들께, 특히 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 초보자를 위한 데이터 과학 - @nitya 제작 스케치노트 |
🌐 다국어 지원
GitHub Action을 통한 지원 (자동화 및 항상 최신 상태 유지)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
로컬에서 클론하는 것을 선호하나요?
이 저장소는 50개 이상의 언어 번역을 포함하기 때문에 다운로드 크기가 상당히 커집니다. 번역 없이 클론 하려면 sparse checkout을 사용하세요:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'이렇게 하면 훨씬 빠른 다운로드로 코스를 완료하는 데 필요한 모든 것을 얻을 수 있습니다.
추가 번역 언어 지원을 원하시면 여기를 참조하세요
우리 커뮤니티에 참여하세요
우리는 현재 Discord에서 AI와 함께 배우는 시리즈를 진행 중입니다. 자세히 알아보고 2025년 9월 18일부터 30일까지 Learn with AI Series에서 함께하세요. GitHub Copilot을 데이터 과학에 활용하는 팁과 요령을 얻을 수 있습니다.
학생이신가요?
다음 자료에서 시작하세요:
- 학생 허브 페이지 이 페이지에는 초보자를 위한 자료, 학생팩, 무료 인증 바우처 받는 방법까지 포함되어 있습니다. 매달 콘텐츠를 교체하니 즐겨찾기에 추가하고 주기적으로 확인하세요.
- 마이크로소프트 학습 학생 대사 전 세계 학생 대사 커뮤니티에 참여하세요, 이것이 마이크로소프트에 들어갈 수 있는 길이 될 수 있습니다.
시작하기
📚 문서
- 설치 가이드 - 초보자를 위한 단계별 설정 안내
- 사용 가이드 - 예제 및 자주 사용하는 워크플로우
- 문제 해결 - 일반적인 문제 해결책
- 기여 안내 - 이 프로젝트에 기여하는 방법
- 교사를 위한 자료 - 교육 지침 및 교실 자료
👨🎓 학생들을 위해
완전 초보자: 데이터 과학이 처음이신가요? 초보자 친화적 예제부터 시작하세요! 이 간단하고 잘 주석이 달린 예제로 기본기를 익힌 후 전체 커리큘럼에 도전할 수 있습니다. 학생 여러분: 이 커리큘럼을 혼자 이용하려면, 저장소 전체를 포크한 뒤 강의 전 퀴즈부터 시작해 스스로 연습 문제를 완료하세요. 강의를 읽고 나머지 활동도 완료하세요. 솔루션 코드를 복사하기보다는 강의를 이해하여 직접 프로젝트를 만들어 보는 것이 좋습니다; 하지만 각 프로젝트 중심 강의의 /solutions 폴더에 솔루션 코드가 준비되어 있습니다. 또 다른 방법으로 친구들과 스터디 그룹을 만들어 함께 진행해도 좋습니다. 더 깊은 학습을 위해 Microsoft Learn을 추천합니다.
빠른 시작:
- 설치 가이드를 참고해 환경을 설정하세요
- 사용 가이드를 검토하여 커리큘럼 활용법을 배우세요
- 1강부터 순서대로 진행하세요
- 지원이 필요하면 Discord 커뮤니티에 참여하세요
👩🏫 교사들을 위해
교사분들: 이 커리큘럼 활용법에 대한 몇 가지 제안을 포함했습니다. 의견이 있으시면 토론 포럼에서 알려주세요!
팀 소개
Gif 제작자 Mohit Jaisal
🎥 위 이미지를 클릭하면 프로젝트와 이를 만든 사람들에 관한 영상을 볼 수 있습니다!
교수법
이 커리큘럼을 만들면서 두 가지 교육 원칙을 선택했습니다: 프로젝트 기반 교육과 빈번한 퀴즈 포함. 이 시리즈가 끝나면 학생들은 윤리 개념, 데이터 준비, 다양한 데이터 작업 방법, 데이터 시각화, 데이터 분석, 데이터 과학의 실제 사례 등 기본적인 데이터 과학 원리를 학습하게 됩니다.
또한, 수업 전의 낮은 부담 퀴즈는 학생이 학습 주제에 집중하도록 하며, 수업 후의 두 번째 퀴즈는 학습 내용을 더 잘 기억하도록 돕습니다. 이 커리큘럼은 유연하고 재미있게 설계되어 전체 또는 일부만 사용할 수 있습니다. 프로젝트는 작게 시작해 10주차에 점점 더 복잡해집니다.
각 수업에는 다음이 포함됩니다:
- 선택적 스케치노트
- 선택적 보조 영상
- 수업 전 준비 퀴즈
- 텍스트 수업 내용
- 프로젝트 기반 수업의 경우 프로젝트 구축 단계별 안내
- 학습 확인
- 도전 과제
- 보조 읽기 자료
- 과제
- 수업 후 퀴즈
퀴즈에 관한 안내: 모든 퀴즈는 Quiz-App 폴더에 있으며, 총 40개의 퀴즈가 각 3문제로 구성되어 있습니다. 수업 내에서 링크되어 있지만, 퀴즈 앱은 로컬에서 실행하거나 Azure에 배포할 수 있습니다.
quiz-app폴더 내 지침을 따르세요. 현재 점진적으로 현지화 작업이 진행 중입니다.
🎓 초보자 친화적 예제
데이터 과학이 처음인가요? 시작하는 데 도움이 되도록 간단하고 잘 주석 처리된 코드가 담긴 특별한 예제 디렉터리를 만들었습니다:
- 🌟 Hello World - 당신의 첫 번째 데이터 과학 프로그램
- 📂 데이터 로딩 - 데이터셋을 읽고 탐색하는 방법 배우기
- 📊 간단한 분석 - 통계 계산과 패턴 찾기
- 📈 기본 시각화 - 차트와 그래프 생성
- 🔬 실제 프로젝트 - 시작부터 완료까지 전체 워크플로우
각 예제에는 모든 단계를 설명하는 자세한 주석이 포함되어 있어 초보자에게 안성맞춤입니다!
👉 예제부터 시작하기 👈
수업 목록
![]() |
|---|
| 데이터 과학 초보자: 로드맵 - 스케치노트 by @nitya |
| 수업 번호 | 주제 | 수업 그룹 | 학습 목표 | 연결된 수업 | 저자 |
|---|---|---|---|---|---|
| 01 | 데이터 과학 정의 | 소개 | 데이터 과학의 기본 개념과 인공지능, 머신러닝, 빅데이터와의 연관성을 학습한다. | 수업 영상 | Dmitry |
| 02 | 데이터 과학 윤리 | 소개 | 데이터 윤리 개념, 도전과제 및 프레임워크. | 수업 | Nitya |
| 03 | 데이터 정의 | 소개 | 데이터가 어떻게 분류되고 일반적인 출처는 무엇인지. | 수업 | Jasmine |
| 04 | 통계와 확률 소개 | 소개 | 데이터 이해를 위한 확률과 통계의 수학적 기법. | 수업 영상 | Dmitry |
| 05 | 관계형 데이터 작업 | 데이터 작업 | 관계형 데이터 소개 및 관계형 데이터 탐색·분석 기초, SQL 사용법 (발음: ‘씨퀄’). | 수업 | Christopher |
| 06 | NoSQL 데이터 작업 | 데이터 작업 | 비관계형 데이터 소개, 다양한 유형 및 문서형 데이터베이스 탐색·분석 기초. | 수업 | Jasmine |
| 07 | Python으로 작업하기 | 데이터 작업 | Pandas 같은 라이브러리를 사용한 데이터 탐색을 위한 Python 기초. Python 프로그래밍 기본 이해 권장. | 수업 영상 | Dmitry |
| 08 | 데이터 준비 | 데이터 작업 | 결측, 부정확하거나 불완전한 데이터를 처리하기 위한 클리닝 및 변환 기술. | 수업 | Jasmine |
| 09 | 양 시각화 | 데이터 시각화 | Matplotlib을 활용해 조류 데이터를 시각화하는 방법 🦆 | 수업 | Jen |
| 10 | 데이터 분포 시각화 | 데이터 시각화 | 구간 내 관측값과 추세 시각화. | 수업 | Jen |
| 11 | 비율 시각화 | 데이터 시각화 | 이산 및 그룹별 퍼센트 시각화. | 수업 | Jen |
| 12 | 관계 시각화 | 데이터 시각화 | 데이터 집합과 변수 간 연결과 상관관계 시각화. | 수업 | Jen |
| 13 | 의미 있는 시각화 | 데이터 시각화 | 문제 해결과 통찰에 효과적인 시각화를 위한 기법과 안내. | 수업 | Jen |
| 14 | 데이터 과학 생애주기 소개 | 생애주기 | 데이터 과학 생애주기 및 첫 단계인 데이터 수집과 추출 소개. | 수업 | Jasmine |
| 15 | 분석 | 생애주기 | 데이터 과학 생애주기 중 데이터 분석 기술에 초점. | 수업 | Jasmine |
| 16 | 커뮤니케이션 | 생애주기 | 의사결정자가 이해하기 쉽게 데이터로부터 얻은 통찰을 전달하는 단계. | 수업 | Jalen |
| 17 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | 클라우드에서의 데이터 과학과 그 이점 소개. | 수업 | Tiffany 및 Maud |
| 18 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | Low Code 도구를 사용한 모델 훈련. | 수업 | Tiffany 및 Maud |
| 19 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | Azure Machine Learning Studio를 사용한 모델 배포. | 수업 | Tiffany 및 Maud |
| 20 | 야생에서의 데이터 과학 | 야생 | 현실 세계에서의 데이터 과학 주도 프로젝트. | 수업 | Nitya |
GitHub Codespaces
다음 절차에 따라 이 샘플을 Codespace에서 열 수 있습니다:
- Code 드롭다운 메뉴를 클릭하고 Open with Codespaces 옵션을 선택합니다.
- 패널 맨 아래에서 + New codespace를 선택합니다. 자세한 내용은 GitHub 문서를 참조하세요.
VSCode 원격 - 컨테이너
로컬 컴퓨터와 VSCode에서 VS Code Remote - Containers 확장 프로그램을 사용하여 이 저장소를 컨테이너에서 여는 방법은 다음과 같습니다:
- 개발 컨테이너를 처음 사용하는 경우, 시스템이 시작 가이드 문서에 명시된 사전 요구사항(예: Docker 설치)을 충족하는지 확인하세요.
이 저장소를 사용하려면 격리된 Docker 볼륨에서 저장소를 열 수 있습니다:
참고: 내부적으로 Remote-Containers: Clone Repository in Container Volume... 명령을 사용하여 소스 코드를 로컬 파일 시스템 대신 Docker 볼륨에 복제합니다. 볼륨은 컨테이너 데이터 영속성에 권장되는 방식입니다.
또는 로컬에서 클론하거나 다운로드한 저장소 버전을 열 수 있습니다:
- 이 저장소를 로컬 파일 시스템에 클론하세요.
- F1을 누르고 Remote-Containers: Open Folder in Container... 명령을 선택하세요.
- 클론한 폴더를 선택하고 컨테이너가 시작될 때까지 기다린 후 사용해보세요.
오프라인 접근
Docsify를 사용하여 이 문서를 오프라인에서 실행할 수 있습니다. 이 저장소를 포크하고, 로컬에 Docsify 설치 후, 루트 폴더에서 docsify serve를 입력하세요. 웹사이트가 localhost의 3000번 포트에서 실행됩니다: localhost:3000.
참고로 노트북은 Docsify를 통해 렌더링되지 않으므로, 노트북 실행이 필요할 때는 VS Code에서 Python 커널을 실행하여 별도로 진행하세요.
기타 커리큘럼
우리 팀은 다른 커리큘럼도 제작합니다! 확인해 보세요:
LangChain
Azure / Edge / MCP / Agents
생성 AI 시리즈
핵심 학습
코파일럿 시리즈
도움 받기
문제가 발생했나요? 자주 발생하는 문제에 대한 해결책은 문제 해결 가이드를 확인하세요.
AI 앱 개발 중 막히거나 질문이 생기면 MCP 관련 토론에 참여하세요. 질문이 환영받고 지식이 자유롭게 공유되는 지원 커뮤니티입니다.
제품 피드백이나 빌드 오류가 있으면 다음을 방문하세요:
면책 조항: 이 문서는 AI 번역 서비스 Co-op Translator를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있으나, 자동 번역에는 오류나 부정확성이 있을 수 있음을 양지해 주시기 바랍니다. 원문의 원어 문서가 권위 있는 출처로 간주되어야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 본 번역의 사용으로 인해 발생하는 오해나 잘못된 해석에 대해서는 당사가 책임지지 않습니다.



