|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
초보자를 위한 데이터 과학 - 교육 과정
마이크로소프트 Azure 클라우드 옹호자는 데이터 과학에 관한 10주, 20개의 수업 커리큘럼을 제공하게 되어 기쁩니다. 각 수업은 사전/사후 퀴즈, 수업 완료를 위한 서면 지침, 솔루션, 과제로 구성되어 있습니다. 프로젝트 기반 교수법을 통해 빌드하면서 학습할 수 있어 새로운 기술이 '잘 붙는' 입증된 방법입니다.
저자 여러분께 진심으로 감사드립니다: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 특별히 감사드립니다 🙏 Microsoft Student Ambassador 저자, 검토자 및 콘텐츠 기여자 분들께, 특히 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 초보자를 위한 데이터 과학 - @nitya의 스케치노트 |
🌐 다국어 지원
GitHub Action을 통해 지원됨 (자동 및 항상 최신 상태 유지)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
로컬로 클론하는 것을 선호하십니까?
이 저장소에는 50개 이상의 언어 번역이 포함되어 있어 다운로드 크기가 크게 증가합니다. 번역 없이 클론하려면 희소 체크아웃을 사용하세요:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'이를 통해 훨씬 빠른 다운로드로 수업을 완료하는 데 필요한 모든 자료를 얻을 수 있습니다.
추가 언어 지원을 원하시면 여기에서 목록을 확인하세요
커뮤니티에 참여하세요
우리는 Discord에서 AI와 함께하는 학습 시리즈를 진행 중이며, 2025년 9월 18일부터 30일까지 진행되는 Learn with AI Series에서 자세한 정보를 얻고 참여할 수 있습니다. 여기에서 GitHub Copilot을 데이터 과학에 활용하는 팁과 요령을 얻을 수 있습니다.
학생이신가요?
다음 자료로 시작하세요:
- 학생 허브 페이지 이 페이지에는 초보자를 위한 자료, 학생 패키지, 무료 인증 바우처 획득 방법 등이 포함되어 있습니다. 콘텐츠가 적어도 매달 교체되므로 즐겨찾기해두고 수시로 확인하는 것이 좋습니다.
- Microsoft Learn Student Ambassadors 전 세계 학생 대사 커뮤니티에 참여하여 Microsoft에 진입할 수 있는 기회를 얻으세요.
시작하기
📚 문서
- 설치 가이드 - 초보자를 위한 단계별 설치 지침
- 사용 가이드 - 예제 및 일반적인 작업 흐름
- 문제 해결 - 일반 문제 해결 방법
- 기여 가이드 - 프로젝트 기여 방법
- 교사용 - 교육 지침 및 교실 자료
👨🎓 학생용
완전 초보자: 데이터 과학이 처음인가요? 초보자 친화적 예제부터 시작하세요! 이 간단하고 주석이 잘 달린 예제를 통해 기본기를 이해한 뒤 전체 커리큘럼에 참여할 수 있습니다.
학생: 이 커리큘럼을 혼자서 사용하려면 전체 저장소를 포크한 뒤, 사전 강의 퀴즈부터 시작해 직접 문제를 해결하며 진행하세요. 강의를 읽고 나머지 활동을 완료하세요. 솔루션 코드를 복사하기보다는 수업 내용을 이해하고 직접 프로젝트를 만들어보는 것을 추천합니다. 각 프로젝트 중심의 수업별로 /solutions 폴더에 솔루션 코드가 제공됩니다. 또 다른 방법으로는 친구들과 스터디 그룹을 구성해 함께 콘텐츠를 학습하는 것입니다. 더 심도 있는 학습을 위해 Microsoft Learn을 권장합니다.
빠른 시작:
- 환경 설정을 위해 설치 가이드를 확인하세요
- 커리큘럼 작업 방법을 배우기 위해 사용 가이드를 검토하세요
- 1과부터 시작해 순서대로 진행하세요
- 지원을 위해 Discord 커뮤니티에 참여하세요
👩🏫 교사용
팀 소개
Gif 제작 Mohit Jaisal
🎥 위 이미지를 클릭하면 이 프로젝트와 그것을 만든 분들에 관한 비디오를 볼 수 있습니다!
교육 철학
이 커리큘럼을 만들면서 두 가지 교육 원칙을 선택했습니다: 프로젝트 기반 학습 보장과 빈번한 퀴즈 포함입니다. 이 시리즈가 끝나면 학생들은 데이터 과학의 기본 원칙들, 윤리적 개념, 데이터 준비, 다양한 데이터 작업 방법, 데이터 시각화, 데이터 분석, 데이터 과학의 실제 사용 사례 등 다양한 내용을 배울 것입니다.
또한 수업 전에 치르는 낮은 부담의 퀴즈는 학생들이 주제 학습에 집중하도록 동기를 부여하며, 수업 후의 두 번째 퀴즈는 학습 내용을 더욱 잘 기억하도록 도와줍니다. 이 커리큘럼은 유연하면서도 재미있게 설계되어 전체 또는 일부만 수강할 수 있습니다. 프로젝트는 처음에는 작은 규모로 시작하여 10주 과정이 끝날 때 쯤에는 점차 복잡해집니다.
각 수업에는 다음이 포함됩니다:
- 선택적 스케치노트
- 선택적 보조 비디오
- 수업 전 워밍업 퀴즈
- 서면 수업 자료
- 프로젝트 기반 수업의 경우, 프로젝트를 만드는 단계별 가이드
- 지식 점검
- 도전 과제
- 보충 읽을거리
- 과제
- 수업 후 퀴즈
퀴즈에 대한 안내: 모든 퀴즈는 Quiz-App 폴더에 포함되어 있으며, 총 40개의 퀴즈가 각 3문항으로 구성되어 있습니다. 수업 내에서 링크되어 있지만, 퀴즈 앱은 로컬에서 실행하거나 Azure에 배포할 수 있으며
quiz-app폴더의 지침을 따르세요. 점진적으로 현지화 작업도 진행 중입니다.
🎓 초보자 친화적 예제
데이터 과학이 처음인가요? 시작하는 데 도움을 주는 간단하고 주석이 잘 달린 코드가 담긴 특별한 예제 디렉터리를 만들었습니다:
- 🌟 Hello World - 첫 데이터 과학 프로그램
- 📂 데이터 불러오기 - 데이터셋 읽기 및 탐색 배우기
- 📊 간단한 분석 - 통계 계산과 패턴 찾기
- 📈 기본 시각화 - 차트와 그래프 만들기
- 🔬 실제 프로젝트 - 시작부터 끝까지 완성하는 워크플로우
각 예제에는 단계별로 자세한 주석이 포함되어 있어, 완전 초보자에게 적합합니다!
👉 예제부터 시작하기 👈
수업 목록
![]() |
|---|
| 데이터 과학 초보자를 위한 로드맵 - nitya 작성 스케치노트 |
| 수업 번호 | 주제 | 수업 그룹 | 학습 목표 | 링크된 수업 | 저자 |
|---|---|---|---|---|---|
| 01 | 데이터 과학 정의 | 소개 | 데이터 과학의 기본 개념과 인공지능, 머신러닝, 빅데이터와의 관계를 학습합니다. | 수업 비디오 | Dmitry |
| 02 | 데이터 과학 윤리 | 소개 | 데이터 윤리 개념, 도전 과제 및 프레임워크. | 수업 | Nitya |
| 03 | 데이터 정의 | 소개 | 데이터 분류 방법과 일반적인 출처. | 수업 | Jasmine |
| 04 | 통계 및 확률 입문 | 소개 | 데이터를 이해하기 위한 확률 및 통계의 수학적 기법. | 수업 비디오 | Dmitry |
| 05 | 관계형 데이터 다루기 | 데이터 다루기 | 관계형 데이터 소개 및 SQL(발음: 씨퀄)을 사용해 관계형 데이터를 탐색하고 분석하는 기초. | 수업 | Christopher |
| 06 | NoSQL 데이터 다루기 | 데이터 다루기 | 비관계형 데이터 소개, 다양한 유형 및 문서형 데이터베이스 탐색과 분석 기본. | 수업 | Jasmine |
| 07 | Python 작업 | 데이터 다루기 | Pandas 같은 라이브러리를 활용한 데이터 탐색에 필요한 Python 기본 사항. Python 프로그래밍 기초 이해 추천. | 수업 비디오 | Dmitry |
| 08 | 데이터 준비 | 데이터 다루기 | 누락되었거나 부정확하거나 불완전한 데이터를 처리하기 위한 데이터 정제 및 변환 기술 주제. | 수업 | Jasmine |
| 09 | 양 시각화 | 데이터 시각화 | Matplotlib를 사용해 새 데이터를 시각화하는 방법 배우기 🦆 | 수업 | Jen |
| 10 | 데이터 분포 시각화 | 데이터 시각화 | 구간 내 관측값과 추세 시각화. | 수업 | Jen |
| 11 | 비율 시각화 | 데이터 시각화 | 이산 및 그룹화된 백분율 시각화. | 수업 | Jen |
| 12 | 관계 시각화 | 데이터 시각화 | 데이터 세트와 변수 간 연결 및 상관관계 시각화. | 수업 | Jen |
| 13 | 의미 있는 시각화 | 데이터 시각화 | 효과적 문제 해결과 통찰을 위한 가치 있는 시각화를 만드는 기법과 안내. | 수업 | Jen |
| 14 | 데이터 과학 라이프사이클 소개 | 라이프사이클 | 데이터 과학 라이프사이클과 첫 단계인 데이터 수집 및 추출 소개. | 수업 | Jasmine |
| 15 | 분석하기 | 라이프사이클 | 데이터 과학 라이프사이클의 이 단계는 데이터를 분석하는 기술에 집중합니다. | 수업 | Jasmine |
| 16 | 커뮤니케이션 | 라이프사이클 | 데이터 과학 라이프사이클의 이 단계는 의사결정자가 쉽게 이해할 수 있도록 데이터로부터 도출된 통찰을 전달하는 데 집중합니다. | 수업 | Jalen |
| 17 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | 클라우드에서의 데이터 과학과 그 이점을 소개하는 시리즈. | 수업 | Tiffany and Maud |
| 18 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | 로우 코드 도구를 사용한 모델 학습. | 수업 | Tiffany and Maud |
| 19 | 클라우드에서의 데이터 과학 | 클라우드 데이터 | Azure Machine Learning Studio를 이용한 모델 배포. | 수업 | Tiffany and Maud |
| 20 | 현장 데이터 과학 | 현장 | 실제 세계에서의 데이터 과학 기반 프로젝트. | 수업 | Nitya |
GitHub Codespaces
이 샘플을 Codespace에서 열려면 다음 단계를 따르세요:
- 코드 드롭다운 메뉴를 클릭하고 "Open with Codespaces" 옵션을 선택합니다.
- 창 아래쪽에서 "+ New codespace"를 선택합니다. 자세한 내용은 GitHub 문서를 참고하세요.
VSCode 원격 - 컨테이너
로컬 머신과 VSCode의 원격 - 컨테이너 확장을 사용하여 이 저장소를 컨테이너에서 여는 방법:
- 처음 개발 컨테이너를 사용하는 경우 시작하기 문서에서 시스템 요구 사항(예: Docker 설치)을 확인하세요.
이 저장소를 사용하려면, 격리된 Docker 볼륨에 저장소를 열 수 있습니다:
참고: 내부적으로 Remote-Containers: Clone Repository in Container Volume... 명령을 사용하여 소스 코드를 로컬 파일 시스템이 아닌 Docker 볼륨에 복제합니다. 볼륨은 컨테이너 데이터를 지속시키는 권장 메커니즘입니다.
또는 저장소를 로컬에 클론하거나 다운로드한 뒤 열 수도 있습니다:
- 이 저장소를 로컬 파일 시스템에 클론하세요.
- F1 키를 누르고 Remote-Containers: Open Folder in Container... 명령을 선택하세요.
- 클론한 폴더를 선택하고, 컨테이너가 시작될 때까지 기다린 후 실행해보세요.
오프라인 접근
Docsify를 사용해 이 문서를 오프라인에서 실행할 수 있습니다. 이 저장소를 포크한 후, 로컬 머신에 Docsify를 설치하세요. 그리고 저장소 루트 폴더에서 docsify serve를 실행하면 웹사이트가 localhost의 3000번 포트에서 서빙됩니다: localhost:3000.
참고로, 노트북은 Docsify를 통해 렌더링되지 않으므로 노트북을 실행해야 할 때는 별도로 VS Code에서 Python 커널로 실행하세요.
다른 교육 과정들
저희 팀은 다른 교육 과정도 제작합니다! 확인해보세요:
LangChain
Azure / Edge / MCP / Agents
생성형 AI 시리즈
핵심 학습
코파일럿 시리즈
도움 받기
문제가 발생했나요? 일반적인 문제 해결 방법은 문제 해결 가이드에서 확인하세요.
AI 앱 개발 중에 막히거나 궁금한 점이 있으면 MCP에 대해 배우는 동료 학습자와 경험 많은 개발자들이 모인 토론에 참여하세요. 질문을 환영하고 지식을 자유롭게 공유하는 지원 커뮤니티입니다.
제품 피드백이나 빌드 중 오류가 있으면 다음을 방문하세요:
면책 조항:
이 문서는 AI 번역 서비스 Co-op Translator를 사용하여 번역되었습니다. 정확성을 위해 노력하였으나, 자동 번역에는 오류나 부정확한 부분이 있을 수 있음을 유의하시기 바랍니다. 원문 문서가 권위 있는 공식 자료로 간주되어야 합니다. 중요한 정보의 경우, 전문 인력의 번역을 권장합니다. 본 번역의 사용으로 발생하는 어떠한 오해나 잘못된 해석에 대해서도 책임을 지지 않습니다.



