|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
Khoa học dữ liệu cho người mới bắt đầu - Chương trình giảng dạy
Các Chuyên gia Azure Cloud Advocates tại Microsoft rất vui được cung cấp một chương trình giảng dạy 10 tuần với 20 bài học xoay quanh chủ đề Khoa học Dữ liệu. Mỗi bài học bao gồm các bài kiểm tra trước và sau bài học, hướng dẫn bằng văn bản để hoàn thành bài học, giải pháp và một bài tập. Phương pháp giảng dạy dựa trên dự án giúp bạn vừa học vừa làm, một cách đã được chứng minh giúp các kỹ năng mới "bám sâu".
Xin gửi lời cảm ơn chân thành đến các tác giả của chúng tôi: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Lời cảm ơn đặc biệt 🙏 đến các tác giả, người đánh giá và những người đóng góp nội dung từ Đại sứ Sinh viên Microsoft, đặc biệt là Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Khoa học Dữ liệu cho Người mới Bắt đầu - Sketchnote bởi @nitya |
🌐 Hỗ trợ đa ngôn ngữ
Hỗ trợ qua GitHub Action (Tự động & Luôn Cập nhật)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Ưu tiên sao chép về máy?
Kho lưu trữ này bao gồm hơn 50 bản dịch ngôn ngữ, điều này làm tăng đáng kể kích thước tải xuống. Để sao chép mà không có bản dịch, hãy sử dụng sparse checkout:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'Điều này sẽ cung cấp cho bạn tất cả những gì cần thiết để hoàn thành khóa học với tốc độ tải xuống nhanh hơn nhiều.
Nếu bạn muốn hỗ trợ thêm các ngôn ngữ dịch, danh sách các ngôn ngữ được hỗ trợ được liệt kê tại đây
Tham gia Cộng đồng của chúng tôi
Chúng tôi có một chuỗi học tập trên Discord về AI đang diễn ra, tìm hiểu thêm và tham gia tại Chuỗi học với AI từ ngày 18 - 30 tháng 9 năm 2025. Bạn sẽ nhận được mẹo và thủ thuật sử dụng GitHub Copilot cho Khoa học Dữ liệu.
Bạn là sinh viên?
Bắt đầu với các tài nguyên sau:
- Trang Trung tâm Sinh viên Trong trang này, bạn sẽ tìm thấy tài nguyên cho người mới bắt đầu, gói Sinh viên và thậm chí cả cách nhận voucher chứng chỉ miễn phí. Đây là trang bạn muốn đánh dấu và kiểm tra thường xuyên vì chúng tôi thay đổi nội dung ít nhất hàng tháng.
- Đại sứ Sinh viên Microsoft Tham gia cộng đồng đại sứ sinh viên toàn cầu, đây có thể là con đường của bạn để vào Microsoft.
Bắt đầu
📚 Tài liệu
- Hướng dẫn Cài đặt - Hướng dẫn thiết lập từng bước dành cho người mới
- Hướng dẫn Sử dụng - Ví dụ và quy trình làm việc phổ biến
- Khắc phục sự cố - Giải pháp cho các vấn đề phổ biến
- Hướng dẫn Đóng góp - Cách đóng góp cho dự án này
- Dành cho Giáo viên - Hướng dẫn giảng dạy và tài nguyên lớp học
👨🎓 Dành cho Sinh viên
Người mới hoàn toàn: Mới bắt đầu với khoa học dữ liệu? Hãy bắt đầu với các ví dụ thân thiện cho người mới! Những ví dụ đơn giản, có chú thích rõ ràng này sẽ giúp bạn hiểu những kiến thức cơ bản trước khi đi sâu vào toàn bộ chương trình giảng dạy. Sinh viên: để sử dụng chương trình này một mình, hãy fork toàn bộ repo và hoàn thành các bài tập một mình, bắt đầu với bài kiểm tra trước bài giảng. Sau đó đọc bài giảng và hoàn thành các hoạt động còn lại. Hãy cố gắng tạo các dự án bằng cách hiểu bài học thay vì sao chép mã giải pháp; tuy nhiên, mã đó có sẵn trong thư mục /solutions trong mỗi bài học dựa trên dự án. Một ý tưởng khác là thành lập nhóm học với bạn bè và cùng nhau đi qua nội dung. Để học thêm, chúng tôi khuyến nghị Microsoft Learn.
Bắt đầu nhanh:
- Kiểm tra Hướng dẫn Cài đặt để thiết lập môi trường của bạn
- Xem lại Hướng dẫn Sử dụng để biết cách làm việc với chương trình giảng dạy
- Bắt đầu với Bài học 1 và làm tuần tự
- Tham gia cộng đồng Discord của chúng tôi để được hỗ trợ
👩🏫 Dành cho Giáo viên
Giáo viên: chúng tôi đã bao gồm một số đề xuất về cách sử dụng chương trình giảng dạy này. Chúng tôi rất mong nhận được phản hồi của bạn trong diễn đàn thảo luận của chúng tôi!
Gặp gỡ Đội ngũ
Gif bởi Mohit Jaisal
🎥 Nhấn vào hình ảnh bên trên để xem video về dự án và những người đã tạo ra nó!
Phương pháp giảng dạy
Chúng tôi đã lựa chọn hai nguyên tắc giáo dục khi xây dựng chương trình học này: đảm bảo rằng nó dựa trên dự án và có các bài kiểm tra ngắn thường xuyên. Vào cuối chuỗi bài học này, học viên sẽ hiểu được các nguyên lý cơ bản của khoa học dữ liệu, bao gồm các khái niệm đạo đức, chuẩn bị dữ liệu, các cách khác nhau để làm việc với dữ liệu, trực quan hóa dữ liệu, phân tích dữ liệu, các ví dụ thực tế về khoa học dữ liệu và nhiều hơn nữa.
Ngoài ra, một bài kiểm tra nhẹ trước lớp đặt mục tiêu học tập cho học viên về một chủ đề, trong khi một bài kiểm tra thứ hai sau lớp giúp củng cố kiến thức. Chương trình học này được thiết kế linh hoạt và thú vị, có thể học toàn bộ hoặc một phần. Các dự án bắt đầu nhỏ và trở nên phức tạp hơn dần đến cuối chu kỳ 10 tuần.
Tìm Bộ Quy Tắc Ứng Xử, Hướng dẫn Góp phần, Hướng dẫn Dịch thuật của chúng tôi. Chúng tôi hoan nghênh phản hồi xây dựng từ bạn!
Mỗi bài học bao gồm:
- Bản phác họa tùy chọn
- Video bổ sung tùy chọn
- Bài kiểm tra khởi động trước bài học
- Bài học viết
- Đối với các bài học theo dự án, hướng dẫn từng bước cách xây dựng dự án
- Kiểm tra kiến thức
- Một thử thách
- Đọc thêm bổ sung
- Bài tập
- Bài kiểm tra sau bài học
Lưu ý về các bài kiểm tra: Tất cả các bài kiểm tra nằm trong thư mục Quiz-App, tổng cộng 40 bài kiểm tra với mỗi bài gồm ba câu hỏi. Chúng được liên kết từ bên trong các bài học, nhưng ứng dụng kiểm tra có thể chạy cục bộ hoặc triển khai lên Azure; làm theo hướng dẫn trong thư mục
quiz-app. Các bài kiểm tra này đang dần được dịch địa phương hóa.
🎓 Ví dụ thân thiện với người mới bắt đầu
Mới làm quen với Khoa học Dữ liệu? Chúng tôi đã tạo một thư mục ví dụ đặc biệt với mã nguồn đơn giản, chú thích rõ ràng giúp bạn bắt đầu:
- 🌟 Hello World - Chương trình khoa học dữ liệu đầu tiên của bạn
- 📂 Tải Dữ liệu - Học cách đọc và khám phá bộ dữ liệu
- 📊 Phân tích Đơn giản - Tính toán thống kê và tìm mẫu
- 📈 Trực quan hóa Cơ bản - Tạo biểu đồ và đồ thị
- 🔬 Dự án Thực tế - Quy trình hoàn chỉnh từ đầu đến cuối
Mỗi ví dụ bao gồm chú thích chi tiết giải thích từng bước, rất phù hợp cho người mới bắt đầu tuyệt đối!
Các bài học
![]() |
|---|
| Khoa học Dữ liệu Dành cho Người Mới: Lộ trình - Phác họa bởi @nitya |
| Số Bài học | Chủ đề | Nhóm bài học | Mục tiêu học tập | Bài học liên kết | Tác giả |
|---|---|---|---|---|---|
| 01 | Định nghĩa Khoa học Dữ liệu | Giới thiệu | Tìm hiểu các khái niệm cơ bản về khoa học dữ liệu và cách nó liên quan đến trí tuệ nhân tạo, học máy và dữ liệu lớn. | bài học video | Dmitry |
| 02 | Đạo đức Khoa học Dữ liệu | Giới thiệu | Khái niệm, thách thức và khung đạo đức dữ liệu. | bài học | Nitya |
| 03 | Định nghĩa Dữ liệu | Giới thiệu | Cách phân loại dữ liệu và các nguồn phổ biến. | bài học | Jasmine |
| 04 | Giới thiệu về Thống kê & Xác suất | Giới thiệu | Các kỹ thuật toán học của xác suất và thống kê để hiểu dữ liệu. | bài học video | Dmitry |
| 05 | Làm việc với Dữ liệu Quan hệ | Làm việc với Dữ liệu | Giới thiệu về dữ liệu quan hệ và các kiến thức cơ bản về khám phá và phân tích dữ liệu quan hệ với Ngôn ngữ Truy vấn Cấu trúc, còn gọi là SQL (phát âm "xi-cquell"). | bài học | Christopher |
| 06 | Làm việc với Dữ liệu NoSQL | Làm việc với Dữ liệu | Giới thiệu về dữ liệu phi quan hệ, các loại khác nhau và các kiến thức cơ bản về khám phá và phân tích cơ sở dữ liệu tài liệu. | bài học | Jasmine |
| 07 | Làm việc với Python | Làm việc với Dữ liệu | Kiến thức cơ bản về sử dụng Python để khám phá dữ liệu với các thư viện như Pandas. Nên có kiến thức nền tảng lập trình Python. | bài học video | Dmitry |
| 08 | Chuẩn bị Dữ liệu | Làm việc với Dữ liệu | Các chủ đề về kỹ thuật làm sạch và biến đổi dữ liệu để xử lý các thách thức về dữ liệu bị thiếu, không chính xác hoặc không đầy đủ. | bài học | Jasmine |
| 09 | Trực quan hóa Số lượng | Trực quan hóa Dữ liệu | Học cách sử dụng Matplotlib để trực quan hóa dữ liệu về chim 🦆 | bài học | Jen |
| 10 | Trực quan hóa Phân phối Dữ liệu | Trực quan hóa Dữ liệu | Trực quan hóa các quan sát và xu hướng trong một khoảng. | bài học | Jen |
| 11 | Trực quan hóa Tỷ lệ Phần trăm | Trực quan hóa Dữ liệu | Trực quan hóa các tỷ lệ phần trăm rời rạc và nhóm. | bài học | Jen |
| 12 | Trực quan hóa Mối quan hệ | Trực quan hóa Dữ liệu | Trực quan hóa các kết nối và tương quan giữa các tập dữ liệu và các biến của chúng. | bài học | Jen |
| 13 | Trực quan hóa Ý nghĩa | Trực quan hóa Dữ liệu | Các kỹ thuật và hướng dẫn để làm cho trực quan hóa của bạn có giá trị nhằm giải quyết vấn đề hiệu quả và cung cấp cái nhìn sâu sắc. | bài học | Jen |
| 14 | Giới thiệu về Chu trình Khoa học Dữ liệu | Chu trình | Giới thiệu về chu trình khoa học dữ liệu và bước đầu tiên là thu thập và trích xuất dữ liệu. | bài học | Jasmine |
| 15 | Phân tích | Chu trình | Giai đoạn này trong chu trình khoa học dữ liệu tập trung vào các kỹ thuật phân tích dữ liệu. | bài học | Jasmine |
| 16 | Giao tiếp | Chu trình | Giai đoạn này trong chu trình khoa học dữ liệu tập trung vào việc trình bày các phát hiện từ dữ liệu theo cách giúp người ra quyết định dễ hiểu hơn. | bài học | Jalen |
| 17 | Khoa học Dữ liệu trên Đám mây | Dữ liệu Đám mây | Chuỗi bài học này giới thiệu khoa học dữ liệu trên đám mây và lợi ích của nó. | bài học | Tiffany và Maud |
| 18 | Khoa học Dữ liệu trên Đám mây | Dữ liệu Đám mây | Huấn luyện mô hình sử dụng công cụ Low Code. | bài học | Tiffany và Maud |
| 19 | Khoa học Dữ liệu trên Đám mây | Dữ liệu Đám mây | Triển khai mô hình với Azure Machine Learning Studio. | bài học | Tiffany và Maud |
| 20 | Khoa học Dữ liệu ngoài Thực tế | Ngoài Thực tế | Các dự án khoa học dữ liệu trong thế giới thực. | bài học | Nitya |
GitHub Codespaces
Thực hiện các bước sau để mở mẫu này trong Codespace:
- Nhấn vào menu thả xuống Code và chọn tùy chọn Mở với Codespaces.
- Chọn + New codespace ở dưới cùng của bảng điều khiển. Xem thêm thông tin tại tài liệu GitHub.
VSCode Remote - Containers
Thực hiện các bước sau để mở kho này trong container sử dụng máy cục bộ và VSCode với tiện ích Remote - Containers của VS Code:
- Nếu đây là lần đầu bạn dùng container phát triển, vui lòng đảm bảo hệ thống của bạn đáp ứng các yêu cầu (ví dụ đã cài Docker) trong tài liệu bắt đầu.
Để sử dụng kho này, bạn có thể mở kho trong một volume Docker cách ly:
Lưu ý: Về cơ bản, lệnh Remote-Containers: Clone Repository in Container Volume... sẽ được dùng để sao chép mã nguồn vào volume Docker thay vì hệ thống tập tin cục bộ. Volume là cơ chế ưu tiên để lưu trữ dữ liệu container.
Hoặc mở bản sao đã clone hoặc tải về trên máy:
- Clone kho này vào hệ thống tập tin cục bộ.
- Nhấn F1 và chọn lệnh Remote-Containers: Open Folder in Container....
- Chọn bản sao của thư mục này, chờ container khởi động và thử nghiệm.
Truy cập ngoại tuyến
Bạn có thể chạy tài liệu này ngoại tuyến bằng cách dùng Docsify. Fork kho này, cài đặt Docsify trên máy của bạn, sau đó trong thư mục gốc kho, gõ docsify serve. Trang web sẽ được phục vụ tại cổng 3000 trên localhost của bạn: localhost:3000.
Lưu ý, các notebook sẽ không được hiển thị qua Docsify, nên khi bạn cần chạy notebook, hãy làm điều đó riêng biệt trong VS Code chạy kernel Python.
Các chương trình học khác
Nhóm chúng tôi sản xuất các chương trình học khác! Xem thêm:
LangChain
Azure / Edge / MCP / Agents
Dòng AI Sinh tạo
Học Tập Cốt lõi
Dòng Copilot
Nhận Trợ giúp
Gặp sự cố? Kiểm tra Hướng dẫn Khắc phục sự cố của chúng tôi để tìm giải pháp cho các vấn đề phổ biến.
Nếu bạn bị mắc kẹt hoặc có bất kỳ câu hỏi nào về xây dựng ứng dụng AI. Tham gia cùng những học viên và nhà phát triển có kinh nghiệm trong các cuộc thảo luận về MCP. Đây là một cộng đồng hỗ trợ, nơi các câu hỏi được hoan nghênh và kiến thức được chia sẻ miễn phí.
Nếu bạn có phản hồi về sản phẩm hoặc lỗi trong quá trình xây dựng, vui lòng truy cập:
Tuyên bố từ chối trách nhiệm:
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI Co-op Translator. Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng bản dịch tự động có thể chứa lỗi hoặc sự không chính xác. Tài liệu gốc bằng ngôn ngữ nguyên bản nên được coi là nguồn chính xác và đáng tin cậy. Đối với thông tin quan trọng, nên sử dụng dịch vụ dịch thuật chuyên nghiệp do con người thực hiện. Chúng tôi không chịu trách nhiệm về bất kỳ sự hiểu lầm hay giải thích sai nào phát sinh từ việc sử dụng bản dịch này.



