|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
Khoa học dữ liệu cho người mới bắt đầu - Chương trình học
Azure Cloud Advocates tại Microsoft rất vui được cung cấp một chương trình học 10 tuần, 20 bài toàn về Khoa học Dữ liệu. Mỗi bài học bao gồm bài kiểm tra trước và sau bài học, hướng dẫn viết để hoàn thành bài học, lời giải và một bài tập. Phương pháp sư phạm dựa trên dự án của chúng tôi cho phép bạn học trong khi xây dựng, một cách đã được chứng minh để kỹ năng mới "bám" lâu hơn.
Xin cảm ơn chân thành tới các tác giả của chúng tôi: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Lời cảm ơn đặc biệt 🙏 tới các tác giả, người đánh giá và những người đóng góp nội dung thuộc Microsoft Student Ambassador, đáng chú ý có Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Khoa học dữ liệu cho người mới bắt đầu - Sketchnote bởi @nitya |
🌐 Hỗ trợ nhiều ngôn ngữ
Hỗ trợ qua GitHub Action (Tự động & Luôn cập nhật)
Tiếng Ả Rập | Tiếng Bengal | Tiếng Bungari | Tiếng Myanmar (Miến Điện) | Tiếng Trung (Giản thể) | Tiếng Trung (Phồn thể, Hồng Kông) | Tiếng Trung (Phồn thể, Ma Cao) | Tiếng Trung (Phồn thể, Đài Loan) | Tiếng Croatia | Tiếng Séc | Tiếng Đan Mạch | Tiếng Hà Lan | Tiếng Estonia | Tiếng Phần Lan | Tiếng Pháp | Tiếng Đức | Tiếng Hy Lạp | Tiếng Do Thái | Tiếng Hindi | Tiếng Hungary | Tiếng Indonesia | Tiếng Ý | Tiếng Nhật | Tiếng Kannada | Tiếng Hàn | Tiếng Litva | Tiếng Mã Lai | Tiếng Malayalam | Tiếng Marathi | Tiếng Nepal | Tiếng Pidgin Nigeria | Tiếng Na Uy | Tiếng Ba Tư (Farsi) | Tiếng Ba Lan | Tiếng Bồ Đào Nha (Brazil) | Tiếng Bồ Đào Nha (Bồ Đào Nha) | Tiếng Punjabi (Gurmukhi) | Tiếng Romania | Tiếng Nga | Tiếng Serbia (Cyrillic) | Tiếng Slovakia | Tiếng Slovenia | Tiếng Tây Ban Nha | Tiếng Swahili | Tiếng Thụy Điển | Tiếng Tagalog (Filipino) | Tiếng Tamil | Tiếng Telugu | Tiếng Thái | Tiếng Thổ Nhĩ Kỳ | Tiếng Ukraina | Tiếng Urdu | Tiếng Việt
Nếu bạn muốn có thêm các ngôn ngữ dịch được hỗ trợ, các ngôn ngữ được liệt kê ở đây
Tham gia cộng đồng của chúng tôi
Chúng tôi đang có chuỗi Discord "Học cùng AI", tìm hiểu thêm và tham gia với chúng tôi tại Chuỗi Học cùng AI từ 18 - 30 tháng 9, 2025. Bạn sẽ nhận được mẹo và thủ thuật khi sử dụng GitHub Copilot cho Khoa học Dữ liệu.
Bạn có phải là sinh viên?
Bắt đầu với các tài nguyên sau:
- Trang Student Hub Tại trang này, bạn sẽ tìm thấy tài nguyên cho người mới bắt đầu, bộ gói dành cho sinh viên và thậm chí cả cách để nhận voucher chứng chỉ miễn phí. Đây là một trang bạn nên đánh dấu và kiểm tra theo thời gian vì chúng tôi thay đổi nội dung ít nhất hàng tháng.
- Microsoft Learn Student Ambassadors Tham gia một cộng đồng toàn cầu của các đại sứ sinh viên, đây có thể là con đường của bạn vào Microsoft.
Bắt đầu
📚 Tài liệu
- Hướng dẫn cài đặt - Hướng dẫn thiết lập từng bước cho người mới bắt đầu
- Hướng dẫn sử dụng - Ví dụ và quy trình làm việc phổ biến
- Khắc phục sự cố - Giải pháp cho các vấn đề thường gặp
- Hướng dẫn đóng góp - Cách đóng góp cho dự án này
- Dành cho giáo viên - Hướng dẫn giảng dạy và tài nguyên cho lớp học
👨🎓 Dành cho sinh viên
Người mới hoàn toàn: Mới với khoa học dữ liệu? Bắt đầu với các ví dụ thân thiện cho người mới bắt đầu! Những ví dụ đơn giản, có chú thích rõ ràng này sẽ giúp bạn hiểu các khái niệm cơ bản trước khi đi sâu vào toàn bộ chương trình học. Sinh viên: để sử dụng chương trình học này một mình, hãy fork toàn bộ repo và hoàn thành các bài tập một mình, bắt đầu với bài kiểm tra trước bài giảng. Sau đó đọc bài giảng và hoàn thành các hoạt động còn lại. Cố gắng tạo các dự án bằng cách hiểu các bài học thay vì sao chép mã lời giải; tuy nhiên, mã đó có sẵn trong thư mục /solutions trong mỗi bài học hướng dự án. Một ý tưởng khác là thành lập nhóm học với bạn bè và cùng nhau đi qua nội dung. Để học sâu hơn, chúng tôi đề xuất Microsoft Learn.
Bắt đầu nhanh:
- Kiểm tra Hướng dẫn cài đặt để thiết lập môi trường của bạn
- Xem lại Hướng dẫn sử dụng để học cách làm việc với chương trình học
- Bắt đầu với Bài học 1 và tiến hành theo thứ tự
- Tham gia cộng đồng Discord của chúng tôi để được hỗ trợ
👩🏫 Dành cho giáo viên
Giáo viên: chúng tôi đã bao gồm một vài đề xuất về cách sử dụng chương trình học này. Chúng tôi rất mong nhận được phản hồi của bạn trong diễn đàn thảo luận của chúng tôi!
Gặp gỡ đội ngũ
Gif bởi Mohit Jaisal
🎥 Nhấn vào hình ở trên để xem video về dự án và những người đã tạo ra nó!
Phương pháp giảng dạy
Chúng tôi đã chọn hai nguyên tắc sư phạm khi xây dựng chương trình này: đảm bảo rằng nó dựa trên dự án và bao gồm các bài kiểm tra thường xuyên. Vào cuối chuỗi này, học viên sẽ học được các nguyên tắc cơ bản của khoa học dữ liệu, bao gồm các khái niệm đạo đức, chuẩn bị dữ liệu, các cách khác nhau để làm việc với dữ liệu, trực quan hóa dữ liệu, phân tích dữ liệu, các trường hợp sử dụng thực tế của khoa học dữ liệu và hơn thế nữa.
Ngoài ra, một bài kiểm tra ít áp lực trước giờ học giúp học viên đặt mục tiêu học tập cho chủ đề, trong khi một bài kiểm tra thứ hai sau giờ học đảm bảo sự ghi nhớ lâu hơn. Chương trình này được thiết kế linh hoạt và vui nhộn và có thể học toàn bộ hoặc theo phần. Các dự án bắt đầu nhỏ và trở nên phức tạp hơn vào cuối chu kỳ 10 tuần.
Tìm Bộ quy tắc ứng xử, Đóng góp, Dịch thuật hướng dẫn. Chúng tôi hoan nghênh phản hồi mang tính xây dựng của bạn!
Mỗi bài học bao gồm:
- Sketchnote tùy chọn
- Video bổ sung tùy chọn
- Bài kiểm tra khởi động trước bài học
- Bài học bằng văn bản
- Đối với các bài học dựa trên dự án, hướng dẫn từng bước về cách xây dựng dự án
- Kiểm tra kiến thức
- Một thử thách
- Tài liệu tham khảo bổ sung
- Bài tập
- Bài kiểm tra sau bài học
Ghi chú về các bài kiểm tra: Tất cả các bài kiểm tra được chứa trong thư mục Quiz-App, tổng cộng 40 bài kiểm tra, mỗi bài gồm ba câu hỏi. Chúng được liên kết trong các bài học, nhưng ứng dụng kiểm tra có thể chạy cục bộ hoặc triển khai lên Azure; làm theo hướng dẫn trong thư mục
quiz-app. Chúng đang dần được bản địa hóa.
🎓 Ví dụ dành cho người mới bắt đầu
Mới làm quen với Khoa học Dữ liệu? Chúng tôi đã tạo một thư mục ví dụ đặc biệt với mã đơn giản, có chú thích rõ ràng để giúp bạn bắt đầu:
- 🌟 Hello World - Chương trình khoa học dữ liệu đầu tiên của bạn
- 📂 Loading Data - Học cách đọc và khám phá các bộ dữ liệu
- 📊 Simple Analysis - Tính toán các thống kê và tìm các mô hình
- 📈 Basic Visualization - Tạo biểu đồ và đồ thị cơ bản
- 🔬 Real-World Project - Quy trình làm việc hoàn chỉnh từ đầu đến cuối
Mỗi ví dụ bao gồm các chú thích chi tiết giải thích từng bước, khiến nó hoàn hảo cho người mới hoàn toàn!
Bài học
![]() |
|---|
| Khoa học Dữ liệu cho Người mới bắt đầu: Lộ trình - Sketchnote bởi @nitya |
| Số bài học | Chủ đề | Nhóm bài học | Mục tiêu học tập | Bài học liên kết | Tác giả |
|---|---|---|---|---|---|
| 01 | Định nghĩa Khoa học Dữ liệu | Giới thiệu | Tìm hiểu các khái niệm cơ bản về khoa học dữ liệu và cách nó liên quan đến trí tuệ nhân tạo, máy học, và dữ liệu lớn. | bài học video | Dmitry |
| 02 | Đạo đức Khoa học Dữ liệu | Giới thiệu | Các khái niệm, thách thức & khung về đạo đức dữ liệu. | bài học | Nitya |
| 03 | Định nghĩa Dữ liệu | Giới thiệu | Dữ liệu được phân loại như thế nào và các nguồn phổ biến của nó. | bài học | Jasmine |
| 04 | Giới thiệu về Thống kê & Xác suất | Giới thiệu | Các kỹ thuật toán học của xác suất và thống kê để hiểu dữ liệu. | bài học video | Dmitry |
| 05 | Làm việc với Dữ liệu Quan hệ | Làm việc với dữ liệu | Giới thiệu về dữ liệu quan hệ và những kiến thức cơ bản để khám phá và phân tích dữ liệu quan hệ với Structured Query Language, còn được gọi là SQL (phát âm “see-quell”). | bài học | Christopher |
| 06 | Làm việc với Dữ liệu NoSQL | Làm việc với dữ liệu | Giới thiệu về dữ liệu phi quan hệ, các loại khác nhau và kiến thức cơ bản để khám phá và phân tích cơ sở dữ liệu dạng tài liệu. | bài học | Jasmine |
| 07 | Làm việc với Python | Làm việc với dữ liệu | Những điều cơ bản về sử dụng Python để khám phá dữ liệu với các thư viện như Pandas. Nên có hiểu biết nền tảng về lập trình Python. | bài học video | Dmitry |
| 08 | Chuẩn bị Dữ liệu | Làm việc với dữ liệu | Các chủ đề về kỹ thuật xử lý dữ liệu để làm sạch và biến đổi dữ liệu nhằm xử lý các thách thức như thiếu, không chính xác hoặc không đầy đủ. | bài học | Jasmine |
| 09 | Trực quan hóa Số lượng | Data Visualization | Học cách sử dụng Matplotlib để trực quan hóa dữ liệu chim 🦆 | bài học | Jen |
| 10 | Trực quan hóa Phân phối Dữ liệu | Data Visualization | Trực quan hóa các quan sát và xu hướng trong một khoảng. | bài học | Jen |
| 11 | Trực quan hóa Tỷ lệ | Data Visualization | Trực quan hóa phần trăm rời rạc và nhóm. | bài học | Jen |
| 12 | Trực quan hóa Mối quan hệ | Data Visualization | Trực quan hóa các kết nối và tương quan giữa các tập dữ liệu và các biến của chúng. | bài học | Jen |
| 13 | Trực quan hóa Có ý nghĩa | Data Visualization | Kỹ thuật và hướng dẫn để làm cho biểu đồ của bạn có giá trị cho việc giải quyết vấn đề và rút ra nhận định hiệu quả. | bài học | Jen |
| 14 | Giới thiệu về vòng đời Khoa học Dữ liệu | Lifecycle | Giới thiệu về vòng đời khoa học dữ liệu và bước đầu tiên là thu thập và trích xuất dữ liệu. | bài học | Jasmine |
| 15 | Phân tích | Lifecycle | Giai đoạn này của vòng đời khoa học dữ liệu tập trung vào các kỹ thuật để phân tích dữ liệu. | bài học | Jasmine |
| 16 | Truyền đạt | Lifecycle | Giai đoạn này của vòng đời khoa học dữ liệu tập trung vào trình bày những hiểu biết từ dữ liệu theo cách giúp người ra quyết định dễ hiểu hơn. | bài học | Jalen |
| 17 | Khoa học Dữ liệu trên Đám mây | Dữ liệu trên Đám mây | Loạt bài này giới thiệu khoa học dữ liệu trên đám mây và những lợi ích của nó. | bài học | Tiffany and Maud |
| 18 | Khoa học Dữ liệu trên Đám mây | Dữ liệu trên Đám mây | Huấn luyện mô hình sử dụng công cụ Low Code. | bài học | Tiffany and Maud |
| 19 | Khoa học Dữ liệu trên Đám mây | Dữ liệu trên Đám mây | Triển khai mô hình với Azure Machine Learning Studio. | bài học | Tiffany and Maud |
| 20 | Khoa học Dữ liệu trong Thực tế | In the Wild | Các dự án được thúc đẩy bởi khoa học dữ liệu trong thế giới thực. | bài học | Nitya |
GitHub Codespaces
Làm theo các bước sau để mở ví dụ này trong một Codespace:
- Nhấp vào menu Code và chọn tùy chọn Open with Codespaces.
- Chọn + New codespace ở cuối ngăn. Để biết thêm thông tin, xem tài liệu GitHub.
VSCode Remote - Containers
Làm theo các bước sau để mở repo này trong một container bằng máy cục bộ của bạn và VSCode sử dụng phần mở rộng VS Code Remote - Containers:
- Nếu đây là lần đầu bạn sử dụng một development container, vui lòng đảm bảo hệ thống của bạn đáp ứng các yêu cầu trước (ví dụ đã cài Docker) trong tài liệu bắt đầu.
Để sử dụng kho lưu trữ này, bạn có thể mở kho lưu trữ trong một Docker volume riêng biệt:
Lưu ý: Ở tầng dưới, điều này sẽ sử dụng lệnh Remote-Containers: Clone Repository in Container Volume... để sao chép mã nguồn vào một Docker volume thay vì hệ thống tệp cục bộ. Volumes là cơ chế được ưu tiên để lưu trữ dữ liệu của container.
Hoặc mở một bản sao đã clone hoặc tải xuống trên máy của bạn:
- Sao chép kho lưu trữ này vào hệ thống tệp cục bộ của bạn.
- Nhấn F1 và chọn lệnh Remote-Containers: Open Folder in Container....
- Chọn bản sao đã clone của thư mục này, chờ container khởi động, và thử nghiệm.
Truy cập ngoại tuyến
Bạn có thể chạy tài liệu này ngoại tuyến bằng cách sử dụng Docsify. Fork repo này, cài Docsify trên máy cục bộ của bạn, sau đó trong thư mục gốc của repo này, gõ docsify serve. Website sẽ được phục vụ trên cổng 3000 tại localhost của bạn: localhost:3000.
Lưu ý, notebook sẽ không được hiển thị qua Docsify, vì vậy khi bạn cần chạy một notebook, hãy làm điều đó riêng trong VS Code đang chạy kernel Python.
Các chương trình giảng dạy khác
Nhóm của chúng tôi còn tạo các chương trình giảng dạy khác! Xem:
LangChain
Azure / Edge / MCP / Agents
Chuỗi AI Tạo sinh
Nội dung Cốt lõi
Chuỗi Copilot
Nhận Trợ giúp
Gặp sự cố? Hãy xem Hướng dẫn Khắc phục Sự cố để tìm giải pháp cho các vấn đề thường gặp.
Nếu bạn bị mắc kẹt hoặc có bất kỳ câu hỏi nào về việc xây dựng ứng dụng AI. Hãy tham gia cùng những người học khác và các nhà phát triển có kinh nghiệm trong các thảo luận về MCP. Đây là một cộng đồng hỗ trợ nơi các câu hỏi được chào đón và kiến thức được chia sẻ tự do.
Nếu bạn có phản hồi về sản phẩm hoặc gặp lỗi khi xây dựng, hãy truy cập:
Miễn trừ trách nhiệm: Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI Co-op Translator (https://github.com/Azure/co-op-translator). Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ gốc nên được coi là nguồn có thẩm quyền. Đối với thông tin quan trọng, nên sử dụng bản dịch chuyên nghiệp do người dịch thực hiện. Chúng tôi không chịu trách nhiệm đối với bất kỳ sự hiểu lầm hoặc giải thích sai nào phát sinh từ việc sử dụng bản dịch này.



