|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 2 weeks ago | |
| examples | 2 weeks ago | |
| quiz-app | 2 weeks ago | |
| sketchnotes | 2 weeks ago | |
| .co-op-translator.json | 2 weeks ago | |
| AGENTS.md | 2 weeks ago | |
| CODE_OF_CONDUCT.md | 2 weeks ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 2 weeks ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 2 weeks ago | |
| SUPPORT.md | 2 weeks ago | |
| TROUBLESHOOTING.md | 2 weeks ago | |
| USAGE.md | 2 weeks ago | |
| for-teachers.md | 2 weeks ago | |
README.md
Khoa học Dữ liệu cho Người mới bắt đầu - Một Chương trình học
Nhóm Những Người Ủng hộ Azure Cloud tại Microsoft vui mừng giới thiệu một chương trình học 10 tuần, 20 bài học về Khoa học Dữ liệu. Mỗi bài học bao gồm bài kiểm tra trước và sau bài học, hướng dẫn bằng văn bản để hoàn thành bài học, giải pháp và bài tập. Phương pháp học dựa trên dự án của chúng tôi cho phép bạn học trong khi xây dựng, một cách đã được chứng minh giúp kỹ năng mới "bám chắc".
Xin chân thành cảm ơn các tác giả của chúng tôi: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Đặc biệt cảm ơn 🙏 tới các tác giả, người đánh giá và đóng góp nội dung là Đại sứ Sinh viên Microsoft, đặc biệt là Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Khoa học Dữ liệu cho Người mới bắt đầu - Sketchnote bởi @nitya |
🌐 Hỗ trợ Đa ngôn ngữ
Hỗ trợ qua GitHub Action (Tự động & Luôn Cập nhật)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Ưa thích Sao chép về máy?
Kho lưu trữ này bao gồm hơn 50 bản dịch ngôn ngữ làm tăng đáng kể kích thước tải xuống. Để sao chép mà không có bản dịch, hãy sử dụng kiểm tra thưa thớt:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'Điều này cung cấp cho bạn mọi thứ cần thiết để hoàn thành khóa học với tốc độ tải nhanh hơn nhiều.
Nếu bạn muốn có thêm các ngôn ngữ dịch được hỗ trợ, vui lòng xem danh sách tại đây
Tham gia Cộng đồng của chúng tôi
Chúng tôi có một loạt hội thảo trên Discord về học tập cùng AI đang diễn ra, tìm hiểu thêm và tham gia cùng chúng tôi tại Chuỗi học tập cùng AI từ ngày 18 - 30 tháng 9 năm 2025. Bạn sẽ nhận được các mẹo và thủ thuật sử dụng GitHub Copilot cho Khoa học Dữ liệu.
Bạn là sinh viên chứ?
Bắt đầu với các tài nguyên sau:
- Trang Trung tâm Sinh viên Trên trang này, bạn sẽ tìm thấy các tài nguyên cho người mới bắt đầu, Bộ dụng cụ Sinh viên và cả cách nhận phiếu chứng nhận miễn phí. Đây là một trang bạn nên đánh dấu và kiểm tra định kỳ vì nội dung của chúng tôi được thay đổi ít nhất mỗi tháng.
- Đại sứ Sinh viên Microsoft Tham gia cộng đồng đại sứ sinh viên toàn cầu, đây có thể là cách để bạn bước vào Microsoft.
Bắt đầu
📚 Tài liệu
- Hướng dẫn Cài đặt - Hướng dẫn từng bước thiết lập dành cho người mới bắt đầu
- Hướng dẫn Sử dụng - Ví dụ và các quy trình làm việc phổ biến
- Khắc phục Sự cố - Giải pháp cho các vấn đề thường gặp
- Hướng dẫn Đóng góp - Cách đóng góp cho dự án này
- Dành cho Giáo viên - Hướng dẫn giảng dạy và tài nguyên lớp học
👨🎓 Dành cho Sinh viên
Người mới hoàn toàn: Mới bắt đầu với khoa học dữ liệu? Hãy bắt đầu với ví dụ thân thiện với người mới! Những ví dụ đơn giản, có chú thích rõ ràng này sẽ giúp bạn hiểu những kiến thức cơ bản trước khi đi sâu vào toàn bộ chương trình học. Sinh viên: để sử dụng chương trình này tự học, hãy fork toàn bộ kho và hoàn thành các bài tập một mình, bắt đầu với câu hỏi trước bài giảng. Sau đó đọc bài giảng và hoàn thành các hoạt động còn lại. Cố gắng tạo các dự án bằng cách hiểu bài học thay vì sao chép mã giải pháp; tuy nhiên, mã đó có sẵn trong các thư mục /solutions trong mỗi bài học hướng đến dự án. Ý tưởng khác là lập nhóm học với bạn bè và cùng học nội dung. Để học nâng cao hơn, chúng tôi khuyên bạn dùng Microsoft Learn.
Bắt đầu Nhanh:
- Kiểm tra Hướng dẫn Cài đặt để thiết lập môi trường
- Xem qua Hướng dẫn Sử dụng để biết cách làm việc với chương trình học
- Bắt đầu với Bài học 1 và làm theo trình tự
- Tham gia cộng đồng Discord của chúng tôi để nhận hỗ trợ
👩🏫 Dành cho Giáo viên
Giáo viên: chúng tôi đã bao gồm một số đề xuất về cách sử dụng chương trình học này. Chúng tôi rất mong nhận được phản hồi từ bạn trong diễn đàn thảo luận của chúng tôi!
Gặp gỡ Đội ngũ
Gif bởi Mohit Jaisal
🎥 Nhấp vào hình ảnh phía trên để xem video về dự án và những người đã tạo ra nó!
Phương pháp dạy học
Chúng tôi đã chọn hai nguyên tắc sư phạm khi xây dựng chương trình này: đảm bảo rằng nó dựa trên dự án và bao gồm các bài kiểm tra thường xuyên. Vào cuối chuỗi bài học này, học viên sẽ học được các nguyên tắc cơ bản của khoa học dữ liệu, bao gồm các khái niệm đạo đức, chuẩn bị dữ liệu, các cách làm việc với dữ liệu khác nhau, trực quan hóa dữ liệu, phân tích dữ liệu, các trường hợp sử dụng khoa học dữ liệu trong thế giới thực và nhiều hơn nữa.
Ngoài ra, một bài kiểm tra nhẹ trước khi vào lớp đặt mục tiêu học tập cho học viên về chủ đề, trong khi bài kiểm tra thứ hai sau lớp đảm bảo việc ghi nhớ sâu hơn. Chương trình này được thiết kế để linh hoạt và thú vị, có thể học toàn bộ hoặc từng phần. Các dự án bắt đầu nhỏ và trở nên phức tạp hơn theo chu kỳ 10 tuần.
Tìm xem Quy tắc ứng xử, Hướng dẫn đóng góp, Dịch thuật của chúng tôi. Chúng tôi hoan nghênh phản hồi mang tính xây dựng từ bạn!
Mỗi bài học bao gồm:
- Sketchnote tùy chọn
- Video bổ trợ tùy chọn
- Bài kiểm tra làm nóng trước bài học
- Bài học bằng văn bản
- Đối với các bài học dựa trên dự án, hướng dẫn từng bước về cách xây dựng dự án
- Kiểm tra kiến thức
- Một thử thách
- Tài liệu đọc bổ sung
- Bài tập
- Bài kiểm tra sau bài học
Lưu ý về các bài kiểm tra: Tất cả bài kiểm tra nằm trong thư mục Quiz-App, với tổng cộng 40 bài kiểm tra, mỗi bài gồm ba câu hỏi. Chúng được liên kết từ trong các bài học, nhưng ứng dụng kiểm tra có thể chạy cục bộ hoặc triển khai trên Azure; theo dõi hướng dẫn trong thư mục
quiz-app. Các bài kiểm tra đang được địa phương hóa dần dần.
🎓 Ví dụ thân thiện với người mới bắt đầu
Mới với Khoa học Dữ liệu? Chúng tôi đã tạo một thư mục ví dụ đặc biệt với mã nguồn đơn giản, có chú thích đầy đủ giúp bạn bắt đầu:
- 🌟 Hello World - Chương trình khoa học dữ liệu đầu tiên của bạn
- 📂 Tải Dữ liệu - Học cách đọc và khám phá dữ liệu
- 📊 Phân tích đơn giản - Tính toán thống kê và tìm mẫu
- 📈 Trực quan hóa cơ bản - Tạo biểu đồ và đồ thị
- 🔬 Dự án trong thế giới thực - Quy trình hoàn chỉnh từ đầu đến cuối
Mỗi ví dụ bao gồm các chú thích chi tiết giải thích từng bước, rất phù hợp cho người mới bắt đầu hoàn toàn!
Các bài học
![]() |
|---|
| Khoa học Dữ liệu cho Người mới bắt đầu: Lộ trình - Sketchnote bởi @nitya |
| Số bài học | Chủ đề | Nhóm bài học | Mục tiêu học tập | Liên kết bài học | Tác giả |
|---|---|---|---|---|---|
| 01 | Định nghĩa Khoa học Dữ liệu | Giới thiệu | Học các khái niệm cơ bản về khoa học dữ liệu và cách nó liên quan đến trí tuệ nhân tạo, học máy và dữ liệu lớn. | bài học video | Dmitry |
| 02 | Đạo đức trong Khoa học Dữ liệu | Giới thiệu | Khái niệm đạo đức dữ liệu, các thách thức & khung làm việc. | bài học | Nitya |
| 03 | Định nghĩa Dữ liệu | Giới thiệu | Cách phân loại dữ liệu và các nguồn dữ liệu phổ biến. | bài học | Jasmine |
| 04 | Giới thiệu Thống kê & Xác suất | Giới thiệu | Các kỹ thuật toán học về xác suất và thống kê để hiểu dữ liệu. | bài học video | Dmitry |
| 05 | Làm việc với Dữ liệu Quan hệ | Làm việc với Dữ liệu | Giới thiệu dữ liệu quan hệ và cơ bản khám phá và phân tích dữ liệu quan hệ bằng Ngôn ngữ truy vấn cấu trúc, gọi tắt là SQL (phát âm "see-quell"). | bài học | Christopher |
| 06 | Làm việc với Dữ liệu NoSQL | Làm việc với Dữ liệu | Giới thiệu dữ liệu phi quan hệ, các loại khác nhau và cơ bản khám phá và phân tích cơ sở dữ liệu dạng tài liệu. | bài học | Jasmine |
| 07 | Làm việc với Python | Làm việc với Dữ liệu | Cơ bản sử dụng Python để khám phá dữ liệu với các thư viện như Pandas. Khuyến nghị có hiểu biết nền tảng về lập trình Python. | bài học video | Dmitry |
| 08 | Chuẩn bị Dữ liệu | Làm việc với Dữ liệu | Các chủ đề về kỹ thuật dữ liệu để làm sạch và biến đổi dữ liệu nhằm xử lý các thách thức về dữ liệu thiếu, không chính xác hoặc không đầy đủ. | bài học | Jasmine |
| 09 | Trực quan Hóa Số lượng | Trực quan Hóa Dữ liệu | Học cách sử dụng Matplotlib để trực quan hóa dữ liệu về chim 🦆 | bài học | Jen |
| 10 | Trực quan Hóa Phân bố Dữ liệu | Trực quan Hóa Dữ liệu | Trực quan hóa các quan sát và xu hướng trong một khoảng. | bài học | Jen |
| 11 | Trực quan Hóa Tỷ lệ | Trực quan Hóa Dữ liệu | Trực quan hóa phần trăm rời rạc và theo nhóm. | bài học | Jen |
| 12 | Trực quan Hóa Mối quan hệ | Trực quan Hóa Dữ liệu | Trực quan hóa các kết nối và tương quan giữa các bộ dữ liệu và các biến của chúng. | bài học | Jen |
| 13 | Trực quan Hóa Ý nghĩa | Trực quan Hóa Dữ liệu | Các kỹ thuật và hướng dẫn để làm cho hình trực quan của bạn có giá trị để giải quyết vấn đề và hiểu biết hiệu quả. | bài học | Jen |
| 14 | Giới thiệu vòng đời Khoa học Dữ liệu | Vòng đời | Giới thiệu về vòng đời khoa học dữ liệu và bước đầu tiên là thu nhận và trích xuất dữ liệu. | bài học | Jasmine |
| 15 | Phân tích | Vòng đời | Giai đoạn này của vòng đời khoa học dữ liệu tập trung vào các kỹ thuật phân tích dữ liệu. | bài học | Jasmine |
| 16 | Truyền đạt | Vòng đời | Giai đoạn này của vòng đời khoa học dữ liệu tập trung vào việc trình bày hiểu biết từ dữ liệu theo cách giúp người ra quyết định dễ dàng hiểu hơn. | bài học | Jalen |
| 17 | Khoa học Dữ liệu trên điện toán đám mây | Dữ liệu Đám mây | Chuỗi bài học này giới thiệu về khoa học dữ liệu trên đám mây và các lợi ích của nó. | bài học | Tiffany và Maud |
| 18 | Khoa học Dữ liệu trên điện toán đám mây | Dữ liệu Đám mây | Huấn luyện mô hình sử dụng công cụ Low Code. | bài học | Tiffany và Maud |
| 19 | Khoa học Dữ liệu trên điện toán đám mây | Dữ liệu Đám mây | Triển khai mô hình với Azure Machine Learning Studio. | bài học | Tiffany và Maud |
| 20 | Khoa học Dữ liệu trong thực tế | Trong thực tế | Các dự án khoa học dữ liệu trong thế giới thực. | bài học | Nitya |
GitHub Codespaces
Thực hiện các bước sau để mở bản mẫu này trong Codespace:
- Nhấp vào menu thả xuống Code và chọn tùy chọn Open with Codespaces.
- Chọn + New codespace ở phía dưới của bảng điều khiển. Để biết thêm thông tin, xem tài liệu GitHub.
VSCode Remote - Containers
Thực hiện các bước sau để mở kho lưu trữ này trong container bằng máy tính cục bộ và VSCode sử dụng tiện ích mở rộng VS Code Remote - Containers:
- Nếu đây là lần đầu bạn sử dụng container phát triển, hãy đảm bảo hệ thống của bạn đáp ứng các yêu cầu trước (ví dụ đã cài Docker) trong tài liệu bắt đầu.
Để sử dụng kho lưu trữ này, bạn có thể mở kho lưu trữ trong một volume Docker riêng biệt:
Lưu ý: Bên trong, điều này sẽ sử dụng lệnh Remote-Containers: Clone Repository in Container Volume... để sao chép mã nguồn vào một volume Docker thay vì hệ thống tập tin cục bộ. Volumes là cơ chế ưu tiên để lưu trữ dữ liệu container.
Hoặc mở một phiên bản đã sao chép hoặc tải về kho lưu trữ trên máy cục bộ:
- Sao chép kho lưu trữ này vào hệ thống tập tin cục bộ của bạn.
- Nhấn F1 và chọn lệnh Remote-Containers: Open Folder in Container....
- Chọn bản sao lớp này, chờ container khởi động và thử nghiệm.
Truy cập ngoại tuyến
Bạn có thể chạy tài liệu này ngoại tuyến bằng cách sử dụng Docsify. Fork repo này, cài đặt Docsify trên máy của bạn, sau đó ở thư mục gốc của repo, gõ docsify serve. Website sẽ được phục vụ trên cổng 3000 trên localhost của bạn: localhost:3000.
Lưu ý, sổ tay (notebooks) sẽ không được Render qua Docsify, vì vậy khi cần chạy sổ tay, hãy làm riêng bên trong VS Code với kernel Python.
Các chương trình học khác
Đội ngũ chúng tôi còn sản xuất các chương trình học khác! Hãy xem:
LangChain
Azure / Edge / MCP / Agents
Chuỗi AI Sinh Tạo
Học Cốt Lõi
Chuỗi Copilot
Nhận Trợ Giúp
Gặp sự cố? Hãy xem Hướng Dẫn Khắc Phục Sự Cố để tìm giải pháp cho các vấn đề thường gặp.
Nếu bạn bị mắc kẹt hoặc có bất kỳ câu hỏi nào về việc xây dựng ứng dụng AI. Tham gia cùng những người học khác và các nhà phát triển giàu kinh nghiệm trong các cuộc thảo luận về MCP. Đây là một cộng đồng hỗ trợ, nơi các câu hỏi được chào đón và kiến thức được chia sẻ tự do.
Nếu bạn có phản hồi về sản phẩm hoặc gặp lỗi trong quá trình xây dựng, hãy truy cập:
Tuyên bố từ chối trách nhiệm:
Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI Co-op Translator. Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng các bản dịch tự động có thể chứa lỗi hoặc không chính xác. Tài liệu gốc bằng ngôn ngữ gốc nên được xem là nguồn tham khảo chính xác nhất. Đối với những thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp do con người thực hiện. Chúng tôi không chịu trách nhiệm về bất kỳ sự hiểu nhầm hoặc giải thích sai nào phát sinh từ việc sử dụng bản dịch này.



