You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/vi
localizeflow[bot] 472e56e4e2
chore(i18n): sync translations with latest source changes (chunk 1/1, 6 changes)
3 weeks ago
..
1-Introduction chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
2-Working-With-Data chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
3-Data-Visualization chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
4-Data-Science-Lifecycle chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
5-Data-Science-In-Cloud chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
6-Data-Science-In-Wild chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
docs chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
examples chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
quiz-app chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
sketchnotes chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
.co-op-translator.json chore(i18n): sync translations with latest source changes (chunk 1/1, 6 changes) 3 weeks ago
AGENTS.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
CODE_OF_CONDUCT.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
CONTRIBUTING.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
INSTALLATION.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
README.md chore(i18n): sync translations with latest source changes (chunk 1/1, 6 changes) 3 weeks ago
SECURITY.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
SUPPORT.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
TROUBLESHOOTING.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
USAGE.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago
for-teachers.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 4 weeks ago

README.md

Khoa học dữ liệu cho người mới bắt đầu - Chương trình học

Azure Cloud Advocates tại Microsoft rất vui mừng giới thiệu một chương trình học kéo dài 10 tuần, 20 bài học, tất cả về Khoa học dữ liệu. Mỗi bài học đều bao gồm câu đố trước và sau bài học, hướng dẫn viết để hoàn thành bài học, giải pháp và bài tập. Phương pháp giảng dạy dựa trên dự án cho phép bạn học trong khi xây dựng, một cách đã được chứng minh giúp kỹ năng mới "bám chắc".

Xin gửi lời cảm ơn chân thành tới các tác giả của chúng tôi: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 Cảm ơn đặc biệt 🙏 tới các tác giả, người đánh giá và người đóng góp nội dung Đại sứ Sinh viên Microsoft, đặc biệt là Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
Khoa học dữ liệu cho người mới bắt đầu - Sketchnote bởi @nitya

🌐 Hỗ trợ đa ngôn ngữ

Hỗ trợ thông qua GitHub Action (Tự động & Luôn cập nhật)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

Muốn sao chép nội dung về máy?

Kho lưu trữ này bao gồm hơn 50 bản dịch ngôn ngữ làm tăng đáng kể kích thước tải về. Để sao chép mà không có các bản dịch, hãy sử dụng sparse checkout:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

Điều này cung cấp cho bạn mọi thứ cần thiết để hoàn thành khóa học với tốc độ tải nhanh hơn nhiều.

Nếu bạn muốn thêm các ngôn ngữ dịch hỗ trợ, danh sách có tại đây

Tham gia Cộng đồng của chúng tôi

Microsoft Foundry Discord

Chúng tôi có một chuỗi học tập trên Discord với chủ đề AI đang diễn ra, tìm hiểu thêm và tham gia cùng chúng tôi tại Chuỗi học với AI từ ngày 18 đến 30 tháng 9 năm 2025. Bạn sẽ nhận được mẹo và thủ thuật sử dụng GitHub Copilot cho Khoa học dữ liệu.

Chuỗi học với AI

Bạn là sinh viên?

Bắt đầu với những tài nguyên sau:

  • Trang Trung tâm Sinh viên Trên trang này, bạn sẽ tìm thấy tài nguyên dành cho người mới bắt đầu, gói dành cho sinh viên và thậm chí là cách để nhận phiếu chứng chỉ miễn phí. Đây là trang bạn nên đánh dấu và kiểm tra định kỳ vì chúng tôi cập nhật nội dung ít nhất hàng tháng.
  • Đại sứ Sinh viên Microsoft Tham gia cộng đồng đại sứ sinh viên toàn cầu, đây có thể là cơ hội của bạn để vào Microsoft.

Bắt đầu

📚 Tài liệu

👨‍🎓 Dành cho sinh viên

Người mới hoàn toàn: Mới học khoa học dữ liệu? Bắt đầu với các ví dụ dành cho người mới! Những ví dụ đơn giản, có chú thích rõ ràng này sẽ giúp bạn hiểu cơ bản trước khi vào chương trình học đầy đủ. Sinh viên: để sử dụng chương trình học này một mình, bạn fork toàn bộ repo và hoàn thành các bài tập một mình, bắt đầu với bài kiểm tra trước bài học. Sau đó đọc bài giảng và hoàn thành các hoạt động còn lại. Cố gắng tạo dự án bằng cách hiểu bài học hơn là sao chép mã giải pháp; tuy nhiên, mã đó có sẵn trong thư mục /solutions ở mỗi bài học dự án. Một ý tưởng khác là lập nhóm học với bạn bè để cùng học nội dung. Để học thêm, chúng tôi khuyên dùng Microsoft Learn.

Khởi động nhanh:

  1. Xem Hướng dẫn cài đặt để thiết lập môi trường của bạn
  2. Xem lại Hướng dẫn sử dụng để học cách làm việc với chương trình
  3. Bắt đầu với Bài học 1 và làm tuần tự
  4. Tham gia cộng đồng Discord để được hỗ trợ

👩‍🏫 Dành cho giáo viên

Giáo viên: chúng tôi đã bao gồm một số gợi ý về cách sử dụng chương trình học này. Rất mong nhận được phản hồi từ bạn trong diễn đàn thảo luận của chúng tôi!

Gặp gỡ Đội ngũ

Video quảng bá

Gif bởi Mohit Jaisal

🎥 Nhấn vào hình ảnh ở trên để xem video về dự án và những người đã tạo ra nó!

Phương pháp giảng dạy

Chúng tôi đã chọn hai nguyên tắc sư phạm khi xây dựng chương trình này: đảm bảo rằng nó dựa trên dự án và bao gồm các bài kiểm tra thường xuyên. Vào cuối chuỗi này, học viên sẽ học được các nguyên tắc cơ bản của khoa học dữ liệu, bao gồm các khái niệm đạo đức, chuẩn bị dữ liệu, các cách làm việc với dữ liệu khác nhau, trực quan hóa dữ liệu, phân tích dữ liệu, các trường hợp ứng dụng khoa học dữ liệu trong thực tế và hơn thế nữa.

Ngoài ra, một bài kiểm tra nhẹ trước lớp giúp học viên có ý định học tập rõ ràng về chủ đề, trong khi bài kiểm tra thứ hai sau lớp giúp củng cố kiến thức. Chương trình này được thiết kế linh hoạt và vui nhộn, có thể học toàn bộ hoặc theo từng phần. Các dự án bắt đầu nhỏ và trở nên phức tạp hơn vào cuối chu kỳ 10 tuần.

Tìm Bộ Quy tắc Ứng xử, Đóng góp, Dịch thuật của chúng tôi. Chúng tôi hoan nghênh phản hồi xây dựng từ bạn!

Mỗi bài học bao gồm:

  • Ghi chú minh họa tùy chọn
  • Video bổ trợ tùy chọn
  • Bài kiểm tra làm nóng trước bài học
  • Bài học bằng văn bản
  • Đối với bài học dựa trên dự án, hướng dẫn từng bước cách xây dựng dự án
  • Kiểm tra kiến thức
  • Thử thách
  • Đọc thêm bổ trợ
  • Bài tập
  • Bài kiểm tra sau bài học

Lưu ý về bài kiểm tra: Tất cả các bài kiểm tra nằm trong thư mục Quiz-App, tổng cộng 40 bài kiểm tra mỗi bài có 3 câu hỏi. Chúng được liên kết trong các bài học, nhưng ứng dụng kiểm tra có thể chạy cục bộ hoặc triển khai trên Azure; làm theo hướng dẫn trong thư mục quiz-app. Chúng đang được địa phương hóa dần dần.

🎓 Ví dụ thân thiện với người mới bắt đầu

Mới với Khoa học Dữ liệu? Chúng tôi đã tạo một thư mục ví dụ đặc biệt với mã nguồn đơn giản, có chú thích rõ ràng để giúp bạn bắt đầu:

  • 🌟 Hello World - Chương trình khoa học dữ liệu đầu tiên của bạn
  • 📂 Tải Dữ liệu - Học cách đọc và khám phá bộ dữ liệu
  • 📊 Phân tích Đơn giản - Tính toán thống kê và tìm kiếm mẫu
  • 📈 Trực quan hóa Cơ bản - Tạo biểu đồ và đồ thị
  • 🔬 Dự án Thực tế - Quy trình hoàn chỉnh từ đầu đến cuối

Mỗi ví dụ đều có chú thích chi tiết giải thích từng bước, rất phù hợp cho người mới hoàn toàn!

👉 Bắt đầu với các ví dụ 👈

Các bài học

Ghi chú minh họa bởi @sketchthedocs https://sketchthedocs.dev
Khoa học Dữ liệu cho Người Mới Bắt Đầu: Lộ trình - Ghi chú minh họa bởi @nitya
Số bài học Chủ đề Nhóm bài học Mục tiêu học tập Bài học liên kết Tác giả
01 Định nghĩa Khoa học Dữ liệu Giới thiệu Học các khái niệm cơ bản về khoa học dữ liệu và cách nó liên quan đến trí tuệ nhân tạo, máy học và dữ liệu lớn. bài học video Dmitry
02 Đạo đức trong Khoa học Dữ liệu Giới thiệu Khái niệm, thách thức và khuôn khổ về Đạo đức dữ liệu. bài học Nitya
03 Định nghĩa Dữ liệu Giới thiệu Cách dữ liệu được phân loại và các nguồn dữ liệu phổ biến. bài học Jasmine
04 Giới thiệu về Thống kê & Xác suất Giới thiệu Các kỹ thuật toán học về xác suất và thống kê để hiểu dữ liệu. bài học video Dmitry
05 Làm việc với Dữ liệu Quan hệ Làm việc với Dữ liệu Giới thiệu dữ liệu quan hệ và những kiến thức cơ bản về khám phá và phân tích dữ liệu quan hệ với Ngôn ngữ truy vấn có cấu trúc, còn gọi là SQL (phát âm "xì kuyn"). bài học Christopher
06 Làm việc với Dữ liệu NoSQL Làm việc với Dữ liệu Giới thiệu dữ liệu phi quan hệ, các loại khác nhau và các kiến thức cơ bản về khám phá và phân tích cơ sở dữ liệu tài liệu. bài học Jasmine
07 Làm việc với Python Làm việc với Dữ liệu Kiến thức cơ bản sử dụng Python để khám phá dữ liệu với các thư viện như Pandas. Khuyến nghị có kiến thức nền tảng về lập trình Python. bài học video Dmitry
08 Chuẩn bị Dữ liệu Làm việc với Dữ liệu Các chủ đề về kỹ thuật dữ liệu để làm sạch và chuyển đổi dữ liệu nhằm giải quyết các thách thức về dữ liệu thiếu, không chính xác hoặc không đầy đủ. bài học Jasmine
09 Trực quan hóa Số lượng Trực quan hóa Dữ liệu Học cách sử dụng Matplotlib để trực quan hóa dữ liệu chim 🦆 bài học Jen
10 Trực quan hóa Phân phối Dữ liệu Trực quan hóa Dữ liệu Trực quan hóa các quan sát và xu hướng trong một khoảng. bài học Jen
11 Trực quan hóa Tỉ lệ Trực quan hóa Dữ liệu Trực quan hóa phần trăm rời rạc và nhóm. bài học Jen
12 Trực quan hóa Mối quan hệ Trực quan hóa Dữ liệu Trực quan hóa các kết nối và tương quan giữa các tập dữ liệu và các biến của chúng. bài học Jen
13 Trực quan hóa Có ý nghĩa Trực quan hóa Dữ liệu Kỹ thuật và hướng dẫn để làm cho các trực quan hóa của bạn có giá trị trong việc giải quyết vấn đề và rút ra cái nhìn sâu sắc hiệu quả. bài học Jen
14 Giới thiệu Chu trình Khoa học Dữ liệu Chu trình Giới thiệu chu trình khoa học dữ liệu và bước đầu tiên là thu thập và khai thác dữ liệu. bài học Jasmine
15 Phân tích Chu trình Giai đoạn này của chu trình khoa học dữ liệu tập trung vào kỹ thuật phân tích dữ liệu. bài học Jasmine
16 Truyền đạt Chu trình Giai đoạn này của chu trình khoa học dữ liệu tập trung vào việc trình bày những cái nhìn sâu sắc từ dữ liệu theo cách giúp người ra quyết định dễ hiểu hơn. bài học Jalen
17 Khoa học Dữ liệu trên Đám mây Dữ liệu Đám mây Chuỗi bài học này giới thiệu khoa học dữ liệu trên đám mây và các lợi ích của nó. bài học TiffanyMaud
18 Khoa học Dữ liệu trên Đám mây Dữ liệu Đám mây Huấn luyện mô hình bằng công cụ Low Code. bài học TiffanyMaud
19 Khoa học Dữ liệu trên Đám mây Dữ liệu Đám mây Triển khai mô hình với Azure Machine Learning Studio. bài học TiffanyMaud
20 Khoa học Dữ liệu ngoài thực tế Thực tế Các dự án dựa trên khoa học dữ liệu trong thế giới thực. bài học Nitya

GitHub Codespaces

Thực hiện các bước sau để mở mẫu này trong Codespace:

  1. Nhấp vào menu thả xuống Code và chọn tùy chọn Open with Codespaces.
  2. Chọn + New codespace ở dưới cùng của khung. Để biết thêm thông tin, hãy xem tài liệu GitHub.

VSCode Remote - Containers

Thực hiện các bước sau để mở kho lưu trữ này trong container sử dụng máy tính cục bộ và VSCode với tiện ích mở rộng VS Code Remote - Containers:

  1. Nếu đây là lần đầu bạn dùng container phát triển, hãy đảm bảo hệ thống bạn đáp ứng các yêu cầu trước (ví dụ đã cài Docker) trong tài liệu bắt đầu.

Để sử dụng kho lưu trữ này, bạn có thể mở kho lưu trữ trong một volume Docker cách ly:

Lưu ý: Thao tác này sẽ dùng lệnh Remote-Containers: Clone Repository in Container Volume... để clone mã nguồn vào volume Docker thay vì hệ thống tập tin cục bộ. Volumes là cơ chế được ưu tiên để lưu trữ dữ liệu container.

Hoặc mở phiên bản kho lưu trữ đã clone hoặc tải về cục bộ:

  • Clone kho lưu trữ này vào hệ thống tập tin cục bộ.
  • Nhấn F1 và chọn lệnh Remote-Containers: Open Folder in Container....
  • Chọn bản copy đã clone của thư mục này, chờ container khởi động, rồi thử nghiệm.

Truy cập ngoại tuyến

Bạn có thể chạy tài liệu này ngoại tuyến bằng cách dùng Docsify. Fork repo này, cài đặt Docsify trên máy cục bộ, sau đó trong thư mục gốc của repo, gõ docsify serve. Trang web sẽ được phục vụ trên cổng 3000 trên localhost của bạn: localhost:3000.

Lưu ý, các notebook sẽ không hiển thị qua Docsify, vì vậy khi cần chạy notebook, hãy làm riêng trong VS Code với kernel Python.

Các chương trình học khác

Đội ngũ của chúng tôi còn sản xuất các chương trình học khác! Hãy xem:

LangChain

LangChain4j dành cho Người mới bắt đầu LangChain.js dành cho Người mới bắt đầu LangChain dành cho Người mới bắt đầu

Azure / Edge / MCP / Agents

AZD dành cho Người mới bắt đầu Edge AI dành cho Người mới bắt đầu MCP dành cho Người mới bắt đầu Đại lý AI dành cho Người mới bắt đầu


Chuỗi AI tạo sinh

AI tạo sinh dành cho Người mới bắt đầu AI tạo sinh (.NET) AI tạo sinh (Java) AI tạo sinh (JavaScript)


Học cơ bản

ML dành cho Người mới bắt đầu Khoa học Dữ liệu dành cho Người mới bắt đầu AI dành cho Người mới bắt đầu An ninh mạng dành cho Người mới bắt đầu Phát triển Web dành cho Người mới bắt đầu IoT dành cho Người mới bắt đầu Phát triển XR dành cho Người mới bắt đầu


Chuỗi Copilot

Copilot cho Lập trình Hợp tác Với AI Copilot cho C#/.NET Cuộc phiêu lưu Copilot

Nhận trợ giúp

Gặp sự cố? Hãy xem Hướng dẫn Khắc phục sự cố của chúng tôi để tìm giải pháp cho các vấn đề phổ biến.

Nếu bạn bị kẹt hoặc có bất kỳ câu hỏi nào về xây dựng ứng dụng AI, hãy tham gia cùng những người học khác và các nhà phát triển giàu kinh nghiệm trong các cuộc thảo luận về MCP. Đây là một cộng đồng hỗ trợ, nơi những câu hỏi được chào đón và kiến thức được chia sẻ tự do.

Microsoft Foundry Discord

Nếu bạn có phản hồi về sản phẩm hoặc gặp lỗi khi xây dựng, hãy truy cập:

Diễn đàn Nhà phát triển Microsoft Foundry


Tuyên bố từ chối trách nhiệm: Tài liệu này đã được dịch bằng dịch vụ dịch thuật AI Co-op Translator. Mặc dù chúng tôi cố gắng đảm bảo độ chính xác, xin lưu ý rằng bản dịch tự động có thể chứa lỗi hoặc sự không chính xác. Tài liệu gốc bằng ngôn ngữ gốc nên được xem là nguồn tham khảo chính thức. Đối với thông tin quan trọng, khuyến nghị sử dụng dịch vụ dịch thuật chuyên nghiệp do con người thực hiện. Chúng tôi không chịu trách nhiệm về bất kỳ sự hiểu lầm hoặc giải thích sai nào phát sinh từ việc sử dụng bản dịch này.