|
|
<!--
|
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
|
{
|
|
|
"original_hash": "a5443b88ba402d2ec7b000e4de6cecb8",
|
|
|
"translation_date": "2025-08-29T07:59:23+00:00",
|
|
|
"source_file": "README.md",
|
|
|
"language_code": "mo"
|
|
|
}
|
|
|
-->
|
|
|
# 初學者的數據科學課程
|
|
|
|
|
|
[](https://github.com/codespaces/new?hide_repo_select=true&ref=main&repo=344191198)
|
|
|
|
|
|
[](https://github.com/microsoft/Data-Science-For-Beginners/blob/master/LICENSE)
|
|
|
[](https://GitHub.com/microsoft/Data-Science-For-Beginners/graphs/contributors/)
|
|
|
[](https://GitHub.com/microsoft/Data-Science-For-Beginners/issues/)
|
|
|
[](https://GitHub.com/microsoft/Data-Science-For-Beginners/pulls/)
|
|
|
[](http://makeapullrequest.com)
|
|
|
|
|
|
[](https://GitHub.com/microsoft/Data-Science-For-Beginners/watchers/)
|
|
|
[](https://GitHub.com/microsoft/Data-Science-For-Beginners/network/)
|
|
|
[](https://GitHub.com/microsoft/Data-Science-For-Beginners/stargazers/)
|
|
|
|
|
|
[](https://discord.gg/zxKYvhSnVp?WT.mc_id=academic-000002-leestott)
|
|
|
|
|
|
[](https://aka.ms/foundry/forum)
|
|
|
|
|
|
Microsoft 的 Azure Cloud Advocates 團隊很高興為您提供一個為期 10 週、共 20 節課的數據科學課程。每節課都包含課前和課後測驗、完成課程的書面指導、解決方案以及作業。我們的專案式教學法讓您在實作中學習,這是一種被證明能讓新技能更牢固掌握的方法。
|
|
|
|
|
|
**特別感謝我們的作者們:** [Jasmine Greenaway](https://www.twitter.com/paladique)、[Dmitry Soshnikov](http://soshnikov.com)、[Nitya Narasimhan](https://twitter.com/nitya)、[Jalen McGee](https://twitter.com/JalenMcG)、[Jen Looper](https://twitter.com/jenlooper)、[Maud Levy](https://twitter.com/maudstweets)、[Tiffany Souterre](https://twitter.com/TiffanySouterre)、[Christopher Harrison](https://www.twitter.com/geektrainer)。
|
|
|
|
|
|
**🙏 特別感謝 🙏 我們的 [Microsoft 學生大使](https://studentambassadors.microsoft.com/) 作者、審稿人和內容貢獻者,** 特別是 Aaryan Arora、[Aditya Garg](https://github.com/AdityaGarg00)、[Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/)、[Ankita Singh](https://www.linkedin.com/in/ankitasingh007)、[Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/)、[Arpita Das](https://www.linkedin.com/in/arpitadas01/)、ChhailBihari Dubey、[Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor)、[Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb)、[Majd Safi](https://www.linkedin.com/in/majd-s/)、[Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/)、[Miguel Correa](https://www.linkedin.com/in/miguelmque/)、[Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119)、[Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum)、[Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/)、[Rohit Yadav](https://www.linkedin.com/in/rty2423)、Samridhi Sharma、[Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200)、[Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/)、[Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/)、Yogendrasingh Pawar、[Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/)、[Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/)。
|
|
|
|
|
|
||
|
|
|
|:---:|
|
|
|
| 初學者的數據科學 - _由 [@nitya](https://twitter.com/nitya) 繪製的草圖_ |
|
|
|
|
|
|
### 🌐 多語言支援
|
|
|
|
|
|
#### 通過 GitHub Action 支援(自動化且始終保持最新)
|
|
|
|
|
|
[法文](../fr/README.md) | [西班牙文](../es/README.md) | [德文](../de/README.md) | [俄文](../ru/README.md) | [阿拉伯文](../ar/README.md) | [波斯文(法爾西)](../fa/README.md) | [烏爾都文](../ur/README.md) | [中文(簡體)](../zh/README.md) | [中文(繁體,澳門)](./README.md) | [中文(繁體,香港)](../hk/README.md) | [中文(繁體,台灣)](../tw/README.md) | [日文](../ja/README.md) | [韓文](../ko/README.md) | [印地文](../hi/README.md) | [孟加拉文](../bn/README.md) | [馬拉地文](../mr/README.md) | [尼泊爾文](../ne/README.md) | [旁遮普文(古木基文)](../pa/README.md) | [葡萄牙文(葡萄牙)](../pt/README.md) | [葡萄牙文(巴西)](../br/README.md) | [義大利文](../it/README.md) | [波蘭文](../pl/README.md) | [土耳其文](../tr/README.md) | [希臘文](../el/README.md) | [泰文](../th/README.md) | [瑞典文](../sv/README.md) | [丹麥文](../da/README.md) | [挪威文](../no/README.md) | [芬蘭文](../fi/README.md) | [荷蘭文](../nl/README.md) | [希伯來文](../he/README.md) | [越南文](../vi/README.md) | [印尼文](../id/README.md) | [馬來文](../ms/README.md) | [塔加洛文(菲律賓語)](../tl/README.md) | [斯瓦希里文](../sw/README.md) | [匈牙利文](../hu/README.md) | [捷克文](../cs/README.md) | [斯洛伐克文](../sk/README.md) | [羅馬尼亞文](../ro/README.md) | [保加利亞文](../bg/README.md) | [塞爾維亞文(西里爾文)](../sr/README.md) | [克羅埃西亞文](../hr/README.md) | [斯洛維尼亞文](../sl/README.md) | [烏克蘭文](../uk/README.md) | [緬甸文(緬甸)](../my/README.md)
|
|
|
|
|
|
**如果您希望支援其他語言,請參考 [這裡](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md)**
|
|
|
|
|
|
#### 加入我們的社群
|
|
|
[](https://discord.gg/kzRShWzttr)
|
|
|
|
|
|
# 您是學生嗎?
|
|
|
|
|
|
可以從以下資源開始:
|
|
|
|
|
|
- [學生中心頁面](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) 在這個頁面上,您可以找到初學者資源、學生套件,甚至是獲取免費認證憑證的方法。這是一個值得收藏的頁面,因為我們至少每月更新一次內容。
|
|
|
- [Microsoft 學生大使](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) 加入一個全球性的學生大使社群,這可能是您進入 Microsoft 的途徑。
|
|
|
|
|
|
# 開始使用
|
|
|
|
|
|
> **教師們**:我們已[提供了一些建議](for-teachers.md)來幫助您使用這份課程。我們期待您在[討論論壇](https://github.com/microsoft/Data-Science-For-Beginners/discussions)中的反饋!
|
|
|
|
|
|
> **[學生們](https://aka.ms/student-page)**:如果您想自行使用這份課程,請分叉整個倉庫並自行完成練習,從課前測驗開始。然後閱讀講義並完成其餘活動。嘗試通過理解課程內容來創建專案,而不是直接複製解決方案代碼;不過,這些代碼可以在每個專案課程的 /solutions 資料夾中找到。另一個建議是與朋友組成學習小組,一起學習這些內容。進一步學習,我們推薦 [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum)。
|
|
|
|
|
|
## 認識團隊
|
|
|
|
|
|
[](https://youtu.be/8mzavjQSMM4 "宣傳影片")
|
|
|
|
|
|
**Gif 作者** [Mohit Jaisal](https://www.linkedin.com/in/mohitjaisal)
|
|
|
|
|
|
> 🎥 點擊上方圖片觀看關於這個專案及其創作者的影片!
|
|
|
|
|
|
## 教學法
|
|
|
|
|
|
在設計這份課程時,我們選擇了兩個教學原則:確保課程是專案導向的,並且包含頻繁的測驗。在這個系列結束時,學生將學習到數據科學的基本原則,包括倫理概念、數據準備、不同的數據處理方式、數據視覺化、數據分析、數據科學的實際應用案例等。
|
|
|
|
|
|
此外,課前的低壓力測驗可以幫助學生專注於學習主題,而課後的第二次測驗則能進一步鞏固記憶。這份課程設計靈活且有趣,可以整體學習,也可以部分學習。專案從簡單開始,並在 10 週的課程中逐漸變得更具挑戰性。
|
|
|
> 查看我們的[行為準則](CODE_OF_CONDUCT.md)、[貢獻指南](CONTRIBUTING.md)、[翻譯指南](TRANSLATIONS.md)。我們歡迎您的建設性反饋!
|
|
|
## 每節課包含:
|
|
|
|
|
|
- 可選的手繪筆記
|
|
|
- 可選的補充影片
|
|
|
- 課前暖身測驗
|
|
|
- 書面課程
|
|
|
- 對於基於專案的課程,提供逐步指導如何完成專案
|
|
|
- 知識檢查
|
|
|
- 挑戰題
|
|
|
- 補充閱讀
|
|
|
- 作業
|
|
|
- [課後測驗](https://ff-quizzes.netlify.app/en/)
|
|
|
|
|
|
> **關於測驗的說明**:所有測驗都包含在 Quiz-App 資料夾中,共有 40 個測驗,每個測驗包含三個問題。這些測驗已經在課程中鏈接,但測驗應用程式可以在本地運行或部署到 Azure;請按照 `quiz-app` 資料夾中的指示操作。測驗正在逐步進行本地化。
|
|
|
|
|
|
## 課程列表
|
|
|
|
|
|
||
|
|
|
|:---:|
|
|
|
| 初學者數據科學:學習路線圖 - _手繪筆記由 [@nitya](https://twitter.com/nitya) 提供_ |
|
|
|
|
|
|
| 課程編號 | 主題 | 課程分組 | 學習目標 | 課程鏈接 | 作者 |
|
|
|
| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
|
|
|
| 01 | 定義數據科學 | [簡介](1-Introduction/README.md) | 學習數據科學的基本概念,以及它與人工智慧、機器學習和大數據的關係。 | [課程](1-Introduction/01-defining-data-science/README.md) [影片](https://youtu.be/beZ7Mb_oz9I) | [Dmitry](http://soshnikov.com) |
|
|
|
| 02 | 數據科學倫理 | [簡介](1-Introduction/README.md) | 數據倫理的概念、挑戰與框架。 | [課程](1-Introduction/02-ethics/README.md) | [Nitya](https://twitter.com/nitya) |
|
|
|
| 03 | 定義數據 | [簡介](1-Introduction/README.md) | 數據的分類方式及其常見來源。 | [課程](1-Introduction/03-defining-data/README.md) | [Jasmine](https://www.twitter.com/paladique) |
|
|
|
| 04 | 統計與機率入門 | [簡介](1-Introduction/README.md) | 使用機率與統計的數學技術來理解數據。 | [課程](1-Introduction/04-stats-and-probability/README.md) [影片](https://youtu.be/Z5Zy85g4Yjw) | [Dmitry](http://soshnikov.com) |
|
|
|
| 05 | 使用關聯數據 | [數據操作](2-Working-With-Data/README.md) | 關聯數據的介紹,以及使用結構化查詢語言(SQL,發音為“see-quell”)探索和分析關聯數據的基礎知識。 | [課程](2-Working-With-Data/05-relational-databases/README.md) | [Christopher](https://www.twitter.com/geektrainer) | | |
|
|
|
| 06 | 使用 NoSQL 數據 | [數據操作](2-Working-With-Data/README.md) | 非關聯數據的介紹、其各種類型以及探索和分析文檔數據庫的基礎知識。 | [課程](2-Working-With-Data/06-non-relational/README.md) | [Jasmine](https://twitter.com/paladique)|
|
|
|
| 07 | 使用 Python | [數據操作](2-Working-With-Data/README.md) | 使用 Python 進行數據探索的基礎知識,包括 Pandas 等庫。建議具備 Python 程式設計的基礎知識。 | [課程](2-Working-With-Data/07-python/README.md) [影片](https://youtu.be/dZjWOGbsN4Y) | [Dmitry](http://soshnikov.com) |
|
|
|
| 08 | 數據準備 | [數據操作](2-Working-With-Data/README.md) | 關於清理和轉換數據的技術,以應對缺失、不準確或不完整數據的挑戰。 | [課程](2-Working-With-Data/08-data-preparation/README.md) | [Jasmine](https://www.twitter.com/paladique) |
|
|
|
| 09 | 數量可視化 | [數據可視化](3-Data-Visualization/README.md) | 學習如何使用 Matplotlib 可視化鳥類數據 🦆 | [課程](3-Data-Visualization/09-visualization-quantities/README.md) | [Jen](https://twitter.com/jenlooper) |
|
|
|
| 10 | 數據分佈可視化 | [數據可視化](3-Data-Visualization/README.md) | 可視化區間內的觀察值和趨勢。 | [課程](3-Data-Visualization/10-visualization-distributions/README.md) | [Jen](https://twitter.com/jenlooper) |
|
|
|
| 11 | 比例可視化 | [數據可視化](3-Data-Visualization/README.md) | 可視化離散和分組百分比。 | [課程](3-Data-Visualization/11-visualization-proportions/README.md) | [Jen](https://twitter.com/jenlooper) |
|
|
|
| 12 | 關係可視化 | [數據可視化](3-Data-Visualization/README.md) | 可視化數據集及其變數之間的連結和相關性。 | [課程](3-Data-Visualization/12-visualization-relationships/README.md) | [Jen](https://twitter.com/jenlooper) |
|
|
|
| 13 | 有意義的可視化 | [數據可視化](3-Data-Visualization/README.md) | 提供使可視化更有價值的技術和指導,以便有效解決問題並獲得洞察。 | [課程](3-Data-Visualization/13-meaningful-visualizations/README.md) | [Jen](https://twitter.com/jenlooper) |
|
|
|
| 14 | 數據科學生命周期簡介 | [生命周期](4-Data-Science-Lifecycle/README.md) | 數據科學生命周期的介紹及其第一步:數據的獲取與提取。 | [課程](4-Data-Science-Lifecycle/14-Introduction/README.md) | [Jasmine](https://twitter.com/paladique) |
|
|
|
| 15 | 數據分析 | [生命周期](4-Data-Science-Lifecycle/README.md) | 數據科學生命周期中專注於數據分析的技術。 | [課程](4-Data-Science-Lifecycle/15-analyzing/README.md) | [Jasmine](https://twitter.com/paladique) | | |
|
|
|
| 16 | 溝通 | [生命周期](4-Data-Science-Lifecycle/README.md) | 數據科學生命周期中專注於以易於決策者理解的方式呈現數據洞察。 | [課程](4-Data-Science-Lifecycle/16-communication/README.md) | [Jalen](https://twitter.com/JalenMcG) | | |
|
|
|
| 17 | 雲端數據科學 | [雲端數據](5-Data-Science-In-Cloud/README.md) | 本系列課程介紹雲端數據科學及其優勢。 | [課程](5-Data-Science-In-Cloud/17-Introduction/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) 和 [Maud](https://twitter.com/maudstweets) |
|
|
|
| 18 | 雲端數據科學 | [雲端數據](5-Data-Science-In-Cloud/README.md) | 使用低代碼工具訓練模型。 |[課程](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) 和 [Maud](https://twitter.com/maudstweets) |
|
|
|
| 19 | 雲端數據科學 | [雲端數據](5-Data-Science-In-Cloud/README.md) | 使用 Azure Machine Learning Studio 部署模型。 | [課程](5-Data-Science-In-Cloud/19-Azure/README.md)| [Tiffany](https://twitter.com/TiffanySouterre) 和 [Maud](https://twitter.com/maudstweets) |
|
|
|
| 20 | 野外數據科學 | [實際應用](6-Data-Science-In-Wild/README.md) | 現實世界中的數據科學驅動專案。 | [課程](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [Nitya](https://twitter.com/nitya) |
|
|
|
|
|
|
## GitHub Codespaces
|
|
|
|
|
|
按照以下步驟在 Codespace 中打開此範例:
|
|
|
1. 點擊 Code 下拉選單,選擇 Open with Codespaces 選項。
|
|
|
2. 在面板底部選擇 + New codespace。
|
|
|
更多資訊,請參考 [GitHub 文件](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace)。
|
|
|
|
|
|
## VSCode Remote - Containers
|
|
|
|
|
|
按照以下步驟,使用本地機器和 VSCode 的 VS Code Remote - Containers 擴展,在容器中打開此存儲庫:
|
|
|
|
|
|
1. 如果是第一次使用開發容器,請確保您的系統滿足前置需求(例如安裝 Docker),詳情請參考[入門文檔](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started)。
|
|
|
|
|
|
要使用此存儲庫,您可以選擇在隔離的 Docker 卷中打開存儲庫:
|
|
|
|
|
|
**注意**:在底層,這將使用 Remote-Containers: **Clone Repository in Container Volume...** 命令,將源代碼克隆到 Docker 卷中,而不是本地文件系統。[卷](https://docs.docker.com/storage/volumes/) 是持久化容器數據的首選機制。
|
|
|
|
|
|
或者打開本地克隆或下載的存儲庫版本:
|
|
|
|
|
|
- 將此存儲庫克隆到本地文件系統。
|
|
|
- 按 F1,選擇 **Remote-Containers: Open Folder in Container...** 命令。
|
|
|
- 選擇此文件夾的克隆副本,等待容器啟動,然後試用。
|
|
|
|
|
|
## 離線訪問
|
|
|
|
|
|
您可以使用 [Docsify](https://docsify.js.org/#/) 離線運行此文檔。Fork 此存儲庫,在本地機器上[安裝 Docsify](https://docsify.js.org/#/quickstart),然後在此存儲庫的根目錄中輸入 `docsify serve`。網站將在本地端口 3000 上提供服務:`localhost:3000`。
|
|
|
|
|
|
> 注意,筆記本無法通過 Docsify 渲染,因此當您需要運行筆記本時,請在運行 Python 核心的 VS Code 中單獨運行。
|
|
|
|
|
|
## 其他課程
|
|
|
|
|
|
我們的團隊還製作了其他課程!查看以下內容:
|
|
|
|
|
|
- [生成式 AI 初學者課程](https://aka.ms/genai-beginners)
|
|
|
- [生成式 AI 初學者課程 .NET](https://github.com/microsoft/Generative-AI-for-beginners-dotnet)
|
|
|
- [使用 JavaScript 的生成式 AI](https://github.com/microsoft/generative-ai-with-javascript)
|
|
|
- [使用 Java 的生成式 AI](https://aka.ms/genaijava)
|
|
|
- [AI 初學者課程](https://aka.ms/ai-beginners)
|
|
|
- [數據科學初學者課程](https://aka.ms/datascience-beginners)
|
|
|
- [機器學習初學者課程](https://aka.ms/ml-beginners)
|
|
|
- [網絡安全初學者課程](https://github.com/microsoft/Security-101)
|
|
|
- [Web 開發初學者課程](https://aka.ms/webdev-beginners)
|
|
|
- [物聯網初學者課程](https://aka.ms/iot-beginners)
|
|
|
- [XR 開發初學者課程](https://github.com/microsoft/xr-development-for-beginners)
|
|
|
- [精通 GitHub Copilot 配對編程](https://github.com/microsoft/Mastering-GitHub-Copilot-for-Paired-Programming)
|
|
|
- [精通 GitHub Copilot 用於 C#/.NET 開發者](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers)
|
|
|
- [選擇你的 Copilot 冒險](https://github.com/microsoft/CopilotAdventures)
|
|
|
|
|
|
---
|
|
|
|
|
|
**免責聲明**:
|
|
|
本文件已使用 AI 翻譯服務 [Co-op Translator](https://github.com/Azure/co-op-translator) 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對於因使用此翻譯而引起的任何誤解或錯誤解讀概不負責。 |