|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 months ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 4 months ago | |
| 4-Data-Science-Lifecycle | 4 months ago | |
| 5-Data-Science-In-Cloud | 4 months ago | |
| 6-Data-Science-In-Wild | 4 months ago | |
| docs | 4 months ago | |
| examples | 3 months ago | |
| quiz-app | 4 months ago | |
| sketchnotes | 4 months ago | |
| AGENTS.md | 3 months ago | |
| CODE_OF_CONDUCT.md | 4 months ago | |
| CONTRIBUTING.md | 3 months ago | |
| INSTALLATION.md | 3 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 4 months ago | |
| SUPPORT.md | 4 months ago | |
| TROUBLESHOOTING.md | 3 months ago | |
| USAGE.md | 3 months ago | |
| for-teachers.md | 4 months ago | |
README.md
初學者資料科學 — 課程
Microsoft 的 Azure Cloud Advocates 很高興提供一個為期 10 週、共 20 節課的資料科學課程。每一課包含課前與課後小測驗、完成課程的書面指示、解答,以及作業。我們以專案為基礎的教學法讓你在實作中學習,是讓新技能「紮實」的有效方式。
衷心感謝我們的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特別感謝 🙏 我們的 Microsoft Student Ambassador 作者、審閱者與內容貢獻者, 尤其是 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 初學者資料科學 - 速寫圖示由 @nitya |
🌐 多語言支援
透過 GitHub Action 支援(自動且即時更新)
阿拉伯語 | 孟加拉語 | 保加利亞語 | 緬甸語 (Myanmar) | 中文(簡體) | 中文(繁體,香港) | 中文(繁體,澳門) | 中文(繁體,台灣) | 克羅地亞語 | 捷克語 | 丹麥語 | 荷蘭語 | 愛沙尼亞語 | 芬蘭語 | 法語 | 德語 | 希臘語 | 希伯來語 | 印地語 | 匈牙利語 | 印尼語 | 義大利語 | 日語 | 坎納達語 | 韓語 | 立陶宛語 | 馬來語 | 馬拉雅拉姆語 | 馬拉地語 | 尼泊爾語 | 尼日利亞皮欽語 | 挪威語 | 波斯語(Farsi) | 波蘭語 | 葡萄牙語(巴西) | 葡萄牙語(葡萄牙) | 旁遮普語(Gurmukhi) | 羅馬尼亞語 | 俄語 | 塞爾維亞語(西里爾字) | 斯洛伐克語 | 斯洛文尼亞語 | 西班牙語 | 斯瓦希里語 | 瑞典語 | 他加祿語(菲律賓) | 泰米爾語 | 泰盧固語 | 泰語 | 土耳其語 | 烏克蘭語 | 烏爾都語 | 越南語
如果您希望新增翻譯語言,支援的語言列表見 這裡
加入我們的社群
我們有正在進行的 Discord「與 AI 一起學習」系列,詳情與加入請見 Learn with AI Series,活動時間為 2025 年 9 月 18 日至 30 日。您會獲得使用 GitHub Copilot 於資料科學的秘訣與技巧。
你是學生嗎?
請從下列資源開始:
- 學生中心頁面 在此頁面,您會找到新手資源、學生套件,甚至取得免費證照優惠券的方法。這是一個您會想要加入收藏的頁面,並不時回來查看,因為我們至少每月會更新內容。
- Microsoft Learn 學生大使 加入全球學生大使社群,這可能是您進入微軟的一條途徑。
開始使用
📚 文件
👨🎓 學生專區
完全初學者:剛接觸資料科學嗎?從我們的 新手範例 開始!這些簡單且註解完整的範例會在您深入完整課程前幫助理解基礎。 學生:若要自行使用此課程,請 fork 整個 repo 並自行完成練習,從課前測驗開始。然後閱讀講義並完成其餘活動。嘗試透過理解課程內容來製作專案,而不是複製解答程式碼;不過每個以專案為導向的課程在 /solutions 資料夾中都有對應程式碼可供參考。另一個做法是與朋友組成讀書會,一起學習內容。若要進一步學習,我們建議參考 Microsoft Learn。
快速開始:
- 檢查 安裝指南 以設定您的環境
- 檢閱 使用指南 以了解如何使用此課程
- 從第一課開始並依序進行
- 加入我們的 Discord 社群 尋求支援
👩🏫 教師專區
認識團隊
動圖由 Mohit Jaisal
🎥 點擊上方圖片以觀看關於該專案 以及創建者的影片!
教學法
我們在建立這個課程時選擇了兩個教學原則:確保以專案為本,並包含頻繁的小測驗。在本系列結束時,學生將會學會資料科學的基本原則,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際應用案例等等。
此外,課前的一個低壓小測驗可以讓學生設定學習主題的意向,而課後的第二次小測驗則能確保更好的記憶與吸收。這套課程設計為彈性且有趣,可整套修習,也可選擇部分修習。專案由簡入深,10 週循環結束時會變得越來越複雜。
每堂課包括:
- 可選的圖解筆記
- 可選的補充影片
- 課前暖身小測驗
- 書面課程
- 針對專案導向課程,提供逐步指引教你如何建立專案
- 知識檢核
- 一項挑戰任務
- 補充閱讀
- 作業
- 課後小測驗
關於小測驗的一則說明:所有小測驗都包含在 Quiz-App folder 中,總共有 40 個小測驗,每個小測驗三個問題。它們在課程內有連結,但 quiz app 可以在本機執行或部署到 Azure;請遵循
quiz-app資料夾中的說明。它們正在逐步本地化。
🎓 適合初學者的範例
剛接觸資料科學? 我們建立了一個專門的 範例目錄,內有簡單且註解完善的程式碼,幫助你快速上手:
- 🌟 Hello World - 你的第一個資料科學程式
- 📂 Loading Data - 學習如何讀取與探索資料集
- 📊 Simple Analysis - 計算統計數據並尋找模式
- 📈 Basic Visualization - 建立圖表與圖形
- 🔬 Real-World Project - 從頭到尾完成的實務工作流程
每個範例都包含詳細註解,解釋每一步驟,非常適合完全的新手!
👉 從範例開始 👈
課程
![]() |
|---|
| 資料科學初學者:路線圖 - 圖解筆記由 @nitya |
| Lesson Number | Topic | Lesson Grouping | Learning Objectives | Linked Lesson | Author |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | Introduction | 了解資料科學的基本概念,以及它與人工智慧、機器學習和大數據的關係。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | Introduction | 資料倫理概念、挑戰與框架。 | 課程 | Nitya |
| 03 | 定義資料 | Introduction | 資料如何被分類以及其常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率簡介 | Introduction | 使用機率與統計的數學技巧來理解資料。 | 課程 影片 | Dmitry |
| 05 | 處理關聯式資料 | Working With Data | 關聯式資料介紹,以及使用結構化查詢語言(SQL,發音 “see-quell”)來探索與分析關聯式資料的基礎。 | 課程 | Christopher |
| 06 | 處理 NoSQL 資料 | Working With Data | 非關聯式資料介紹、其各種類型,以及探索與分析文件型資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python 處理資料 | Working With Data | 使用 Python 進行資料探索的基礎,包含 Pandas 等函式庫。建議具備 Python 程式設計的基本理解。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | Working With Data | 關於清理與轉換資料的技術,處理遺失、不準確或不完整資料的挑戰。 | 課程 | Jasmine |
| 09 | 數量視覺化 | Data Visualization | 學習如何使用 Matplotlib 來視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 資料分佈視覺化 | Data Visualization | 視覺化區間內的觀察值與趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | Data Visualization | 視覺化離散與分組百分比。 | 課程 | Jen |
| 12 | 關係視覺化 | Data Visualization | 視覺化資料集合及其變數之間的連結與相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | Data Visualization | 製作有助於有效問題解決與洞察的視覺化技術與指引。 | 課程 | Jen |
| 14 | 資料科學生命週期導論 | Lifecycle | 介紹資料科學生命週期及其第一步:取得與擷取資料。 | 課程 | Jasmine |
| 15 | 分析 | Lifecycle | 資料科學生命週期中專注於資料分析的階段。 | 課程 | Jasmine |
| 16 | 溝通 | Lifecycle | 資料科學生命週期中專注於以易於決策者理解的方式呈現資料洞察的階段。 | 課程 | Jalen |
| 17 | 雲端的資料科學 | Cloud Data | 這系列課程介紹雲端的資料科學及其好處。 | 課程 | Tiffany and Maud |
| 18 | 雲端的資料科學 | Cloud Data | 使用低程式碼工具訓練模型。 | 課程 | Tiffany and Maud |
| 19 | 雲端的資料科學 | Cloud Data | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany and Maud |
| 20 | 應用中的資料科學 | In the Wild | 真實世界中以資料科學驅動的專案。 | 課程 | Nitya |
GitHub Codespaces
請依照下列步驟在 Codespace 中開啟此範例:
- 點選 Code 下拉選單並選擇 Open with Codespaces 選項。
- 在窗格底部選擇 + New codespace。 如需更多資訊,請參閱 GitHub documentation。
VSCode Remote - Containers
請依照下列步驟,使用您本機的 VS Code 與 Remote - Containers 延伸功能,在容器中開啟這個儲存庫:
- 若您是第一次使用開發容器,請先確保您的系統符合前置需求(例如已安裝 Docker),詳見 the getting started documentation。
要使用此儲存庫,您可以選擇在獨立的 Docker 卷中開啟儲存庫:
Note: Under the hood, this will use the Remote-Containers: Clone Repository in Container Volume... command to clone the source code in a Docker volume instead of the local filesystem. Volumes are the preferred mechanism for persisting container data.
或是開啟本機已 clone 或下載的儲存庫版本:
- 將此儲存庫複製到您的本機檔案系統。
- 按下 F1 並選擇 Remote-Containers: Open Folder in Container... 指令。
- 選擇此資料夾的複製版本,等待容器啟動後即可開始使用。
離線存取
您可以使用 Docsify 來離線執行此文件。Fork 此儲存庫,在您的本機安裝 Docsify,然後在此儲存庫的根目錄輸入 docsify serve。網站會在您的本機 localhost 的 3000 埠提供:localhost:3000。
注意,notebooks 不會透過 Docsify 來呈現,因此當您需要執行 notebook 時,請在啟動 Python kernel 的 VS Code 中另行執行。
其他課程
Our team produces other curricula! Check out:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心學習
Copilot 系列
取得協助
遇到問題嗎? 請查看我們的 疑難排解指南 以獲取常見問題的解決方法。
如果您遇到困難或對建立 AI 應用程式有任何疑問,請加入其他學習者與經驗豐富的開發人員,一起參與關於 MCP 的討論。這是一個互相支持的社群,歡迎提出問題並自由分享知識。
如果您在構建過程中有產品回饋或遇到錯誤,請造訪:
免責聲明: 本文件透過 AI 翻譯服務 Co‑op Translator(https://github.com/Azure/co-op-translator)進行翻譯。雖然我們盡力確保準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應視為具權威性的來源。對於關鍵資訊,建議採用專業人工翻譯。我們不對因使用本翻譯而產生的任何誤解或誤譯承擔責任。



