|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
初學者數據科學課程大綱
微軟 Azure Cloud Advocates 很高興能提供一個長達 10 週、包含 20 課的完整數據科學課程。每個課程包含課前和課後的小測驗、完成課程的書面指示、解答方案及作業。我們的專案導向教學法讓你在實作中學習,是一種證明能讓新技能更易吸收的學習方式。
衷心感謝我們的作者: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審查者及內容貢獻者, 包括 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初學者數據科學 - 筆記速寫由 @nitya 製作 |
🌐 多語言支援
透過 GitHub Action 支援(自動且保持最新)
阿拉伯文 | 孟加拉文 | 保加利亞文 | 緬甸語 | 中文 (簡體) | 中文 (繁體, 香港) | 中文 (繁體, 澳門) | 中文 (繁體, 台灣) | 克羅地亞文 | 捷克文 | 丹麥文 | 荷蘭文 | 愛沙尼亞文 | 芬蘭文 | 法文 | 德文 | 希臘文 | 希伯來文 | 印地文 | 匈牙利文 | 印尼文 | 義大利文 | 日文 | 卡納達語 | 韓文 | 立陶宛文 | 馬來文 | 馬拉雅拉姆語 | 馬拉地語 | 尼泊爾語 | 尼日利亞皮欽語 | 挪威文 | 波斯文 (法爾西語) | 波蘭文 | 葡萄牙文 (巴西) | 葡萄牙文 (葡萄牙) | 旁遮普文 (古魯穆奇) | 羅馬尼亞文 | 俄文 | 塞爾維亞文 (西里爾字母) | 斯洛伐克文 | 斯洛維尼亞文 | 西班牙文 | 斯瓦希里語 | 瑞典文 | 他加祿語 (菲律賓語) | 泰米爾語 | 泰盧固語 | 泰文 | 土耳其文 | 烏克蘭文 | 烏爾都語 | 越南文
偏好本地克隆?
本倉庫包含超過 50 種語言的翻譯,這會大幅增加下載大小。若想不包含翻譯檔案克隆,請使用 sparse checkout:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'如此,你將擁有完成課程所需的一切,且下載速度更快。
如果你希望我們支援更多翻譯語言,請參閱 這裡
加入我們的社群
我們正在 Discord 舉辦 Learn with AI 系列活動,詳情及加入請見 Learn with AI 系列。活動期間為 2025 年 9 月 18 日至 30 日。你將學到如何使用 GitHub Copilot 進行數據科學的技巧。
你是學生嗎?
開始使用以下資源:
- 學生中心頁面 此頁面包含初學者資源、學生套裝,甚至取得免費認證憑證的方法。這是一個你應該加到書籤並不時瀏覽的頁面,因為我們至少每月會更新內容。
- Microsoft Learn 學生大使 加入全球學生大使社群,這或許是你踏入微軟的途徑。
快速入門
📚 文件資料
👨🎓 學生專區
完全初學者:不熟悉數據科學?可從我們的初學者友善範例開始!這些簡單且有充分註解的範例幫助你理解基礎,然後再投入完整課程。 學生:若想自己使用此課程,請 fork 全部資源,自行完成練習,先從課前測驗開始,再閱讀課程並完成剩餘活動。嘗試透過理解課程內容自行建立專案,而非直接複製解答代碼;不過這些解答代碼在每個專案導向課程的 /solutions 資料夾中可查閱。另一個方法是與朋友組成讀書會,共同學習。進階學習我們推薦 Microsoft Learn。
快速開始:
- 查閱安裝指南,設置你的環境
- 參考使用指南,瞭解課程操作方式
- 從第一課開始,依序完成
- 加入我們的Discord 社群尋求支援
👩🏫 老師專區
認識團隊
動圖作者 Mohit Jaisal
🎥 點擊上方圖片觀看關於此專案及創作者的影片!
教學法
我們在建立此課程時選擇了兩個教學原則:確保課程以專案為基礎並包含頻繁的測驗。完成此系列後,學生將學習到資料科學的基本原理,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際應用案例等。
此外,課前的低壓力測驗能設定學生學習主題的意向,課後的第二次測驗則確保學習的鞏固。此課程設計靈活且有趣,可以完整或部分學習。專案從簡單開始,並在十週週期結束時變得越來越複雜。
每堂課包括:
- 非必需的草圖筆記
- 非必需的補充影片
- 課前熱身測驗
- 書面課程內容
- 專案課程附帶專案建立的逐步指南
- 知識檢查
- 挑戰任務
- 補充閱讀資料
- 作業
- 課後測驗
關於測驗的說明:全部測驗都包含在 Quiz-App 資料夾中,共有 40 個測驗,每個測驗三個問題。測驗在課程內有連結,但該測驗應用程式可在本地執行或部署到 Azure;請依照
quiz-app資料夾內的說明操作。測驗正在逐步在地化。
🎓 初學者友善範例
資料科學新手? 我們創建了特別的範例目錄,提供簡單、註解詳盡的程式碼,助你入門:
- 🌟 Hello World - 你的第一個資料科學程式
- 📂 載入資料 - 學習讀取與探索資料集
- 📊 簡單分析 - 計算統計數據並找出模式
- 📈 基礎視覺化 - 製作圖表和曲線圖
- 🔬 真實專案 - 從頭到尾完成工作流程
每個範例都包含詳細註解,解釋每一步,適合完全沒有經驗的初學者!
👉 從範例開始 👈
課程列表
![]() |
|---|
| 資料科學初學者路線圖 - 草圖筆記由 @nitya 製作 |
| 課程編號 | 主題 | 課程分組 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | 介紹 | 了解資料科學背後的基本概念,以及它如何與人工智慧、機器學習和大數據相關。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理概念、挑戰與框架。 | 課程 | Nitya |
| 03 | 定義資料 | 介紹 | 資料如何分類及其常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率入門 | 介紹 | 了解機率與統計的數學技術以理解資料。 | 課程 影片 | Dmitry |
| 05 | 處理關聯式資料 | 資料處理 | 介紹關聯式資料,並使用結構化查詢語言(SQL,發音為“see-quell”)探究與分析關聯式資料的基礎。 | 課程 | Christopher |
| 06 | 處理 NoSQL 資料 | 資料處理 | 介紹非關聯式資料及其不同種類,並介紹探索與分析文件型資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料處理 | 使用 Python 進行資料探索的基礎,涵蓋 Pandas 等程式庫。建議具備基礎的 Python 程式設計知識。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 資料處理 | 介紹清理與轉換資料的技術,應對缺失、不準確或不完整資料的挑戰。 | 課程 | Jasmine |
| 09 | 視覺化數量 | 資料視覺化 | 學習使用 Matplotlib 視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 視覺化資料分佈 | 資料視覺化 | 視覺化觀察值及區間內趨勢。 | 課程 | Jen |
| 11 | 視覺化比例 | 資料視覺化 | 視覺化離散值與分組百分比。 | 課程 | Jen |
| 12 | 視覺化關係 | 資料視覺化 | 視覺化資料集合與其變數間的連結與相關關係。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 製作有效解決問題並獲得洞察的視覺化技巧與指導。 | 課程 | Jen |
| 14 | 資料科學生命週期入門 | 生命週期 | 介紹資料科學生命週期及其第一步:取得與擷取資料。 | 課程 | Jasmine |
| 15 | 分析階段 | 生命週期 | 資料科學生命週期中專注於資料分析的階段。 | 課程 | Jasmine |
| 16 | 溝通階段 | 生命週期 | 專注於用易於決策者理解的方式呈現資料洞察的生命週期階段。 | 課程 | Jalen |
| 17 | 雲端資料科學 | 雲端資料 | 介紹雲端資料科學及其優勢的系列課程。 | 課程 | Tiffany 和 Maud |
| 18 | 雲端資料科學 | 雲端資料 | 使用低程式碼工具訓練模型。 | 課程 | Tiffany 和 Maud |
| 19 | 雲端資料科學 | 雲端資料 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 和 Maud |
| 20 | 實務資料科學 | 實務 | 資料科學驅動的真實世界專案。 | 課程 | Nitya |
GitHub Codespaces
按照以下步驟在 Codespace 中開啟此範例:
- 點擊 Code 下拉選單並選擇 Open with Codespaces 選項。
- 在面板底部點選 + New codespace。 欲了解更多資訊,請參考 GitHub 文件。
VSCode Remote - Containers
按照以下步驟使用本地機器及 VSCode 的 VS Code Remote - Containers 擴充套件,在容器中開啟此專案庫:
- 如果您是第一次使用開發容器,請先確保系統符合前置需求(例如安裝 Docker),詳見入門文件。
您可以選擇在獨立 Docker 卷中開啟此專案庫:
注意:這會使用 Remote-Containers 的 Clone Repository in Container Volume... 命令,將原始碼克隆到 Docker 卷中,而非本機檔案系統。卷是持久化容器資料的推薦機制。
或者開啟已本地克隆或下載的專案庫版本:
- 將此專案庫克隆到本機檔案系統。
- 按 F1 並選擇 Remote-Containers: Open Folder in Container... 命令。
- 選擇本機克隆的資料夾,等待容器啟動後開始使用。
離線存取
您可以使用 Docsify 離線運行此文件。先 Fork 此倉庫,於本機安裝 Docsify,接著在本專案根目錄輸入 docsify serve。網站將在本地主機的 3000 埠運行:localhost:3000。
注意,筆記本不會被 Docsify 呈現,若需要運行筆記本,請在 VS Code 以 Python 核心單獨運行。
其他課程
我們團隊還製作其他課程!請參考:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心學習
Copilot 系列
尋求協助
遇到問題? 請查看我們的疑難解答指南,了解常見問題的解決方法。
如果你卡住了或對構建 AI 應用有任何疑問,歡迎加入 MCP 的學習者與經驗豐富的開發者討論社群。這是一個支持性的社區,歡迎提出問題並自由分享知識。
如果你在構建過程中有產品反饋或錯誤,請造訪:
免責聲明: 本文件由 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們力求準確,但請注意自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應視為權威來源。對於重要資訊,建議採用專業人工作翻譯。因使用本翻譯而產生的任何誤解或誤釋,本公司概不負責。



