|
|
5 days ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 months ago | |
| 2-Working-With-Data | 5 days ago | |
| 3-Data-Visualization | 4 months ago | |
| 4-Data-Science-Lifecycle | 4 months ago | |
| 5-Data-Science-In-Cloud | 4 months ago | |
| 6-Data-Science-In-Wild | 4 months ago | |
| docs | 4 months ago | |
| examples | 3 months ago | |
| quiz-app | 4 months ago | |
| sketchnotes | 4 months ago | |
| AGENTS.md | 3 months ago | |
| CODE_OF_CONDUCT.md | 4 months ago | |
| CONTRIBUTING.md | 3 months ago | |
| INSTALLATION.md | 3 months ago | |
| README.md | 5 days ago | |
| SECURITY.md | 4 months ago | |
| SUPPORT.md | 4 months ago | |
| TROUBLESHOOTING.md | 3 months ago | |
| USAGE.md | 3 months ago | |
| for-teachers.md | 4 months ago | |
README.md
初學者數據科學課程
微軟 Azure 雲端推廣團隊很高興提供一個為期 10 週、共 20 課的數據科學課程。每課包含課前與課後測驗、完成課程的書面指引、解答與作業。我們以專案為基礎的教學法讓你在實作中學習,是新技能「牢記」的有效方式。
衷心感謝我們的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審稿人及內容貢獻者, 尤其是 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 初學者數據科學 - 筆記由 @nitya 繪製 |
🌐 多語言支援
透過 GitHub Action 支援(自動且持續更新)
阿拉伯語 | 孟加拉語 | 保加利亞語 | 緬甸語 (Myanmar) | 中文 (簡體) | 中文 (繁體,香港) | 中文 (繁體,澳門) | 中文 (繁體,台灣) | 克羅地亞語 | 捷克語 | 丹麥語 | 荷蘭語 | 愛沙尼亞語 | 芬蘭語 | 法語 | 德語 | 希臘語 | 希伯來語 | 印地語 | 匈牙利語 | 印尼語 | 義大利語 | 日語 | 坎納達語 | 韓語 | 立陶宛語 | 馬來語 | 馬拉雅拉姆語 | 馬拉地語 | 尼泊爾語 | 奈及利亞皮欽語 | 挪威語 | 波斯語 (法爾西語) | 波蘭語 | 葡萄牙語 (巴西) | 葡萄牙語 (葡萄牙) | 旁遮普語 (Gurmukhi) | 羅馬尼亞語 | 俄語 | 塞爾維亞語 (西里爾字母) | 斯洛伐克語 | 斯洛維尼亞語 | 西班牙語 | 斯瓦希里語 | 瑞典語 | 他加祿語 (菲律賓語) | 泰米爾語 | 泰盧固語 | 泰語 | 土耳其語 | 烏克蘭語 | 烏爾都語 | 越南語
如果您希望支援更多翻譯語言,請參考 此處
加入我們的社群
我們正在進行 Discord AI 學習系列,詳情及加入請見 Learn with AI Series,活動時間為 2025 年 9 月 18 日至 30 日。你將獲得使用 GitHub Copilot 進行數據科學的技巧與秘訣。
你是學生嗎?
請從以下資源開始:
- 學生中心頁面 在此頁面,你會找到初學者資源、學生套件,甚至有機會獲得免費證書兌換券。這是你想要收藏並不時查看的頁面,因為我們至少每月更新內容。
- Microsoft Learn 學生大使 加入全球學生大使社群,這可能是你進入微軟的途徑。
開始使用
📚 文件
👨🎓 學生專區
完全初學者:剛接觸數據科學?請從我們的初學者友善範例開始!這些簡單且有詳細註解的範例將幫助你理解基礎,然後再深入完整課程。 學生:若想自行使用此課程,請 fork 整個 repo 並自行完成練習,從課前測驗開始。接著閱讀課程內容並完成其餘活動。嘗試透過理解課程內容來建立專案,而非直接複製解答程式碼;不過,每個專案導向課程的 /solutions 資料夾中有解答程式碼可供參考。另一個方法是與朋友組成讀書會,一起學習內容。進一步學習,我們推薦 Microsoft Learn。
快速開始:
- 查看 安裝指南 以設定環境
- 閱讀 使用指南 了解如何使用課程
- 從第一課開始,依序學習
- 加入我們的 Discord 社群 獲得支援
👩🏫 教師專區
認識團隊
Gif 製作者 Mohit Jaisal
🎥 按一下上方圖片觀看有關該專案及其創作者的影片!
教學法
我們在建立此課程時選擇了兩個教學原則:確保它是以專案為基礎,並且包含頻繁的小測驗。在本系列結束時,學生將學會資料科學的基本原則,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際應用案例等。
此外,課前的低壓力小測驗設定學生學習主題的意圖,而課後的第二次小測驗則確保進一步的記憶鞏固。此課程設計靈活且有趣,可全部或部分修讀。專案從簡單開始,並在 10 週週期結束時逐漸變得複雜。
每堂課包含:
- 選擇性手繪筆記
- 選擇性補充影片
- 課前暖身小測驗
- 書面課程內容
- 對於專案導向課程,提供逐步指引教你如何完成專案
- 知識檢核
- 挑戰題
- 補充閱讀
- 作業
- 課後小測驗
關於小測驗的說明:所有小測驗均包含在 Quiz-App 資料夾中,共有 40 個小測驗,每個包含三個問題。它們在課程中有連結,但小測驗應用程式可在本地執行或部署到 Azure;請參考
quiz-app資料夾中的說明。小測驗正逐步進行在地化。
🎓 初學者友善範例
剛接觸資料科學? 我們建立了一個特別的範例目錄,內含簡單且註解詳盡的程式碼,幫助你快速入門:
- 🌟 Hello World - 你的第一個資料科學程式
- 📂 載入資料 - 學習讀取與探索資料集
- 📊 簡單分析 - 計算統計數據並尋找模式
- 📈 基礎視覺化 - 製作圖表與圖形
- 🔬 實務專案 - 從頭到尾完成工作流程
每個範例都包含詳細註解,解釋每個步驟,非常適合完全初學者!
👉 從範例開始 👈
課程列表
![]() |
|---|
| 資料科學初學者路線圖 - 手繪筆記由 @nitya 製作 |
| 課程編號 | 主題 | 課程分類 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | 介紹 | 了解資料科學背後的基本概念,以及它與人工智慧、機器學習和大數據的關係。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理概念、挑戰與框架。 | 課程 | Nitya |
| 03 | 定義資料 | 介紹 | 資料如何分類及其常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率入門 | 介紹 | 使用機率與統計的數學技術來理解資料。 | 課程 影片 | Dmitry |
| 05 | 處理關聯式資料 | 資料處理 | 關聯式資料介紹及使用結構化查詢語言(SQL,發音為「see-quell」)探索與分析關聯式資料的基礎。 | 課程 | Christopher |
| 06 | 處理 NoSQL 資料 | 資料處理 | 非關聯式資料介紹、各種類型及探索與分析文件型資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料處理 | 使用 Python 及 Pandas 等函式庫進行資料探索的基礎。建議具備 Python 程式設計基礎。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 資料處理 | 資料清理與轉換技術,處理缺失、不準確或不完整資料的挑戰。 | 課程 | Jasmine |
| 09 | 數量視覺化 | 資料視覺化 | 學習使用 Matplotlib 視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 資料分布視覺化 | 資料視覺化 | 視覺化區間內的觀察與趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | 資料視覺化 | 視覺化離散與分組百分比。 | 課程 | Jen |
| 12 | 關係視覺化 | 資料視覺化 | 視覺化資料集及其變數間的連結與相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 製作有價值視覺化的技巧與指導,助於有效解決問題與洞察。 | 課程 | Jen |
| 14 | 資料科學生命週期入門 | 生命週期 | 介紹資料科學生命週期及其第一步:取得與擷取資料。 | 課程 | Jasmine |
| 15 | 分析 | 生命週期 | 資料科學生命週期中專注於資料分析的階段。 | 課程 | Jasmine |
| 16 | 溝通 | 生命週期 | 資料科學生命週期中專注於以易於決策者理解的方式呈現資料洞察的階段。 | 課程 | Jalen |
| 17 | 雲端資料科學 | 雲端資料 | 本系列課程介紹雲端資料科學及其優點。 | 課程 | Tiffany 和 Maud |
| 18 | 雲端資料科學 | 雲端資料 | 使用低程式碼工具訓練模型。 | 課程 | Tiffany 和 Maud |
| 19 | 雲端資料科學 | 雲端資料 | 使用 Azure 機器學習工作室部署模型。 | 課程 | Tiffany 和 Maud |
| 20 | 實務資料科學 | 實務 | 真實世界中以資料科學驅動的專案。 | 課程 | Nitya |
GitHub Codespaces
請依照以下步驟在 Codespace 中開啟此範例:
- 按一下 Code 下拉選單,選擇 Open with Codespaces 選項。
- 在面板底部選擇 + New codespace。 更多資訊請參考 GitHub 文件。
VSCode Remote - Containers
請依照以下步驟,使用本機電腦與 VSCode 透過 VS Code Remote - Containers 擴充功能,在容器中開啟此倉庫:
- 若是首次使用開發容器,請確保系統符合先決條件(例如已安裝 Docker),詳見入門文件。
使用此倉庫時,你可以選擇在隔離的 Docker 卷中開啟倉庫:
注意:此操作底層會使用 Remote-Containers: Clone Repository in Container Volume... 指令,將原始碼克隆到 Docker 卷中,而非本地檔案系統。卷 是持久化容器資料的首選機制。
或是開啟本地已克隆或下載的倉庫版本:
- 將此倉庫克隆到本地檔案系統。
- 按 F1,選擇 Remote-Containers: Open Folder in Container... 指令。
- 選擇該資料夾的克隆副本,等待容器啟動,然後開始使用。
離線存取
你可以使用 Docsify 離線瀏覽此文件。先 fork 此倉庫,於本機安裝 Docsify,然後在此倉庫根目錄輸入 docsify serve。網站將在本機的 3000 埠口提供服務:localhost:3000。
注意,筆記本不會透過 Docsify 呈現,若需執行筆記本,請在 VS Code 中使用 Python 核心另行執行。
其他課程
我們團隊還製作其他課程!請參考:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心學習
Copilot 系列
尋求協助
遇到問題? 請查看我們的疑難排解指南,了解常見問題的解決方案。
如果你卡住了或對建立 AI 應用程式有任何疑問,歡迎加入學習者和經驗豐富的開發者社群,一起討論 MCP。這是一個支持性的社群,歡迎提問並自由分享知識。
如果你在開發過程中有產品反饋或錯誤,請造訪:
免責聲明: 本文件係使用人工智能翻譯服務 Co-op Translator 進行翻譯。雖然我哋致力於確保準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件之母語版本應視為權威來源。對於重要資訊,建議採用專業人工翻譯。我哋對因使用本翻譯而引起之任何誤解或誤釋概不負責。



