|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
Data Science for Beginners - A Curriculum
微軟的 Azure 雲端倡導者很高興提供一份為期 10 週、共 20 課的資料科學課程。每個課程包含課前及課後測驗、完成課程的書面指示、解答與作業。我們採用以專案為基礎的教學法,讓你在實作中學習,這是一種讓新技能得以扎根的有效方式。
衷心感謝以下作者: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審稿人及內容貢獻者, 特別是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初學者資料科學 - 筆記由 @nitya 繪製 |
🌐 多語言支援
透過 GitHub Action 支援(自動且持續更新)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
想要本機複製?
本倉庫包含 50 多種語言翻譯,造成下載大小顯著增加。若要不下載翻譯內容,可使用稀疏檢出:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'這樣能讓你以更快速度下載,並取得完成課程所需的所有內容。
若您希望支援其他翻譯語言,請參考 這裡
加入我們的社群
我們目前有一個 Discord 上的 AI 學習系列活動,詳情請參閱並加入我們的 學習 AI 系列,時間從 2025 年 9 月 18 日到 30 日。你將獲得使用 GitHub Copilot 進行資料科學的各種技巧和小秘訣。
你是學生嗎?
可以使用以下資源開始:
- 學生中心頁面 在這頁面中,你會找到新手資源、學生套件甚至獲得免費證照兌換券的方法。這頁是你應當書籤收藏並不時查看的,因為我們每月至少會更新內容一次。
- Microsoft Learn 學生大使 加入全球的學生大使社群,這也許是你進入微軟的途徑。
開始吧
📚 文件
👨🎓 學生專區
完全初學者:初次接觸資料科學嗎?請從我們的初學者範例開始!這些簡單且有良好註解的範例會幫助你理解基礎,然後再投入完整課程學習。 學生:如果你想單獨使用本課程,請 fork 整個倉庫,然後從課前測驗開始完成練習。之後閱讀課程內容並完成其他活動。試著透過理解課程內容來建立專案,而非直接複製解答程式碼;不過解答程式碼會供在每堂專案導向課程的 /solutions 資料夾中參考。另一種做法是與朋友組成讀書會,共同學習內容。若要進一步學習,我們推薦 Microsoft Learn。
快速開始:
- 查看 安裝指南 設置你的環境
- 複習 使用指南 了解如何使用課程
- 從第一課開始,依序進行
- 加入我們的 Discord 社群 獲得支援
👩🏫 教師專區
認識團隊
Gif 由 Mohit Jaisal
🎥 點擊上方圖片觀看本專案及創作者的影片!
教學法
我們在設計此課程時選擇了兩項教學原則:確保它以專案為基礎,並包括頻繁的小考。系列結束時,學生將學會資料科學的基本原理,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際案例等等。
此外,課前的低壓力小考能讓學生設定學習主題的目標,而課後第二次的小考可以確保進一步的記憶鞏固。此課程設計靈活且有趣,可全程或部分修習。專案由淺入深,在10週週期結束時逐漸複雜。
每堂課包含:
- 可選的手繪筆記
- 可選的補充影片
- 課前暖身小考
- 書面課程內容
- 專案導向課程的逐步專案建置指引
- 知識檢測
- 挑戰任務
- 補充閱讀資料
- 作業
- 課後小考
關於小考的說明:所有小考都包含在 Quiz-App 資料夾中,共有40個小考,每個包含三題。它們在課程中有連結,也可本機運行或部署至 Azure;請參閱
quiz-app資料夾的說明。這些小考正逐步本地化中。
🎓 初學者友好範例
初學資料科學? 我們製作了一個特別的 範例目錄,包含簡單且良好註解的程式碼,幫助您快速入門:
- 🌟 Hello World - 您的第一個資料科學程式
- 📂 載入資料 - 學習讀取並探索資料集
- 📊 簡單分析 - 計算統計並尋找模式
- 📈 基礎視覺化 - 製作圖表
- 🔬 實際專案 - 從頭到尾完成工作流程
每個範例都包含詳細註解,說明每個步驟,非常適合完全初學者!
👉 從範例開始 👈
課程內容
![]() |
|---|
| 資料科學初學者路線圖 - 手繪筆記作者 @nitya |
| 課程編號 | 主題 | 課程分組 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | 介紹 | 了解資料科學的基本概念及其與人工智慧、機器學習與大數據的關係。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理的概念、挑戰與架構。 | 課程 | Nitya |
| 03 | 定義資料 | 介紹 | 資料的分類方法及其常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率入門 | 介紹 | 利用機率與統計數學技術理解資料。 | 課程 影片 | Dmitry |
| 05 | 處理關聯資料 | 處理資料 | 介紹關聯資料及使用結構化查詢語言(SQL,讀作 “see-quell”)探索與分析關聯資料的基礎。 | 課程 | Christopher |
| 06 | 處理 NoSQL 資料 | 處理資料 | 介紹非關聯資料、其不同類型以及探索與分析文件型資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 處理資料 | 使用 Python 及其如 Pandas 等函式庫進行資料探索的基礎。建議具備 Python 程式設計的基礎知識。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 處理資料 | 涉及清理與轉換資料的技巧,處理資料遺失、不準確或不完整的挑戰。 | 課程 | Jasmine |
| 09 | 視覺化數量 | 資料視覺化 | 學習使用 Matplotlib 視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 視覺化資料分布 | 資料視覺化 | 視覺化區間內的觀察與趨勢。 | 課程 | Jen |
| 11 | 視覺化比例 | 資料視覺化 | 視覺化離散及群組百分比。 | 課程 | Jen |
| 12 | 視覺化關係 | 資料視覺化 | 視覺化資料及其變項間的連結與相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 創造有效問題解決與洞察力的視覺化技巧與指引。 | 課程 | Jen |
| 14 | 資料科學生命週期介紹 | 生命週期 | 介紹資料科學生命週期及其第一步的資料取得與萃取。 | 課程 | Jasmine |
| 15 | 分析 | 生命週期 | 資料科學生命週期中專注於資料分析的階段。 | 課程 | Jasmine |
| 16 | 溝通 | 生命週期 | 資料科學生命週期中專注於如何呈現資料洞察,讓決策者更易理解。 | 課程 | Jalen |
| 17 | 雲端資料科學 | 雲端資料 | 介紹雲端資料科學及其優勢。 | 課程 | Tiffany 與 Maud |
| 18 | 雲端資料科學 | 雲端資料 | 使用低程式碼工具訓練模型。 | 課程 | Tiffany 與 Maud |
| 19 | 雲端資料科學 | 雲端資料 | 使用 Azure 機器學習工作室部署模型。 | 課程 | Tiffany 與 Maud |
| 20 | 實務資料科學 | 實務 | 實際生活中的資料科學推動專案。 | 課程 | Nitya |
GitHub Codespaces
按照下列步驟在 Codespace 中打開此範例:
- 點擊 Code 下拉選單並選擇 Open with Codespaces。
- 在面板底部選擇 + New codespace。 更多資訊請參閱 GitHub 文件。
VSCode Remote - Containers
使用 VS Code Remote - Containers 擴充功能,並透過本機機器使用容器打開此倉庫,請依照以下步驟:
- 若是首次使用開發容器,請確保您的系統符合前置需求(例如已安裝 Docker),詳見 入門文件。
欲使用此倉庫,您可以選擇將倉庫開啟於獨立 Docker volume 中:
注意:此方式底層會使用 Remote-Containers 的 Clone Repository in Container Volume... 命令,將原始碼克隆於 Docker volume 而非本地檔案系統。Volumes 是持續保存容器資料的首選方式。
或開啟本地已克隆或下載版本的倉庫:
- 將倉庫克隆到本地檔案系統。
- 按下 F1,選擇 Remote-Containers: Open Folder in Container... 命令。
- 選擇已克隆的資料夾,等待容器啟動後即可開始使用。
離線存取
您可以使用 Docsify 離線運行本文件。先 fork 此倉庫,然後在本地安裝 Docsify(快速開始),接著在此倉庫根目錄下輸入 docsify serve。網頁服務將在本機的3000埠運行:localhost:3000。
注意,筆記本 (notebooks) 無法透過 Docsify 渲染,您需要在 VS Code 中搭配 Python 核心內單獨執行筆記本。
其他教學課程
我們團隊製作了其他教學課程!歡迎參考:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心學習
Copilot 系列
尋求協助
遇到問題? 請查看我們的 疑難排解指南 以尋找常見問題的解決方案。
如果您在構建 AI 應用時卡住或有任何問題,歡迎加入其他學習者和經驗豐富的開發者,一同討論 MCP。這是一個支持性社群,歡迎提問並自由分享知識。
如果您在開發產品時有反饋或遇到錯誤,請訪問:
免責聲明:
本文件係使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們致力於確保翻譯的準確性,但請注意自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應視為權威來源。對於重要資訊,建議採用專業人工翻譯。本公司不對因使用本翻譯內容所引起的任何誤解或曲解承擔責任。



