|
|
1 month ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 1 month ago | |
| 2-Working-With-Data | 1 month ago | |
| 3-Data-Visualization | 1 month ago | |
| 4-Data-Science-Lifecycle | 1 month ago | |
| 5-Data-Science-In-Cloud | 1 month ago | |
| 6-Data-Science-In-Wild | 1 month ago | |
| docs | 1 month ago | |
| examples | 1 month ago | |
| quiz-app | 1 month ago | |
| sketchnotes | 1 month ago | |
| .co-op-translator.json | 1 month ago | |
| AGENTS.md | 1 month ago | |
| CODE_OF_CONDUCT.md | 1 month ago | |
| CONTRIBUTING.md | 1 month ago | |
| INSTALLATION.md | 1 month ago | |
| README.md | 1 month ago | |
| SECURITY.md | 1 month ago | |
| SUPPORT.md | 1 month ago | |
| TROUBLESHOOTING.md | 1 month ago | |
| USAGE.md | 1 month ago | |
| for-teachers.md | 1 month ago | |
README.md
Data Science for Beginners - 一份課程大綱
微軟 Azure Cloud Advocates 很高興能提供一份為期 10 週、包含 20 課的資料科學課程大綱。每課都包含課前及課後小測、完成課程的文字指示、解答及作業。我們以專案為本的教學法讓你在實作中學習,這是讓新技能紮根的有效方式。
誠摯感謝我們的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft Student Ambassador 作者、審核者及內容貢獻者, 包括 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 初學者資料科學 - 手繪筆記由 @nitya 製作 |
🌐 多語言支援
透過 GitHub Action 支援(自動且持續更新)
阿拉伯語 | 孟加拉語 | 保加利亞語 | 緬甸語(Myanmar) | 中文(簡體) | 中文(繁體,香港) | 中文(繁體,澳門) | 中文(繁體,臺灣) | 克羅地亞語 | 捷克語 | 丹麥語 | 荷蘭語 | 愛沙尼亞語 | 芬蘭語 | 法語 | 德語 | 希臘語 | 希伯來語 | 印地語 | 匈牙利語 | 印尼語 | 義大利語 | 日語 | 坎納達語 | 韓語 | 立陶宛語 | 馬來語 | 馬拉雅拉姆語 | 馬拉地語 | 尼泊爾語 | 尼日利亞皮欽語 | 挪威語 | 波斯語(法爾西) | 波蘭語 | 葡萄牙語(巴西) | 葡萄牙語(葡萄牙) | 旁遮普語(Gurmukhi) | 羅馬尼亞語 | 俄語 | 塞爾維亞語(西里爾字母) | 斯洛伐克語 | 斯洛文尼亞語 | 西班牙語 | 斯瓦希里語 | 瑞典語 | 他加祿語(菲律賓語) | 泰米爾語 | 泰盧固語 | 泰語 | 土耳其語 | 烏克蘭語 | 烏爾都語 | 越南語
想要本地克隆?
本儲存庫包含 50 多種語言翻譯,會大幅增加下載量。若想克隆但不含翻譯,請使用稀疏簽出:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'這樣你就可以用更快的下載速度取得所有完成課程所需的資料。
若您希望支持額外語言,請參閱這裡
加入我們的社區
我們有正在進行的 Discord AI 學習系列,詳細信息及加入請見 Learn with AI Series,活動時間為 2025 年 9 月 18 日至 30 日。你將會學習使用 GitHub Copilot 做資料科學的技巧與秘訣。
你是學生嗎?
請先從以下資源開始:
- 學生中心頁面 這頁面提供初學者資源、學生套件,甚至獲取免費認證券的途徑。這頁值得收藏並偶爾回來看看,因為內容每月至少調整一次。
- Microsoft Learn 學生大使 加入全球學生大使社群,有可能是踏入微軟的契機。
上手指南
📚 文件
👨🎓 學生專區
完全初學者: 資料科學新手?請先從我們的初學者友好範例開始!這些簡單且詳細註解的範例將幫助你在深入全課程前掌握基礎。 學生們:欲自行使用課程,請 fork 整個倉庫並依序完成練習,從課前小測開始。閱讀講義並完成後續活動。建議以理解課程內容的方式完成專案,而非直接抄寫解答;不過每一專案導向課程的 /solutions 資料夾有完整解答碼。你也可以與朋友組成讀書會,共同研讀。欲進一步學習,我們推薦Microsoft Learn。
快速開始:
- 查看安裝指南以設置你的環境
- 閱讀使用指南學習如何使用課程材料
- 從第一課開始,按順序進行
- 加入我們的Discord 社群尋求幫助
👩🏫 教師專區
認識團隊
動圖製作者 Mohit Jaisal
🎥 點擊上方圖片觀看關於此專案與創建團隊的影片!
教學法
在建立本課程時,我們選擇了兩個教學原則:確保課程以專案為基礎,並且包含頻繁的小測驗。透過這系列課程,學生將學習數據科學的基本原理,包括倫理概念、數據準備、不同的數據處理方式、數據視覺化、數據分析、數據科學的實際案例等等。
此外,課前一個低風險的小測驗能幫助學生設定學習該主題的目標,課後的第二個小測驗則確保更好的記憶與吸收。本課程設計靈活且充滿趣味,可全部或部分進行。專案從小規模開始,逐漸變得更為複雜,直至10週的學習周期結束。
每堂課包含:
- 選擇性的手繪筆記
- 選擇性的補充影片
- 課前熱身小測驗
- 課文講義
- 對於專案式課程,有一步步的專案製作指引
- 知識檢測
- 挑戰題
- 補充閱讀資料
- 功課
- 課後小測驗
關於測驗的小提示:所有測驗都收納於 Quiz-App 資料夾,總計40個測驗,每個測驗含三個問題。測驗會從課程中連結,但也可以在本地執行或部署至 Azure;請參考
quiz-app資料夾中的指示。這些測驗正逐步進行本地化。
🎓 初學者友善範例
第一次接觸數據科學? 我們創建了特別的範例目錄,提供簡單且註解詳盡的程式碼幫助您入門:
- 🌟 Hello World - 您的第一個數據科學程式
- 📂 資料載入 - 學習讀取並探索資料集
- 📊 簡單分析 - 計算統計數據並尋找模式
- 📈 基本視覺化 - 製作圖表與圖形
- 🔬 實務專案 - 從頭到尾完成工作流程
每個範例都包含詳盡的註解說明每一步,非常適合完全的新手!
👉 從範例開始 👈
課程
![]() |
|---|
| 初學者數據科學課程地圖 - 手繪筆記由 @nitya 製作 |
| 課程編號 | 主題 | 課程分類 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義數據科學 | 介紹 | 了解數據科學背後的基本概念,以及其與人工智能、機器學習及大數據的關係。 | 課程 影片 | Dmitry |
| 02 | 數據科學倫理 | 介紹 | 數據倫理概念、挑戰和框架。 | 課程 | Nitya |
| 03 | 定義數據 | 介紹 | 瞭解數據如何分類及其常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率導論 | 介紹 | 使用機率與統計數學技術來理解數據。 | 課程 影片 | Dmitry |
| 05 | 使用關聯式數據 | 資料操作 | 介紹關聯式數據及如何使用結構化查詢語言(SQL,發音「see-quell」)來探索和分析關聯式資料的基礎。 | 課程 | Christopher |
| 06 | 使用 NoSQL 數據 | 資料操作 | 介紹非關聯式數據、各類型別以及如何探索和分析文件型資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料操作 | 使用 Python 及如 Pandas 等函式庫進行數據探索的基礎。建議具備 Python 程式設計基礎。 | 課程 影片 | Dmitry |
| 08 | 數據準備 | 資料操作 | 涵蓋清理與轉換數據的技術,應對遺失、不準確及不完整數據的挑戰。 | 課程 | Jasmine |
| 09 | 量化視覺化 | 數據視覺化 | 學習如何使用 Matplotlib 視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 數據分布視覺化 | 數據視覺化 | 視覺化區間內的觀察與趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | 數據視覺化 | 視覺化離散與群組百分比。 | 課程 | Jen |
| 12 | 關係視覺化 | 數據視覺化 | 視覺化資料集及其變數間的連結與關聯。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 數據視覺化 | 製作有效解決問題與洞察的有價值視覺化的技巧與指導。 | 課程 | Jen |
| 14 | 數據科學生命週期導論 | 生命週期 | 介紹數據科學生命週期及其首步──獲取與擷取數據。 | 課程 | Jasmine |
| 15 | 分析階段 | 生命週期 | 數據科學生命週期中專注於分析數據的階段技巧。 | 課程 | Jasmine |
| 16 | 溝通階段 | 生命週期 | 數據科學生命週期中專注於以便於決策者理解的方式呈現數據洞察的階段。 | 課程 | Jalen |
| 17 | 雲端數據科學 | 雲端數據 | 介紹雲端數據科學及其優勢的系列課程。 | 課程 | Tiffany 及 Maud |
| 18 | 雲端數據科學 | 雲端數據 | 使用 Low Code 工具訓練模型。 | 課程 | Tiffany 及 Maud |
| 19 | 雲端數據科學 | 雲端數據 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 及 Maud |
| 20 | 真實世界的數據科學 | 真實世界 | 真實世界中由數據科學驅動的專案。 | 課程 | Nitya |
GitHub Codespaces
請依照以下步驟以 Codespace 開啟此範例:
- 點擊 Code 下拉選單並選擇 Open with Codespaces。
- 在側邊欄底部選擇 + New codespace。 更多資訊請參見 GitHub 文件。
VSCode Remote - Containers
請依照以下步驟,透過本機與 VSCode 並利用 VS Code Remote - Containers 擴充功能,在容器中開啟此儲存庫:
- 若首次使用開發容器,請確認系統符合先決條件(例如已安裝 Docker),詳見入門文件。
使用此儲存庫,可選擇以隔離的 Docker 磁碟區開啟:
注意:背後將使用 Remote-Containers: Clone Repository in Container Volume... 指令,在 Docker 磁碟區克隆原始碼,而非使用本地檔案系統。Volumes 是持久化容器數據的推薦方式。
或開啟本地克隆或下載的儲存庫版本:
- 將儲存庫克隆至本機檔案系統。
- 按 F1 並選擇 Remote-Containers: Open Folder in Container... 指令。
- 選擇該資料夾的複本,等候容器啟動後開始試用。
離線存取
您可以透過使用 Docsify 離線瀏覽此文件。請先分叉此儲存庫,在本機安裝 Docsify,然後在此儲存庫根目錄輸入 docsify serve。網站將在本機的3000埠運行:localhost:3000。
注意,使用 Docsify 時不會渲染筆記本內容,若需執行筆記本,請在 VS Code 中透過 Python 核心另行執行。
其他課程
我們的團隊也提供其他課程!敬請參考:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心學習
Copilot 系列
獲取幫助
遇到問題? 請查看我們的故障排除指南,以獲取常見問題的解決方案。
如果你卡住了或者對構建 AI 應用有任何疑問,加入其他學習者和有經驗的開發者,一起討論 MCP。這是一個支援性強的社群,歡迎提問並自由分享知識。
如果你在構建過程中有產品反饋或發現錯誤,請訪問:
免責聲明: 本文件由人工智能翻譯服務 Co-op Translator 翻譯而成。雖然我們致力於確保準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應視為權威來源。對於重要資訊,建議使用專業人工翻譯。我們對因使用本翻譯而產生的任何誤解或誤釋概不負責。



