|
|
5 months ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 5 months ago | |
| 2-Working-With-Data | 5 months ago | |
| 3-Data-Visualization | 6 months ago | |
| 4-Data-Science-Lifecycle | 6 months ago | |
| 5-Data-Science-In-Cloud | 6 months ago | |
| 6-Data-Science-In-Wild | 6 months ago | |
| docs | 6 months ago | |
| examples | 5 months ago | |
| quiz-app | 6 months ago | |
| sketchnotes | 6 months ago | |
| AGENTS.md | 5 months ago | |
| CODE_OF_CONDUCT.md | 6 months ago | |
| CONTRIBUTING.md | 5 months ago | |
| INSTALLATION.md | 5 months ago | |
| README.md | 5 months ago | |
| SECURITY.md | 6 months ago | |
| SUPPORT.md | 6 months ago | |
| TROUBLESHOOTING.md | 5 months ago | |
| USAGE.md | 5 months ago | |
| for-teachers.md | 6 months ago | |
README.md
初學者的數據科學課程
Microsoft 的 Azure Cloud Advocates 很高興提供一個為期 10 週、共 20 節課的數據科學課程。每節課都包含課前和課後測驗、完成課程的書面指導、解決方案以及作業。我們的基於項目的教學法讓您在實際建構中學習,這是一種能讓新技能牢牢掌握的有效方法。
衷心感謝我們的作者: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審稿人和內容貢獻者, 特別是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi。
![]() |
|---|
| 初學者的數據科學 - 由 @nitya 繪製的速寫 |
🌐 多語言支持
通過 GitHub Action 支持(自動化且始終保持最新)
阿拉伯語 | 孟加拉語 | 保加利亞語 | 緬甸語 | 中文(簡體) | 中文(繁體,香港) | 中文(繁體,澳門) | 中文(繁體,台灣) | 克羅地亞語 | 捷克語 | 丹麥語 | 荷蘭語 | 愛沙尼亞語 | 芬蘭語 | 法語 | 德語 | 希臘語 | 希伯來語 | 印地語 | 匈牙利語 | 印尼語 | 意大利語 | 日語 | 韓語 | 立陶宛語 | 馬來語 | 馬拉地語 | 尼泊爾語 | 挪威語 | 波斯語(法爾西語) | 波蘭語 | 葡萄牙語(巴西) | 葡萄牙語(葡萄牙) | 旁遮普語(古木基文) | 羅馬尼亞語 | 俄語 | 塞爾維亞語(西里爾文) | 斯洛伐克語 | 斯洛文尼亞語 | 西班牙語 | 斯瓦希里語 | 瑞典語 | 塔加洛語(菲律賓語) | 泰米爾語 | 泰語 | 土耳其語 | 烏克蘭語 | 烏爾都語 | 越南語
如果您希望支持其他翻譯語言,請參考 此處
加入我們的社群
我們正在進行一個 Discord 的 AI 學習系列,了解更多並加入我們的 AI 學習系列,活動時間為 2025 年 9 月 18 日至 30 日。您將獲得使用 GitHub Copilot 進行數據科學的技巧和建議。
您是學生嗎?
請從以下資源開始:
- 學生中心頁面 在此頁面中,您可以找到初學者資源、學生包以及獲得免費認證憑證的方法。這是一個您需要收藏並不時查看的頁面,因為我們至少每月更換一次內容。
- Microsoft Learn 學生大使 加入全球學生大使社群,這可能是您進入 Microsoft 的途徑。
開始使用
📚 文件
👨🎓 給學生
完全初學者:對數據科學完全陌生?從我們的 初學者範例 開始!這些簡單且有詳細註解的範例將幫助您在深入課程之前理解基礎知識。 學生:如果您想自行使用此課程,請分叉整個倉庫並自行完成練習,從課前測驗開始。然後閱讀講義並完成其餘活動。嘗試通過理解課程內容來創建項目,而不是直接複製解決方案代碼;不過,解決方案代碼可在每個基於項目的課程的 /solutions 文件夾中找到。另一個想法是與朋友組成學習小組,一起學習內容。進一步學習,我們推薦 Microsoft Learn。
快速開始:
- 查看 安裝指南 以設置您的環境
- 閱讀 使用指南 以了解如何使用課程
- 從第一課開始,按順序學習
- 加入我們的 Discord 社群 獲得支持
👩🏫 給教師
認識團隊
Gif 作者 Mohit Jaisal
🎥 點擊上方圖片觀看關於此項目及其創作者的影片!
教學法
我們在設計這份課程時選擇了兩個教學原則:確保課程以專案為基礎,並包含頻繁的測驗。到這系列課程結束時,學生將學習到資料科學的基本原則,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際應用案例等。
此外,課前的低壓測驗可以幫助學生專注於學習主題,而課後的第二次測驗則能加強記憶。這份課程設計靈活且有趣,可以完整學習或選擇部分內容。專案從簡單開始,並在10週的循環結束時逐漸變得複雜。
每節課包含:
- 可選的手繪筆記
- 可選的補充影片
- 課前暖身測驗
- 書面課程
- 專案型課程的逐步指導
- 知識檢查
- 挑戰
- 補充閱讀
- 作業
- 課後測驗
關於測驗的說明:所有測驗都包含在 Quiz-App 資料夾中,共有40個測驗,每個測驗包含三個問題。測驗已在課程中鏈接,但測驗應用程式可以在本地運行或部署到 Azure;請按照
quiz-app資料夾中的指示操作。測驗正在逐步本地化。
🎓 初學者友好的範例
剛接觸資料科學? 我們創建了一個特別的 範例目錄,其中包含簡單且有詳細註解的程式碼,幫助您入門:
- 🌟 Hello World - 您的第一個資料科學程式
- 📂 載入資料 - 學習如何讀取和探索資料集
- 📊 簡單分析 - 計算統計數據並尋找模式
- 📈 基礎視覺化 - 創建圖表和圖形
- 🔬 實際專案 - 從頭到尾的完整工作流程
每個範例都包含詳細的註解,解釋每一步,非常適合完全的初學者!
👉 從範例開始 👈
課程
![]() |
|---|
| 資料科學初學者:路線圖 - 由 @nitya 繪製的手繪筆記 |
| 課程編號 | 主題 | 課程分組 | 學習目標 | 課程連結 | 作者 |
|---|---|---|---|---|---|
| 01 | 定義資料科學 | 介紹 | 學習資料科學的基本概念及其與人工智慧、機器學習和大數據的關係。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理概念、挑戰與框架。 | 課程 | Nitya |
| 03 | 定義資料 | 介紹 | 資料的分類及其常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率入門 | 介紹 | 使用機率與統計的數學技術來理解資料。 | 課程 影片 | Dmitry |
| 05 | 使用關聯式資料 | 資料操作 | 關聯式資料的介紹,以及使用結構化查詢語言(SQL,讀作“see-quell”)探索和分析關聯式資料的基礎知識。 | 課程 | Christopher |
| 06 | 使用 NoSQL 資料 | 資料操作 | 非關聯式資料的介紹、其各種類型以及探索和分析文件型資料庫的基礎知識。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料操作 | 使用 Python 進行資料探索的基礎知識,並使用如 Pandas 等庫。建議具備 Python 程式設計的基礎知識。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 資料操作 | 關於清理和轉換資料的技術,以應對資料缺失、不準確或不完整的挑戰。 | 課程 | Jasmine |
| 09 | 數量視覺化 | 資料視覺化 | 學習如何使用 Matplotlib 視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 資料分佈視覺化 | 資料視覺化 | 視覺化區間內的觀察和趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | 資料視覺化 | 視覺化離散和分組百分比。 | 課程 | Jen |
| 12 | 關係視覺化 | 資料視覺化 | 視覺化資料集及其變數之間的連結和相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 提供技術和指導,讓您的視覺化在解決問題和洞察中更具價值。 | 課程 | Jen |
| 14 | 資料科學生命週期介紹 | 生命週期 | 資料科學生命週期的介紹及其第一步:獲取和提取資料。 | 課程 | Jasmine |
| 15 | 分析 | 生命週期 | 資料科學生命週期的這一階段專注於分析資料的技術。 | 課程 | Jasmine |
| 16 | 溝通 | 生命週期 | 資料科學生命週期的這一階段專注於以易於決策者理解的方式呈現資料洞察。 | 課程 | Jalen |
| 17 | 雲端中的資料科學 | 雲端資料 | 這系列課程介紹雲端中的資料科學及其優勢。 | 課程 | Tiffany 和 Maud |
| 18 | 雲端中的資料科學 | 雲端資料 | 使用低代碼工具訓練模型。 | 課程 | Tiffany 和 Maud |
| 19 | 雲端中的資料科學 | 雲端資料 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 和 Maud |
| 20 | 野外的資料科學 | 野外應用 | 資料科學驅動的實際專案。 | 課程 | Nitya |
GitHub Codespaces
按照以下步驟在 Codespace 中打開此範例:
- 點擊 Code 下拉選單,選擇 Open with Codespaces 選項。
- 在面板底部選擇 + New codespace。 更多資訊請查看 GitHub 文件。
VSCode Remote - Containers
按照以下步驟使用本地機器和 VSCode 的 VS Code Remote - Containers 擴展在容器中打開此存儲庫:
- 如果您是第一次使用開發容器,請確保您的系統符合前置需求(例如安裝了 Docker),請參考 入門文檔。
要使用此存儲庫,您可以選擇在隔離的 Docker 卷中打開存儲庫:
注意:在底層,這將使用 Remote-Containers: Clone Repository in Container Volume... 命令將源代碼克隆到 Docker 卷中,而不是本地文件系統。卷 是持久化容器數據的首選機制。
或者打開本地克隆或下載的存儲庫版本:
- 將此存儲庫克隆到您的本地文件系統。
- 按 F1 並選擇 Remote-Containers: Open Folder in Container... 命令。
- 選擇此資料夾的克隆副本,等待容器啟動,然後嘗試操作。
離線訪問
您可以使用 Docsify 離線運行此文檔。Fork 此存儲庫,在您的本地機器上 安裝 Docsify,然後在此存儲庫的根目錄中輸入 docsify serve。網站將在本地端口 3000 上提供服務:localhost:3000。
注意,筆記本文件不會通過 Docsify 渲染,因此當您需要運行筆記本時,請在 VS Code 中使用 Python 核心單獨運行。
其他課程
我們的團隊還製作了其他課程!查看:
- Edge AI for Beginners
- AI Agents for Beginners
- Generative AI for Beginners
- Generative AI for Beginners .NET
- Generative AI with JavaScript
- Generative AI with Java
- AI for Beginners
- Data Science for Beginners
- Bash for Beginners
- ML for Beginners
- Cybersecurity for Beginners
- 初學者的網頁開發
- 初學者的物聯網
- 初學者的機器學習
- 初學者的XR開發
- 精通GitHub Copilot進行AI配對編程
- 初學者的XR開發
- 精通GitHub Copilot:C#/.NET開發者指南
- 選擇你的Copilot冒險
獲取幫助
遇到問題了嗎? 請查看我們的故障排除指南,以解決常見問題。
如果您遇到困難或對構建AI應用有任何疑問,請加入:
如果您有產品反饋或在構建過程中遇到錯誤,請訪問:
免責聲明:
本文件使用 AI 翻譯服務 Co-op Translator 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原文文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用本翻譯而引起的任何誤解或誤讀概不負責。



