|
2 weeks ago | |
---|---|---|
.. | ||
1-Introduction | 2 weeks ago | |
2-Working-With-Data | 2 weeks ago | |
3-Data-Visualization | 2 weeks ago | |
4-Data-Science-Lifecycle | 2 weeks ago | |
5-Data-Science-In-Cloud | 2 weeks ago | |
6-Data-Science-In-Wild | 2 weeks ago | |
docs | 4 weeks ago | |
quiz-app | 4 weeks ago | |
sketchnotes | 4 weeks ago | |
CODE_OF_CONDUCT.md | 4 weeks ago | |
CONTRIBUTING.md | 4 weeks ago | |
README.md | 2 weeks ago | |
SECURITY.md | 4 weeks ago | |
SUPPORT.md | 4 weeks ago | |
for-teachers.md | 2 weeks ago |
README.md
初學者的資料科學課程
Microsoft 的 Azure Cloud Advocates 團隊很高興為您提供一個為期 10 週、共 20 節課的資料科學課程。每節課都包含課前和課後測驗、完成課程的書面指導、解答以及作業。我們的專案導向教學法讓您在實作中學習,這是一種被證明能讓新技能更牢固掌握的方法。
特別感謝我們的作者們: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審核者和內容貢獻者們, 特別是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi。
![]() |
---|
初學者的資料科學 - 由 @nitya 繪製的草圖 |
🌐 多語言支援
透過 GitHub Action 支援(自動化且始終保持最新)
法文 | 西班牙文 | 德文 | 俄文 | 阿拉伯文 | 波斯文(法爾西文) | 烏爾都文 | 中文(簡體) | 中文(繁體,澳門) | 中文(繁體,香港) | 中文(繁體,台灣) | 日文 | 韓文 | 印地文 | 孟加拉文 | 馬拉地文 | 尼泊爾文 | 旁遮普文(古木基文) | 葡萄牙文(葡萄牙) | 葡萄牙文(巴西) | 義大利文 | 波蘭文 | 土耳其文 | 希臘文 | 泰文 | 瑞典文 | 丹麥文 | 挪威文 | 芬蘭文 | 荷蘭文 | 希伯來文 | 越南文 | 印尼文 | 馬來文 | 他加祿文(菲律賓文) | 斯瓦希里文 | 匈牙利文 | 捷克文 | 斯洛伐克文 | 羅馬尼亞文 | 保加利亞文 | 塞爾維亞文(西里爾文) | 克羅埃西亞文 | 斯洛維尼亞文 | 烏克蘭文 | 緬甸文(緬甸)
如果您希望支援其他語言,請參考 這裡
加入我們的社群
您是學生嗎?
可以從以下資源開始:
- 學生中心頁面 在這個頁面,您可以找到初學者資源、學生套件,甚至有機會獲得免費認證憑證。這是一個值得收藏並定期查看的頁面,因為我們至少每月更新一次內容。
- Microsoft 學生大使 加入全球學生大使社群,這可能是您進入 Microsoft 的途徑。
開始使用
學生們:如果您想自行使用這份課程,請將整個倉庫分叉,並從課前測驗開始完成練習。接著閱讀課程內容並完成其餘活動。嘗試通過理解課程來創建專案,而不是直接複製解答程式碼;不過,解答程式碼可以在每個專案導向課程的 /solutions 資料夾中找到。另一個建議是與朋友組成學習小組,一起學習這些內容。若需進一步學習,我們推薦 Microsoft Learn。
認識團隊
Gif 作者 Mohit Jaisal
🎥 點擊上方圖片觀看關於這個專案及其創作者的影片!
教學法
在設計這份課程時,我們選擇了兩個教學原則:確保課程是專案導向的,並且包含頻繁的測驗。在這個系列結束時,學生將學會資料科學的基本原則,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實際應用案例等。
此外,課前的低壓力測驗能幫助學生專注於學習主題,而課後的第二次測驗則能進一步加深記憶。這份課程設計靈活且有趣,可以整體學習,也可以部分選修。專案從簡單開始,並在 10 週的課程結束時逐漸變得更具挑戰性。
每堂課包括:
- 可選的手繪筆記
- 可選的補充影片
- 課前暖身測驗
- 書面課程
- 專案型課程的逐步指南,教你如何完成專案
- 知識檢查
- 挑戰
- 補充閱讀
- 作業
- 課後測驗
關於測驗的說明:所有測驗都包含在 Quiz-App 資料夾中,共有 40 個測驗,每個測驗包含三個問題。測驗在課程中有連結,但測驗應用程式可以在本地運行或部署到 Azure;請按照
quiz-app
資料夾中的指示操作。測驗正在逐步本地化。
課程
![]() |
---|
初學者的數據科學:學習路線圖 - 手繪筆記由 @nitya |
課程編號 | 主題 | 課程分組 | 學習目標 | 課程連結 | 作者 |
---|---|---|---|---|---|
01 | 定義數據科學 | 簡介 | 學習數據科學的基本概念,以及它與人工智慧、機器學習和大數據的關係。 | 課程 影片 | Dmitry |
02 | 數據科學倫理 | 簡介 | 數據倫理的概念、挑戰與框架。 | 課程 | Nitya |
03 | 定義數據 | 簡介 | 數據的分類及其常見來源。 | 課程 | Jasmine |
04 | 統計與機率入門 | 簡介 | 使用機率與統計的數學技術來理解數據。 | 課程 影片 | Dmitry |
05 | 使用關聯數據 | 使用數據 | 關聯數據的介紹,以及使用結構化查詢語言(SQL,發音為“see-quell”)探索和分析關聯數據的基礎知識。 | 課程 | Christopher |
06 | 使用 NoSQL 數據 | 使用數據 | 非關聯數據的介紹、其各種類型,以及探索和分析文件型數據庫的基礎知識。 | 課程 | Jasmine |
07 | 使用 Python | 使用數據 | 使用 Python 進行數據探索的基礎知識,並使用如 Pandas 等庫。建議具備 Python 程式設計的基礎知識。 | 課程 影片 | Dmitry |
08 | 數據準備 | 使用數據 | 數據清理與轉換技術,應對缺失、不準確或不完整數據的挑戰。 | 課程 | Jasmine |
09 | 數量的可視化 | 數據可視化 | 學習如何使用 Matplotlib 可視化鳥類數據 🦆 | 課程 | Jen |
10 | 數據分佈的可視化 | 數據可視化 | 可視化區間內的觀察與趨勢。 | 課程 | Jen |
11 | 比例的可視化 | 數據可視化 | 可視化離散與分組百分比。 | 課程 | Jen |
12 | 關係的可視化 | 數據可視化 | 可視化數據集及其變數之間的連結與相關性。 | 課程 | Jen |
13 | 有意義的可視化 | 數據可視化 | 提供技術與指導,讓你的可視化在解決問題與洞察方面更具價值。 | 課程 | Jen |
14 | 數據科學生命周期簡介 | 生命周期 | 數據科學生命周期的介紹及其第一步:數據的獲取與提取。 | 課程 | Jasmine |
15 | 分析 | 生命周期 | 數據科學生命周期中,專注於分析數據的技術。 | 課程 | Jasmine |
16 | 溝通 | 生命周期 | 數據科學生命周期中,專注於以易於決策者理解的方式呈現數據洞察。 | 課程 | Jalen |
17 | 雲端中的數據科學 | 雲端數據 | 這系列課程介紹雲端中的數據科學及其優勢。 | 課程 | Tiffany 和 Maud |
18 | 雲端中的數據科學 | 雲端數據 | 使用低代碼工具訓練模型。 | 課程 | Tiffany 和 Maud |
19 | 雲端中的數據科學 | 雲端數據 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 和 Maud |
20 | 野外的數據科學 | 野外數據 | 現實世界中的數據科學驅動專案。 | 課程 | Nitya |
GitHub Codespaces
按照以下步驟在 Codespace 中開啟此範例:
- 點擊 Code 下拉選單,選擇 Open with Codespaces 選項。
- 在面板底部選擇 + New codespace。 更多資訊請參考 GitHub 文件。
VSCode Remote - Containers
按照以下步驟使用本地機器和 VSCode 的 VS Code Remote - Containers 擴展,在容器中開啟此資料庫:
- 如果是第一次使用開發容器,請確保系統符合前置需求(例如安裝 Docker),詳情請參考入門文件。
使用此資料庫時,可以選擇在隔離的 Docker 卷中開啟:
注意:此操作將使用 Remote-Containers 的 Clone Repository in Container Volume... 命令,將原始碼克隆到 Docker 卷中,而非本地檔案系統。卷是持久化容器數據的首選機制。
或者開啟本地克隆或下載的資料庫版本:
- 將此資料庫克隆到本地檔案系統。
- 按 F1,選擇 Remote-Containers: Open Folder in Container... 命令。
- 選擇克隆的資料夾,等待容器啟動,然後試用。
離線存取
你可以使用 Docsify 離線運行此文件。Fork 此資料庫,在本地機器上安裝 Docsify,然後在此資料庫的根目錄輸入 docsify serve
。網站將在本地端的 3000 端口上運行:localhost:3000
。
注意,筆記本無法通過 Docsify 渲染,因此需要運行筆記本時,請在 VS Code 中使用 Python 核心單獨運行。
其他課程
我們的團隊還製作了其他課程!查看以下內容:
- 初學者的生成式 AI
- 初學者的生成式 AI .NET
- 使用 JavaScript 的生成式 AI
- 使用 Java 的生成式 AI
- 初學者的人工智慧
- 初學者的數據科學
- 初學者的 Bash
- 初學者的機器學習
- 初學者的網路安全
- 初學者的網頁開發
- 初學者的物聯網
- 初學者的機器學習
- 初學者的 XR 開發
- 精通 GitHub Copilot 的 AI 配對程式設計
- 初學者的 XR 開發
- 精通 GitHub Copilot 的 C#/.NET 開發者
- 選擇你的 Copilot 冒險
免責聲明:
本文件已使用 AI 翻譯服務 Co-op Translator 進行翻譯。儘管我們致力於提供準確的翻譯,請注意自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵資訊,建議使用專業人工翻譯。我們對因使用此翻譯而產生的任何誤解或錯誤解釋不承擔責任。