8.9 KiB
機器學習簡介
課前測驗
🎥 點擊上方圖片觀看本課程的簡短視頻。
歡迎來到這門針對初學者的經典機器學習課程!無論你是完全新手,還是有經驗的機器學習從業者希望重新學習某個領域,我們都很高興你能加入我們!我們希望為你的機器學習研究創造一個友好的起點,並樂於評估、回應和採納你的反饋。
🎥 點擊上方圖片觀看視頻:麻省理工學院的 John Guttag 介紹機器學習
開始學習機器學習
在開始學習本課程之前,你需要將你的電腦設置好,準備在本地運行筆記本。
- 用這些視頻配置你的電腦。使用以下鏈接學習如何在系統中安裝 Python以及設置文本編輯器進行開發。
- 學習 Python。建議對Python有基本的了解,這是一種對數據科學家非常有用的編程語言,我們在本課程中會使用它。
- 學習 Node.js 和 JavaScript。我們在課程中偶爾會使用 JavaScript 來構建網頁應用,因此你需要安裝 node 和 npm,以及為 Python 和 JavaScript 開發準備好 Visual Studio Code。
- 創建 GitHub 帳戶。既然你在 GitHub 上找到了我們,你可能已經有一個帳戶了,但如果沒有,請創建一個,然後 fork 本課程以供自己使用。(也可以給我們點個星星 😊)
- 探索 Scikit-learn。熟悉 Scikit-learn,這是一組我們在課程中引用的機器學習庫。
什麼是機器學習?
“機器學習”這個術語是當今最流行且最常用的術語之一。如果你對技術有一定的了解,無論你從事什麼領域,都有很大可能至少聽過一次這個術語。然而,機器學習的運作機制對大多數人來說仍然是個謎。對於機器學習初學者來說,這個主題有時可能會讓人感到不知所措。因此,了解機器學習的真正含義並通過實際例子逐步學習它是非常重要的。
熱潮曲線
Google 趨勢顯示了“機器學習”術語的近期熱潮曲線
神秘的宇宙
我們生活在一個充滿迷人謎團的宇宙中。偉大的科學家如史蒂芬·霍金、阿爾伯特·愛因斯坦等人,畢生致力於尋找有意義的信息,以揭示我們周圍世界的奧秘。這是人類學習的本質:人類的孩子隨著成長逐年學習新事物,揭示他們世界的結構。
孩子的大腦
孩子的大腦和感官感知周圍環境的事實,並逐漸學習生活中隱藏的模式,幫助孩子制定邏輯規則來識別已學習的模式。人類大腦的學習過程使人類成為這個世界上最複雜的生物。通過不斷發現隱藏的模式並在這些模式上進行創新,我們能夠在一生中不斷提升自己。這種學習能力和進化能力與一個名為大腦可塑性的概念有關。表面上,我們可以在人類大腦的學習過程和機器學習的概念之間找到一些激勵性的相似之處。
人類大腦
人類大腦從現實世界中感知事物,處理感知到的信息,做出理性決策,並根據情況執行某些行動。這就是我們所說的智能行為。當我們將智能行為過程的模擬編程到機器上時,這就被稱為人工智能(AI)。
一些術語
雖然這些術語可能會混淆,但機器學習(ML)是人工智能的一個重要子集。機器學習專注於使用專門的算法從感知到的數據中發掘有意義的信息並找到隱藏的模式,以支持理性決策過程。
AI、ML、深度學習
一張展示 AI、ML、深度學習和數據科學之間關係的圖表。信息圖由 Jen Looper 製作,靈感來自這張圖
涵蓋的概念
在本課程中,我們將僅涵蓋機器學習的核心概念,這些是初學者必須了解的。我們主要使用 Scikit-learn 來教授所謂的“經典機器學習”,這是一個許多學生用來學習基礎知識的優秀庫。要理解人工智能或深度學習的更廣泛概念,扎實的機器學習基礎知識是不可或缺的,因此我們希望在此提供這些知識。
在本課程中你將學到:
- 機器學習的核心概念
- 機器學習的歷史
- 機器學習與公平性
- 回歸機器學習技術
- 分類機器學習技術
- 聚類機器學習技術
- 自然語言處理機器學習技術
- 時間序列預測機器學習技術
- 強化學習
- 機器學習的實際應用
我們不會涵蓋的內容
- 深度學習
- 神經網絡
- 人工智能
為了提供更好的學習體驗,我們將避免涉及神經網絡的複雜性、“深度學習”——使用神經網絡構建多層模型——以及人工智能,這些內容我們會在另一門課程中討論。我們還將提供即將推出的數據科學課程,專注於這個更大領域的這一方面。
為什麼要學習機器學習?
從系統的角度來看,機器學習被定義為創建能夠從數據中學習隱藏模式以幫助做出智能決策的自動化系統。
這種動機在某種程度上受到人類大腦如何根據外界感知到的數據學習某些事物的啟發。
✅ 想一想,為什麼企業會希望使用機器學習策略,而不是創建基於硬編碼規則的引擎。
機器學習的應用
機器學習的應用現在幾乎無處不在,就像我們社會中流動的數據一樣,這些數據由智能手機、連接設備和其他系統生成。考慮到最先進的機器學習算法的巨大潛力,研究人員一直在探索它們解決多維度和多學科現實問題的能力,並取得了非常積極的成果。
應用機器學習的例子
你可以用多種方式使用機器學習:
- 從患者的病史或報告中預測疾病的可能性。
- 利用天氣數據預測天氣事件。
- 理解文本的情感。
- 檢測假新聞以阻止宣傳的傳播。
金融、經濟、地球科學、太空探索、生物醫學工程、認知科學,甚至人文領域都已經採用機器學習來解決其領域中繁重的數據處理問題。
結論
機器學習通過從現實世界或生成的數據中發現有意義的洞察來自動化模式發現的過程。它已經在商業、健康和金融應用等領域證明了自己的巨大價值。
在不久的將來,了解機器學習的基礎知識將成為任何領域的人必須掌握的技能,因為它的廣泛採用。
🚀 挑戰
用紙或使用像 Excalidraw 這樣的在線應用程序,繪製你對 AI、ML、深度學習和數據科學之間差異的理解。添加一些這些技術擅長解決的問題的想法。
課後測驗
回顧與自學
要了解更多關於如何在雲端使用機器學習算法,請參考這個學習路徑。
參加一個關於機器學習基礎的學習路徑。
作業
免責聲明:
此文件已使用人工智能翻譯服務 Co-op Translator 翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解讀概不負責。