41 KiB
Data Science for Beginners - หลักสูตร
กลุ่ม Azure Cloud Advocates ที่ Microsoft มีความยินดีที่จะนำเสนอโครงการหลักสูตร 10 สัปดาห์ 20 บทเรียนเกี่ยวกับวิทยาศาสตร์ข้อมูล ทุกบทเรียนรวมถึงแบบทดสอบก่อนบทเรียนและหลังบทเรียน คำแนะนำเป็นลายลักษณ์อักษรสำหรับการทำบทเรียนให้เสร็จสมบูรณ์ ตัวอย่างคำตอบ และแบบฝึกหัด วิธีการเรียนรู้โดยเน้นโครงการช่วยให้คุณเรียนรู้ไปพร้อมกับการสร้างงาน ซึ่งเป็นวิธีที่ได้รับการพิสูจน์แล้วว่าสามารถช่วยให้ทักษะใหม่ๆ ตรึงติด
ขอขอบคุณอย่างจริงใจต่อผู้เขียนของเรา: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 ขอขอบคุณเป็นพิเศษ 🙏 ต่อผู้เขียน, ผู้ตรวจสอบ และผู้ที่มีส่วนร่วมในเนื้อหาจาก Microsoft Student Ambassador, โดยเฉพาะ Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| วิทยาศาสตร์ข้อมูลสำหรับผู้เริ่มต้น - สเก็ตช์โน้ตโดย @nitya |
🌐 รองรับหลายภาษา
รองรับผ่าน GitHub Action (อัตโนมัติและอัปเดตเสมอ)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
ต้องการโคลนลงเครื่อง?
ที่เก็บนี้รวมการแปลภาษามากกว่า 50 ภาษา ซึ่งทำให้ขนาดการดาวน์โหลดเพิ่มขึ้นอย่างมีนัยสำคัญ หากต้องการโคลนโดยไม่รวมการแปล ให้ใช้ sparse checkout:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'วิธีนี้จะให้ทุกอย่างที่คุณต้องใช้สำหรับการเรียนหลักสูตรด้วยการดาวน์โหลดที่เร็วขึ้นมาก
ถ้าคุณต้องการให้รองรับภาษาแปลเพิ่มเติม รายการภาษาที่รองรับมีอยู่ ที่นี่
เข้าร่วมชุมชนของเรา
เรามีซีรีส์เรียนกับ AI บน Discord ที่กำลังดำเนินอยู่ เรียนรู้เพิ่มเติมและเข้าร่วมกับเราได้ที่ Learn with AI Series ตั้งแต่ 18 - 30 กันยายน 2025 คุณจะได้รับเคล็ดลับและเทคนิคในการใช้ GitHub Copilot สำหรับวิทยาศาสตร์ข้อมูล
คุณเป็นนักเรียนหรือไม่?
เริ่มต้นด้วยแหล่งข้อมูลต่อไปนี้:
- หน้า Student Hub ในหน้านี้คุณจะพบแหล่งข้อมูลสำหรับผู้เริ่มต้น ชุดนักเรียน และวิธีรับคูปองใบรับรองฟรี นี่คือหน้าหนึ่งที่คุณควรบุ๊คมาร์กและตรวจสอบเป็นครั้งคราวเพราะเราจะเปลี่ยนเนื้อหาอย่างน้อยเดือนละครั้ง
- Microsoft Learn Student Ambassadors เข้าร่วมชุมชนนักเรียนระดับโลก นี่อาจเป็นช่องทางของคุณเข้าสู่ Microsoft
การเริ่มต้น
📚 เอกสาร
- คู่มือการติดตั้ง - คำแนะนำทีละขั้นตอนสำหรับผู้เริ่มต้น
- คู่มือการใช้งาน - ตัวอย่างและขั้นตอนการทำงานทั่วไป
- แก้ไขปัญหา - วิธีแก้ไขปัญหาที่พบบ่อย
- คู่มือการมีส่วนร่วม - วิธีการมีส่วนร่วมในโครงการนี้
- สำหรับครูผู้สอน - คำแนะนำการสอนและแหล่งข้อมูลในห้องเรียน
👨🎓 สำหรับนักเรียน
ผู้เริ่มต้นอย่างสมบูรณ์: ใหม่กับวิทยาศาสตร์ข้อมูล? เริ่มด้วย ตัวอย่างสำหรับผู้เริ่มต้น! ตัวอย่างง่ายๆ ที่มีคำอธิบายอย่างละเอียดเหล่านี้จะช่วยให้คุณเข้าใจพื้นฐานก่อนเรียนหลักสูตรทั้งหมด นักเรียน: เพื่อใช้หลักสูตรนี้ด้วยตนเอง ให้ fork ทั้ง repository และทำแบบฝึกหัดด้วยตนเอง เริ่มด้วยแบบทดสอบก่อนบรรยาย จากนั้นอ่านบรรยายและทำกิจกรรมที่เหลือให้ครบ พยายามสร้างโครงการโดยเข้าใจบทเรียนแทนที่จะคัดลอกโค้ดคำตอบ อย่างไรก็ตาม โค้ดเหล่านั้นมีให้ในโฟลเดอร์ /solutions ในแต่ละบทเรียนที่เน้นโครงการ อีกแนวคิดหนึ่งคือการตั้งกลุ่มเรียนกับเพื่อนและเรียนรู้เนื้อหาร่วมกัน สำหรับการศึกษาต่อ เราแนะนำ Microsoft Learn.
เริ่มเร็ว:
- ตรวจสอบ คู่มือการติดตั้ง เพื่อตั้งค่าสภาพแวดล้อมของคุณ
- ทบทวน คู่มือการใช้งาน เพื่อเรียนรู้วิธีการใช้หลักสูตร
- เริ่มกับบทเรียนที่ 1 และเรียนตามลำดับ
- เข้าร่วม ชุมชน Discord ของเรา เพื่อรับการสนับสนุน
👩🏫 สำหรับครูผู้สอน
ครูผู้สอน: เรามี ข้อเสนอแนะบางส่วน เกี่ยวกับวิธีใช้หลักสูตรนี้ เราต้องการฟีดแบ็คของคุณ ในฟอรัมอภิปรายของเรา!
พบกับทีมงาน
ภาพเคลื่อนไหวโดย Mohit Jaisal
🎥 คลิกที่ภาพด้านบนเพื่อชมวิดีโอเกี่ยวกับโครงการและผู้ที่อยู่เบื้องหลังการสร้างมัน!
แนวทางการสอน
เราได้เลือกใช้หลักการสอนสองประการในการสร้างหลักสูตรนี้: ให้เป็นโครงการฐานการเรียนรู้และมีแบบทดสอบบ่อย ๆ ภายในตอนจบของชุดนี้ นักเรียนจะได้เรียนรู้หลักการพื้นฐานของวิทยาศาสตร์ข้อมูล รวมถึงแนวคิดด้านจริยธรรม การเตรียมข้อมูล วิธีการต่าง ๆ ในการทำงานกับข้อมูล การแสดงผลข้อมูล การวิเคราะห์ข้อมูล กรณีใช้งานจริงของวิทยาศาสตร์ข้อมูล และอื่น ๆ
นอกจากนี้ แบบทดสอบที่มีความเสี่ยงต่ำก่อนเรียนจะช่วยตั้งจุดมุ่งหมายของนักเรียนในการเรียนรู้หัวข้อ ในขณะที่แบบทดสอบอีกชุดหลังเรียนจะช่วยเพิ่มการจดจำ หลักสูตรนี้ออกแบบมาให้ยืดหยุ่นและสนุกสนาน และสามารถเรียนทั้งหมดหรือเป็นบางส่วนได้ โครงการเริ่มจากขนาดเล็กและซับซ้อนขึ้นตามลำดับจนจบรอบ 10 สัปดาห์
ค้นหา จรรยาบรรณของเรา, ข้อกำหนดการมีส่วนร่วม, แนวทางการแปล เรายินดีรับฟังคำติชมที่สร้างสรรค์ของคุณ!
แต่ละบทเรียนประกอบด้วย:
- สเก็ตช์โน้ตเสริม (เลือกดูได้)
- วิดีโอเสริม (เลือกดูได้)
- แบบทดสอบวอร์มอัพก่อนบทเรียน
- บทเรียนเขียน
- สำหรับบทเรียนฐานโครงการ มีคำแนะนำทีละขั้นตอนในการสร้างโครงการ
- การตรวจสอบความรู้
- ความท้าทาย
- การอ่านเสริม
- การบ้าน
- แบบทดสอบหลังบทเรียน
หมายเหตุเกี่ยวกับแบบทดสอบ: แบบทดสอบทั้งหมดถูกจัดเก็บในโฟลเดอร์ Quiz-App รวม 40 แบบทดสอบ แต่ละแบบมี 3 คำถาม มีการลิงก์จากบทเรียน แต่แอปแบบทดสอบสามารถรันได้ในเครื่องหรือดีพลอยไปยัง Azure; โปรดดูคำแนะนำในโฟลเดอร์
quiz-appมีการแปลเป็นภาษาต่าง ๆ อย่างต่อเนื่อง
🎓 ตัวอย่างสำหรับผู้เริ่มต้น
ใหม่กับวิทยาศาสตร์ข้อมูล? เราได้สร้าง ไดเรกทอรีตัวอย่าง เฉพาะที่มีโค้ดง่าย ๆ พร้อมคำอธิบายอย่างละเอียดเพื่อช่วยคุณเริ่มต้น:
- 🌟 Hello World - โปรแกรมวิทยาศาสตร์ข้อมูลแรกของคุณ
- 📂 โหลดข้อมูล - เรียนรู้การอ่านและสำรวจชุดข้อมูล
- 📊 วิเคราะห์ง่าย ๆ - คำนวณสถิติและค้นหารูปแบบ
- 📈 สร้างภาพพื้นฐาน - สร้างแผนภูมิและกราฟ
- 🔬 โครงการจริง - กระบวนการทำงานครบถ้วนตั้งแต่ต้นจนจบ
แต่ละตัวอย่างมีคำอธิบายละเอียดทุกขั้นตอน เหมาะสำหรับมือใหม่สุด ๆ!
บทเรียน
![]() |
|---|
| แผนที่เส้นทางวิทยาศาสตร์ข้อมูลสำหรับผู้เริ่มต้น - สเก็ตช์โน้ตโดย @nitya |
| หมายเลขบทเรียน | หัวข้อ | กลุ่มบทเรียน | วัตถุประสงค์การเรียนรู้ | บทเรียนที่เชื่อมโยง | ผู้เขียน |
|---|---|---|---|---|---|
| 01 | การกำหนดวิทยาศาสตร์ข้อมูล | บทนำ | เรียนรู้แนวคิดพื้นฐานของวิทยาศาสตร์ข้อมูลและความสัมพันธ์กับปัญญาประดิษฐ์ การเรียนรู้ของเครื่อง และข้อมูลขนาดใหญ่ | บทเรียน วิดีโอ | Dmitry |
| 02 | จริยธรรมวิทยาศาสตร์ข้อมูล | บทนำ | แนวคิดทางจริยธรรม ความท้าทาย และกรอบงาน | บทเรียน | Nitya |
| 03 | การกำหนดข้อมูล | บทนำ | วิธีการจัดประเภทข้อมูลและแหล่งข้อมูลทั่วไป | บทเรียน | Jasmine |
| 04 | บทนำสถิติและความน่าจะเป็น | บทนำ | เทคนิคคณิตศาสตร์ของความน่าจะเป็นและสถิติเพื่อทำความเข้าใจข้อมูล | บทเรียน วิดีโอ | Dmitry |
| 05 | การทำงานกับข้อมูลเชิงสัมพันธ์ | ทำงานกับข้อมูล | บทนำสู่ข้อมูลสัมพันธ์และพื้นฐานการสำรวจวิเคราะห์ข้อมูลด้วยภาษา Structured Query Language หรือ SQL (อ่านว่า “ซีเควล”) | บทเรียน | Christopher |
| 06 | การทำงานกับข้อมูล NoSQL | ทำงานกับข้อมูล | บทนำสู่ข้อมูลที่ไม่ใช่ความสัมพันธ์ ประเภทต่าง ๆ และพื้นฐานการสำรวจวิเคราะห์ฐานข้อมูลเอกสาร | บทเรียน | Jasmine |
| 07 | การทำงานกับ Python | ทำงานกับข้อมูล | พื้นฐานการใช้ Python สำหรับสำรวจข้อมูลด้วยไลบรารี เช่น Pandas ควรมีพื้นฐานการโปรแกรม Python | บทเรียน วิดีโอ | Dmitry |
| 08 | การเตรียมข้อมูล | ทำงานกับข้อมูล | หัวข้อเกี่ยวกับเทคนิคทำความสะอาดและแปลงข้อมูลเพื่อจัดการกับความท้าทายของข้อมูลที่ขาดหาย ไม่ถูกต้อง หรือไม่ครบถ้วน | บทเรียน | Jasmine |
| 09 | การแสดงปริมาณข้อมูล | ภาพข้อมูล | เรียนรู้การใช้ Matplotlib ในการแสดงข้อมูลนก 🦆 | บทเรียน | Jen |
| 10 | การแสดงการแจกแจงของข้อมูล | ภาพข้อมูล | การแสดงการสังเกตและแนวโน้มภายในช่วงเวลา | บทเรียน | Jen |
| 11 | การแสดงสัดส่วน | ภาพข้อมูล | การแสดงร้อยละกลุ่มและจำแนก | บทเรียน | Jen |
| 12 | การแสดงความสัมพันธ์ | ภาพข้อมูล | การแสดงการเชื่อมโยงและความสัมพันธ์ระหว่างชุดข้อมูลและตัวแปร | บทเรียน | Jen |
| 13 | การแสดงผลที่มีความหมาย | ภาพข้อมูล | เทคนิคและแนวทางสำหรับสร้างภาพข้อมูลที่มีคุณค่าเพื่อแก้ปัญหาและให้ข้อมูลเชิงลึกอย่างมีประสิทธิภาพ | บทเรียน | Jen |
| 14 | บทนำสู่วงจรชีวิตวิทยาศาสตร์ข้อมูล | วงจรชีวิต | บทนำสู่วงจรชีวิตวิทยาศาสตร์ข้อมูลและขั้นตอนแรกของการรับและสกัดข้อมูล | บทเรียน | Jasmine |
| 15 | การวิเคราะห์ | วงจรชีวิต | ขั้นตอนนี้ในวงจรชีวิตวิทยาศาสตร์ข้อมูลเน้นเทคนิคการวิเคราะห์ข้อมูล | บทเรียน | Jasmine |
| 16 | การสื่อสาร | วงจรชีวิต | ขั้นตอนนี้เน้นการนำเสนอข้อมูลเชิงลึกจากข้อมูลในรูปแบบที่เข้าใจง่ายสำหรับผู้ตัดสินใจ | บทเรียน | Jalen |
| 17 | วิทยาศาสตร์ข้อมูลบนคลาวด์ | ข้อมูลคลาวด์ | ชุดบทเรียนที่แนะนำวิทยาศาสตร์ข้อมูลบนคลาวด์และประโยชน์ | บทเรียน | Tiffany และ Maud |
| 18 | วิทยาศาสตร์ข้อมูลบนคลาวด์ | ข้อมูลคลาวด์ | ฝึกอบรมโมเดลโดยใช้เครื่องมือ Low Code | บทเรียน | Tiffany และ Maud |
| 19 | วิทยาศาสตร์ข้อมูลบนคลาวด์ | ข้อมูลคลาวด์ | การดีพลอยโมเดลด้วย Azure Machine Learning Studio | บทเรียน | Tiffany และ Maud |
| 20 | วิทยาศาสตร์ข้อมูลในโลกจริง | โลกจริง | โครงการวิทยาศาสตร์ข้อมูลในโลกจริง | บทเรียน | Nitya |
GitHub Codespaces
ทำตามขั้นตอนเหล่านี้เพื่อเปิดตัวอย่างนี้ใน Codespace:
- คลิกเมนูแบบเลื่อนของ Code และเลือกตัวเลือก Open with Codespaces
- เลือก + New codespace ที่ด้านล่างของแผง สำหรับข้อมูลเพิ่มเติม ดูที่ เอกสาร GitHub
VSCode Remote - Containers
ทำตามขั้นตอนเหล่านี้เพื่อเปิด repo นี้ในคอนเทนเนอร์โดยใช้เครื่องของคุณและ VSCode ผ่านส่วนขยาย VS Code Remote - Containers:
- หากนี่เป็นครั้งแรกของคุณในการใช้คอนเทนเนอร์พัฒนา โปรดตรวจสอบว่าเครื่องของคุณมีข้อกำหนดพื้นฐาน เช่น การติดตั้ง Docker แล้ว ใน เอกสารเริ่มต้น
ในการใช้ repo นี้ คุณสามารถเปิด repo ในโวลุ่ม Docker แยกต่างหากได้:
หมายเหตุ: ภายใต้ระบบ จะใช้คำสั่ง Remote-Containers: Clone Repository in Container Volume... เพื่อโคลนซอร์สโค้ดในโวลุ่ม Docker แทนระบบไฟล์ภายในเครื่อง โวลุ่ม เป็นกลไกที่แนะนำสำหรับการจัดเก็บข้อมูลคอนเทนเนอร์อย่างถาวร
หรือเปิดโคลนหรือดาวน์โหลด repo นี้ไว้ในเครื่อง:
- โคลน repo นี้ลงในเครื่องของคุณ
- กด F1 แล้วเลือกคำสั่ง Remote-Containers: Open Folder in Container...
- เลือกโฟลเดอร์ที่โคลนไว้ รอคอนเทนเนอร์เริ่มทำงาน แล้วลองใช้งานได้เลย
การเข้าใช้งานแบบออฟไลน์
คุณสามารถรันเอกสารนี้แบบออฟไลน์ด้วยการใช้ Docsify ได้นะ เพียงส้อม (fork) repo นี้, ติดตั้ง Docsify บนเครื่องของคุณ แล้วที่โฟลเดอร์ root ของ repo นี้ ให้พิมพ์คำสั่ง docsify serve เว็บไซต์จะถูกให้บริการบนพอร์ต 3000 ที่ localhost ของคุณ: localhost:3000
หมายเหตุ โน้ตบุ๊กจะไม่ถูกแสดงผลผ่าน Docsify ดังนั้นเมื่อต้องรันโน้ตบุ๊ก ให้ทำแยกต่างหากใน VS Code ที่รันเคอร์เนล Python
หลักสูตรอื่น ๆ
ทีมงานของเราผลิตหลักสูตรอื่นด้วย! ลองดู:
LangChain
Azure / Edge / MCP / Agents
Generative AI Series
Core Learning
Copilot Series
การขอรับความช่วยเหลือ
พบปัญหาใช่ไหม? ตรวจสอบ คู่มือแก้ปัญหา ของเราเพื่อหาวิธีแก้ปัญหาทั่วไป
ถ้าคุณติดขัดหรือมีคำถามเกี่ยวกับการสร้างแอป AI เข้าร่วมกับผู้เรียนและนักพัฒนาที่มีประสบการณ์ในการพูดคุยเกี่ยวกับ MCP ชุมชนที่สนับสนุนนี้เปิดรับคำถามและแบ่งปันความรู้กันอย่างอิสระ
ถ้าคุณมีข้อเสนอแนะเกี่ยวกับผลิตภัณฑ์หรือพบข้อผิดพลาดขณะสร้าง โปรดเยี่ยมชม:
คำปฏิเสธความรับผิดชอบ: เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษาด้วยปัญญาประดิษฐ์ Co-op Translator แม้ว่าเราจะพยายามให้ความถูกต้องสูงสุด โปรดทราบว่าการแปลอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้องได้ เอกสารต้นฉบับในภาษาต้นทางถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ควรใช้บริการแปลโดยนักแปลมืออาชีพที่เป็นมนุษย์ เราไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความที่ผิดพลาดที่อาจเกิดขึ้นจากการใช้การแปลนี้



