30 KiB
วิทยาศาสตร์ข้อมูลสำหรับผู้เริ่มต้น - หลักสูตร
Azure Cloud Advocates ที่ Microsoft มีความยินดีที่จะนำเสนอหลักสูตร 10 สัปดาห์ 20 บทเรียนเกี่ยวกับวิทยาศาสตร์ข้อมูล แต่ละบทเรียนประกอบด้วยแบบทดสอบก่อนและหลังบทเรียน คำแนะนำที่เขียนไว้สำหรับการทำบทเรียน โซลูชัน และงานมอบหมาย หลักสูตรที่เน้นการสร้างโปรเจกต์ช่วยให้คุณเรียนรู้ผ่านการลงมือทำ ซึ่งเป็นวิธีที่พิสูจน์แล้วว่าทำให้ทักษะใหม่ๆ ติดตัวได้อย่างมีประสิทธิภาพ
ขอขอบคุณผู้เขียนของเรา: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 ขอขอบคุณเป็นพิเศษ 🙏 แก่ Microsoft Student Ambassador ผู้เขียน ผู้ตรวจสอบ และผู้มีส่วนร่วมในเนื้อหา, โดยเฉพาะ Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
วิทยาศาสตร์ข้อมูลสำหรับผู้เริ่มต้น - ภาพสเก็ตช์โดย @nitya |
🌐 การสนับสนุนหลายภาษา
รองรับผ่าน GitHub Action (อัตโนมัติและอัปเดตเสมอ)
French | Spanish | German | Russian | Arabic | Persian (Farsi) | Urdu | Chinese (Simplified) | Chinese (Traditional, Macau) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Taiwan) | Japanese | Korean | Hindi | Bengali | Marathi | Nepali | Punjabi (Gurmukhi) | Portuguese (Portugal) | Portuguese (Brazil) | Italian | Polish | Turkish | Greek | Thai | Swedish | Danish | Norwegian | Finnish | Dutch | Hebrew | Vietnamese | Indonesian | Malay | Tagalog (Filipino) | Swahili | Hungarian | Czech | Slovak | Romanian | Bulgarian | Serbian (Cyrillic) | Croatian | Slovenian | Ukrainian | Burmese (Myanmar)
หากคุณต้องการให้มีการสนับสนุนภาษาเพิ่มเติม รายการภาษาที่รองรับสามารถดูได้ ที่นี่
เข้าร่วมชุมชนของเรา
คุณเป็นนักเรียนหรือไม่?
เริ่มต้นด้วยแหล่งข้อมูลต่อไปนี้:
- หน้าศูนย์กลางนักเรียน ในหน้านี้ คุณจะพบแหล่งข้อมูลสำหรับผู้เริ่มต้น ชุดเครื่องมือสำหรับนักเรียน และแม้กระทั่งวิธีการรับบัตรกำนัลสอบฟรี นี่คือหน้าที่คุณควรบุ๊กมาร์กและตรวจสอบเป็นระยะๆ เนื่องจากเรามีการเปลี่ยนแปลงเนื้อหาอย่างน้อยทุกเดือน
- Microsoft Learn Student Ambassadors เข้าร่วมชุมชนระดับโลกของนักเรียนแอมบาสเดอร์ นี่อาจเป็นทางเข้าสู่ Microsoft ของคุณ
เริ่มต้นใช้งาน
ครูผู้สอน: เราได้ รวมคำแนะนำบางส่วน เกี่ยวกับวิธีการใช้หลักสูตรนี้ เราต้องการรับฟังความคิดเห็นของคุณ ในฟอรัมการสนทนาของเรา!
นักเรียน: หากต้องการใช้หลักสูตรนี้ด้วยตัวเอง ให้ fork repo ทั้งหมดและทำแบบฝึกหัดด้วยตัวเอง โดยเริ่มจากแบบทดสอบก่อนบทเรียน จากนั้นอ่านบทเรียนและทำกิจกรรมที่เหลือ พยายามสร้างโปรเจกต์โดยการทำความเข้าใจบทเรียนแทนที่จะคัดลอกรหัสโซลูชัน อย่างไรก็ตาม รหัสโซลูชันนั้นมีอยู่ในโฟลเดอร์ /solutions ในแต่ละบทเรียนที่เน้นโปรเจกต์ อีกแนวคิดหนึ่งคือการสร้างกลุ่มการเรียนรู้กับเพื่อนๆ และเรียนรู้เนื้อหาด้วยกัน สำหรับการศึกษาเพิ่มเติม เราขอแนะนำ Microsoft Learn
พบกับทีมงาน
Gif โดย Mohit Jaisal
🎥 คลิกที่ภาพด้านบนเพื่อดูวิดีโอเกี่ยวกับโปรเจกต์และผู้ที่สร้างมันขึ้นมา!
วิธีการสอน
เราได้เลือกใช้หลักการสอนสองข้อในขณะที่สร้างหลักสูตรนี้: การทำให้เป็นโปรเจกต์และการมีแบบทดสอบบ่อยครั้ง ภายในสิ้นสุดซีรีส์นี้ นักเรียนจะได้เรียนรู้หลักการพื้นฐานของวิทยาศาสตร์ข้อมูล รวมถึงแนวคิดด้านจริยธรรม การเตรียมข้อมูล วิธีการทำงานกับข้อมูลในรูปแบบต่างๆ การสร้างภาพข้อมูล การวิเคราะห์ข้อมูล กรณีการใช้งานจริงของวิทยาศาสตร์ข้อมูล และอื่นๆ
นอกจากนี้ แบบทดสอบที่มีความเสี่ยงต่ำก่อนชั้นเรียนจะช่วยตั้งเป้าหมายให้นักเรียนมุ่งเน้นไปที่การเรียนรู้หัวข้อหนึ่งๆ ในขณะที่แบบทดสอบหลังชั้นเรียนช่วยเสริมสร้างความจำ หลักสูตรนี้ถูกออกแบบให้ยืดหยุ่นและสนุกสนาน และสามารถเรียนได้ทั้งแบบเต็มหลักสูตรหรือบางส่วน โปรเจกต์เริ่มต้นจากขนาดเล็กและมีความซับซ้อนเพิ่มขึ้นเรื่อยๆ จนถึงสิ้นสุดรอบ 10 สัปดาห์
ค้นหา หลักปฏิบัติของเรา, การมีส่วนร่วม, แนวทางการแปล เรายินดีรับฟังความคิดเห็นที่สร้างสรรค์ของคุณ!
แต่ละบทเรียนประกอบด้วย:
- สเก็ตโน้ต (ถ้ามี)
- วิดีโอเสริม (ถ้ามี)
- แบบทดสอบอุ่นเครื่องก่อนเริ่มบทเรียน
- บทเรียนที่เขียนไว้
- สำหรับบทเรียนที่เน้นโครงการ มีคำแนะนำทีละขั้นตอนเกี่ยวกับวิธีสร้างโครงการ
- การตรวจสอบความรู้
- ความท้าทาย
- การอ่านเพิ่มเติม
- การบ้าน
- แบบทดสอบหลังบทเรียน
หมายเหตุเกี่ยวกับแบบทดสอบ: แบบทดสอบทั้งหมดอยู่ในโฟลเดอร์ Quiz-App ซึ่งมีทั้งหมด 40 แบบทดสอบ แต่ละแบบทดสอบมี 3 คำถาม แบบทดสอบเหล่านี้เชื่อมโยงจากในบทเรียน แต่แอปแบบทดสอบสามารถรันได้ในเครื่องหรือดีพลอยไปยัง Azure โดยทำตามคำแนะนำในโฟลเดอร์
quiz-app
ขณะนี้กำลังอยู่ในกระบวนการแปลเป็นภาษาท้องถิ่น
บทเรียน
![]() |
---|
วิทยาศาสตร์ข้อมูลสำหรับผู้เริ่มต้น: แผนที่เส้นทาง - สเก็ตโน้ตโดย @nitya |
หมายเลขบทเรียน | หัวข้อ | กลุ่มบทเรียน | วัตถุประสงค์การเรียนรู้ | บทเรียนที่เชื่อมโยง | ผู้เขียน |
---|---|---|---|---|---|
01 | การนิยามวิทยาศาสตร์ข้อมูล | บทนำ | เรียนรู้แนวคิดพื้นฐานของวิทยาศาสตร์ข้อมูลและความสัมพันธ์กับปัญญาประดิษฐ์ การเรียนรู้ของเครื่อง และข้อมูลขนาดใหญ่ | บทเรียน วิดีโอ | Dmitry |
02 | จริยธรรมในวิทยาศาสตร์ข้อมูล | บทนำ | แนวคิดเกี่ยวกับจริยธรรมในข้อมูล ความท้าทาย และกรอบการทำงาน | บทเรียน | Nitya |
03 | การนิยามข้อมูล | บทนำ | วิธีการจำแนกข้อมูลและแหล่งข้อมูลที่พบบ่อย | บทเรียน | Jasmine |
04 | บทนำสถิติและความน่าจะเป็น | บทนำ | เทคนิคทางคณิตศาสตร์ของความน่าจะเป็นและสถิติในการทำความเข้าใจข้อมูล | บทเรียน วิดีโอ | Dmitry |
05 | การทำงานกับข้อมูลเชิงสัมพันธ์ | การทำงานกับข้อมูล | บทนำเกี่ยวกับข้อมูลเชิงสัมพันธ์และพื้นฐานของการสำรวจและวิเคราะห์ข้อมูลเชิงสัมพันธ์ด้วย Structured Query Language หรือ SQL (อ่านว่า "ซีเควล") | บทเรียน | Christopher |
06 | การทำงานกับข้อมูล NoSQL | การทำงานกับข้อมูล | บทนำเกี่ยวกับข้อมูลที่ไม่ใช่เชิงสัมพันธ์ ประเภทต่างๆ และพื้นฐานของการสำรวจและวิเคราะห์ฐานข้อมูลเอกสาร | บทเรียน | Jasmine |
07 | การทำงานกับ Python | การทำงานกับข้อมูล | พื้นฐานการใช้ Python ในการสำรวจข้อมูลด้วยไลบรารี เช่น Pandas แนะนำให้มีความเข้าใจพื้นฐานเกี่ยวกับการเขียนโปรแกรม Python | บทเรียน วิดีโอ | Dmitry |
08 | การเตรียมข้อมูล | การทำงานกับข้อมูล | หัวข้อเกี่ยวกับเทคนิคการทำความสะอาดและแปลงข้อมูลเพื่อจัดการกับปัญหาข้อมูลที่ขาดหาย ไม่ถูกต้อง หรือไม่สมบูรณ์ | บทเรียน | Jasmine |
09 | การสร้างภาพข้อมูลเชิงปริมาณ | การสร้างภาพข้อมูล | เรียนรู้วิธีใช้ Matplotlib ในการสร้างภาพข้อมูลนก 🦆 | บทเรียน | Jen |
10 | การสร้างภาพการกระจายของข้อมูล | การสร้างภาพข้อมูล | การสร้างภาพการสังเกตและแนวโน้มภายในช่วงข้อมูล | บทเรียน | Jen |
11 | การสร้างภาพสัดส่วน | การสร้างภาพข้อมูล | การสร้างภาพเปอร์เซ็นต์แบบแยกและแบบกลุ่ม | บทเรียน | Jen |
12 | การสร้างภาพความสัมพันธ์ | การสร้างภาพข้อมูล | การสร้างภาพการเชื่อมโยงและความสัมพันธ์ระหว่างชุดข้อมูลและตัวแปร | บทเรียน | Jen |
13 | การสร้างภาพที่มีความหมาย | การสร้างภาพข้อมูล | เทคนิคและคำแนะนำในการทำให้การสร้างภาพของคุณมีคุณค่าเพื่อการแก้ปัญหาและการให้ข้อมูลเชิงลึกที่มีประสิทธิภาพ | บทเรียน | Jen |
14 | บทนำวงจรชีวิตวิทยาศาสตร์ข้อมูล | วงจรชีวิต | บทนำเกี่ยวกับวงจรชีวิตวิทยาศาสตร์ข้อมูลและขั้นตอนแรกของการรวบรวมและดึงข้อมูล | บทเรียน | Jasmine |
15 | การวิเคราะห์ | วงจรชีวิต | ขั้นตอนนี้ในวงจรชีวิตวิทยาศาสตร์ข้อมูลมุ่งเน้นไปที่เทคนิคการวิเคราะห์ข้อมูล | บทเรียน | Jasmine |
16 | การสื่อสาร | วงจรชีวิต | ขั้นตอนนี้ในวงจรชีวิตวิทยาศาสตร์ข้อมูลมุ่งเน้นไปที่การนำเสนอข้อมูลเชิงลึกจากข้อมูลในรูปแบบที่ช่วยให้ผู้ตัดสินใจเข้าใจได้ง่ายขึ้น | บทเรียน | Jalen |
17 | วิทยาศาสตร์ข้อมูลบนคลาวด์ | ข้อมูลบนคลาวด์ | ชุดบทเรียนนี้แนะนำวิทยาศาสตร์ข้อมูลบนคลาวด์และประโยชน์ของมัน | บทเรียน | Tiffany และ Maud |
18 | วิทยาศาสตร์ข้อมูลบนคลาวด์ | ข้อมูลบนคลาวด์ | การฝึกอบรมโมเดลโดยใช้เครื่องมือ Low Code | บทเรียน | Tiffany และ Maud |
19 | วิทยาศาสตร์ข้อมูลบนคลาวด์ | ข้อมูลบนคลาวด์ | การดีพลอยโมเดลด้วย Azure Machine Learning Studio | บทเรียน | Tiffany และ Maud |
20 | วิทยาศาสตร์ข้อมูลในโลกจริง | ในโลกจริง | โครงการที่ขับเคลื่อนด้วยวิทยาศาสตร์ข้อมูลในโลกจริง | บทเรียน | Nitya |
GitHub Codespaces
ทำตามขั้นตอนเหล่านี้เพื่อเปิดตัวอย่างนี้ใน Codespace:
- คลิกเมนูแบบเลื่อนลง Code และเลือกตัวเลือก Open with Codespaces
- เลือก + New codespace ที่ด้านล่างของแผง สำหรับข้อมูลเพิ่มเติม โปรดดู เอกสาร GitHub
VSCode Remote - Containers
ทำตามขั้นตอนเหล่านี้เพื่อเปิด repo นี้ใน container โดยใช้เครื่องในพื้นที่ของคุณและ VSCode ด้วยส่วนขยาย VS Code Remote - Containers:
- หากนี่เป็นครั้งแรกที่คุณใช้ development container โปรดตรวจสอบให้แน่ใจว่าระบบของคุณตรงตามข้อกำหนดเบื้องต้น (เช่น ติดตั้ง Docker) ใน เอกสารเริ่มต้นใช้งาน
ในการใช้ repository นี้ คุณสามารถเปิด repository ใน Docker volume ที่แยกออกมา:
หมายเหตุ: ภายใต้ฮูด คำสั่งนี้จะใช้ Remote-Containers: Clone Repository in Container Volume... เพื่อโคลนซอร์สโค้ดใน Docker volume แทนที่จะเป็นระบบไฟล์ในเครื่อง Volumes เป็นกลไกที่แนะนำสำหรับการเก็บข้อมูล container
หรือเปิดเวอร์ชันที่โคลนหรือดาวน์โหลดในเครื่องของ repository:
- โคลน repository นี้ไปยังระบบไฟล์ในเครื่องของคุณ
- กด F1 และเลือกคำสั่ง Remote-Containers: Open Folder in Container...
- เลือกสำเนาที่โคลนของโฟลเดอร์นี้ รอให้ container เริ่มต้น และลองใช้งาน
การเข้าถึงแบบออฟไลน์
คุณสามารถรันเอกสารนี้แบบออฟไลน์ได้โดยใช้ Docsify. Fork repo นี้, ติดตั้ง Docsify บนเครื่องในพื้นที่ของคุณ จากนั้นในโฟลเดอร์ root ของ repo นี้ ให้พิมพ์ docsify serve
เว็บไซต์จะถูกให้บริการบนพอร์ต 3000 บน localhost ของคุณ: localhost:3000
หมายเหตุ โน้ตบุ๊กจะไม่ถูกเรนเดอร์ผ่าน Docsify ดังนั้นเมื่อคุณต้องการรันโน้ตบุ๊ก ให้ทำสิ่งนั้นแยกต่างหากใน VS Code โดยใช้ Python kernel
หลักสูตรอื่นๆ
ทีมของเราผลิตหลักสูตรอื่นๆ! ลองดู:
- Generative AI for Beginners
- Generative AI for Beginners .NET
- Generative AI with JavaScript
- Generative AI with Java
- AI for Beginners
- Data Science for Beginners
- ML for Beginners
- Cybersecurity for Beginners
- Web Dev for Beginners
- IoT for Beginners
- XR Development for Beginners
- Mastering GitHub Copilot for Paired Programming
- Mastering GitHub Copilot for C#/.NET Developers
- Choose Your Own Copilot Adventure
ข้อจำกัดความรับผิดชอบ:
เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษา AI Co-op Translator แม้ว่าเราจะพยายามให้การแปลมีความถูกต้องมากที่สุด แต่โปรดทราบว่าการแปลโดยอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้อง เอกสารต้นฉบับในภาษาดั้งเดิมควรถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ขอแนะนำให้ใช้บริการแปลภาษามืออาชีพ เราไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความผิดที่เกิดจากการใช้การแปลนี้