19 KiB
Data Science para sa mga Baguhan - Isang Kurikulum
Azure Cloud Advocates sa Microsoft ay masayang nag-aalok ng isang 10-linggong, 20-aralin na kurikulum tungkol sa Data Science. Ang bawat aralin ay may kasamang mga pre-lesson at post-lesson na pagsusulit, nakasulat na mga tagubilin para kumpletuhin ang aralin, isang solusyon, at isang takdang-aralin. Ang aming project-based na pamamaraan ng pagtuturo ay nagbibigay-daan sa iyo na matuto habang gumagawa, isang napatunayang paraan upang mas tumatak ang mga bagong kasanayan.
Taos-pusong pasasalamat sa aming mga may-akda: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Espesyal na pasasalamat 🙏 sa aming Microsoft Student Ambassador na mga may-akda, tagasuri, at mga nag-ambag ng nilalaman, partikular na sina Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
Data Science Para sa mga Baguhan - Sketchnote ni @nitya |
🌐 Suporta sa Maraming Wika
Sinusuportahan sa pamamagitan ng GitHub Action (Awtomatiko at Laging Napapanahon)
French | Spanish | German | Russian | Arabic | Persian (Farsi) | Urdu | Chinese (Simplified) | Chinese (Traditional, Macau) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Taiwan) | Japanese | Korean | Hindi | Bengali | Marathi | Nepali | Punjabi (Gurmukhi) | Portuguese (Portugal) | Portuguese (Brazil) | Italian | Polish | Turkish | Greek | Thai | Swedish | Danish | Norwegian | Finnish | Dutch | Hebrew | Vietnamese | Indonesian | Malay | Tagalog (Filipino) | Swahili | Hungarian | Czech | Slovak | Romanian | Bulgarian | Serbian (Cyrillic) | Croatian | Slovenian | Ukrainian | Burmese (Myanmar)
Kung nais mong magkaroon ng karagdagang mga wika para sa pagsasalin, ang mga sinusuportahang wika ay nakalista dito
Sumali sa Aming Komunidad
Ikaw ba ay isang mag-aaral?
Simulan gamit ang mga sumusunod na mapagkukunan:
- Student Hub page Sa pahinang ito, makakahanap ka ng mga mapagkukunan para sa mga baguhan, mga Student pack, at maging mga paraan upang makakuha ng libreng sertipikasyon. Isa itong pahina na dapat mong i-bookmark at bisitahin paminsan-minsan dahil binabago namin ang nilalaman buwan-buwan.
- Microsoft Learn Student Ambassadors Sumali sa isang pandaigdigang komunidad ng mga student ambassador, maaaring ito ang iyong daan papunta sa Microsoft.
Pagsisimula
Mga Guro: mayroon kaming ilang mungkahi kung paano gamitin ang kurikulum na ito. Gusto naming marinig ang inyong feedback sa aming discussion forum!
Mga Mag-aaral: upang gamitin ang kurikulum na ito nang mag-isa, i-fork ang buong repo at kumpletuhin ang mga gawain nang mag-isa, simula sa isang pre-lecture quiz. Pagkatapos, basahin ang lektura at kumpletuhin ang iba pang mga aktibidad. Subukang gawin ang mga proyekto sa pamamagitan ng pag-unawa sa mga aralin sa halip na kopyahin ang solution code; gayunpaman, ang code na iyon ay makikita sa /solutions na mga folder sa bawat project-oriented na aralin. Isa pang ideya ay ang bumuo ng isang study group kasama ang mga kaibigan at sabay-sabay na pag-aralan ang nilalaman. Para sa karagdagang pag-aaral, inirerekomenda namin ang Microsoft Learn.
Kilalanin ang Koponan
Gif ni Mohit Jaisal
🎥 I-click ang larawan sa itaas para sa isang video tungkol sa proyekto at sa mga taong lumikha nito!
Pedagogy
Pinili namin ang dalawang prinsipyo ng pagtuturo habang binubuo ang kurikulum na ito: tiyaking ito ay project-based at may kasamang madalas na pagsusulit. Sa pagtatapos ng seryeng ito, matututuhan ng mga mag-aaral ang mga pangunahing prinsipyo ng data science, kabilang ang mga etikal na konsepto, paghahanda ng datos, iba't ibang paraan ng pagtatrabaho sa datos, data visualization, data analysis, mga totoong kaso ng paggamit ng data science, at marami pa.
Bukod dito, ang isang low-stakes na pagsusulit bago ang klase ay nagtatakda ng layunin ng mag-aaral patungo sa pag-aaral ng isang paksa, habang ang pangalawang pagsusulit pagkatapos ng klase ay nagsisiguro ng karagdagang pagkatuto. Ang kurikulum na ito ay idinisenyo upang maging flexible at masaya at maaaring kunin nang buo o bahagi lamang. Ang mga proyekto ay nagsisimula sa maliit at nagiging mas kumplikado habang tumatagal sa loob ng 10-linggong siklo. Hanapin ang aming Code of Conduct, Contributing, Translation na mga gabay. Malugod naming tinatanggap ang inyong mga makabuluhang puna!
Bawat aralin ay naglalaman ng:
- Opsyonal na sketchnote
- Opsyonal na karagdagang video
- Paunang pagsusulit bago ang aralin
- Nakatalang aralin
- Para sa mga araling nakabatay sa proyekto, sunud-sunod na gabay kung paano buuin ang proyekto
- Pagsusuri ng kaalaman
- Isang hamon
- Karagdagang babasahin
- Takdang-aralin
- Pagsusulit pagkatapos ng aralin
Isang tala tungkol sa mga pagsusulit: Ang lahat ng pagsusulit ay nasa loob ng folder na Quiz-App, na may kabuuang 40 pagsusulit na may tig-tatlong tanong bawat isa. Ang mga ito ay naka-link mula sa mga aralin, ngunit maaaring patakbuhin ang quiz app nang lokal o i-deploy sa Azure; sundin ang mga tagubilin sa folder na
quiz-app
. Unti-unti itong isinasalin sa iba't ibang wika.
Mga Aralin
![]() |
---|
Data Science Para sa Mga Baguhan: Roadmap - Sketchnote ni @nitya |
Bilang ng Aralin | Paksa | Pangkat ng Aralin | Mga Layunin sa Pagkatuto | Naka-link na Aralin | May-akda |
---|---|---|---|---|---|
01 | Pagpapakilala sa Data Science | Panimula | Matutunan ang mga pangunahing konsepto ng data science at ang kaugnayan nito sa artificial intelligence, machine learning, at big data. | aralin video | Dmitry |
02 | Etika sa Data Science | Panimula | Mga Konsepto, Hamon, at Balangkas ng Etika sa Data. | aralin | Nitya |
03 | Pagpapakilala sa Data | Panimula | Paano inuuri ang data at ang mga karaniwang pinagmumulan nito. | aralin | Jasmine |
04 | Panimula sa Statistics at Probability | Panimula | Ang mga teknik sa matematika ng probability at statistics upang maunawaan ang data. | aralin video | Dmitry |
05 | Paggamit ng Relational Data | Paggamit ng Data | Panimula sa relational data at ang mga pangunahing kaalaman sa pag-explore at pagsusuri ng relational data gamit ang Structured Query Language, na kilala rin bilang SQL (binibigkas na “see-quell”). | aralin | Christopher |
06 | Paggamit ng NoSQL Data | Paggamit ng Data | Panimula sa non-relational data, ang iba't ibang uri nito, at ang mga pangunahing kaalaman sa pag-explore at pagsusuri ng document databases. | aralin | Jasmine |
07 | Paggamit ng Python | Paggamit ng Data | Mga pangunahing kaalaman sa paggamit ng Python para sa pag-explore ng data gamit ang mga library tulad ng Pandas. Inirerekomenda ang pundasyong kaalaman sa Python programming. | aralin video | Dmitry |
08 | Paghahanda ng Data | Paggamit ng Data | Mga paksa tungkol sa mga teknik sa paglilinis at pagbabago ng data upang matugunan ang mga hamon ng nawawala, hindi tama, o hindi kumpletong data. | aralin | Jasmine |
09 | Pagpapakita ng Dami | Pagpapakita ng Data | Matutunan kung paano gamitin ang Matplotlib upang ipakita ang data ng mga ibon 🦆 | aralin | Jen |
10 | Pagpapakita ng Pamamahagi ng Data | Pagpapakita ng Data | Pagpapakita ng mga obserbasyon at trend sa loob ng isang interval. | aralin | Jen |
11 | Pagpapakita ng Proporsyon | Pagpapakita ng Data | Pagpapakita ng mga discrete at grouped na porsyento. | aralin | Jen |
12 | Pagpapakita ng Relasyon | Pagpapakita ng Data | Pagpapakita ng mga koneksyon at ugnayan sa pagitan ng mga set ng data at mga variable nito. | aralin | Jen |
13 | Makabuluhang Pagpapakita | Pagpapakita ng Data | Mga teknik at gabay para gawing mahalaga ang iyong mga pagpapakita para sa epektibong paglutas ng problema at mga insight. | aralin | Jen |
14 | Panimula sa Lifecycle ng Data Science | Lifecycle | Panimula sa lifecycle ng data science at ang unang hakbang nito sa pagkuha at pagkuha ng data. | aralin | Jasmine |
15 | Pagsusuri | Lifecycle | Ang yugtong ito ng lifecycle ng data science ay nakatuon sa mga teknik sa pagsusuri ng data. | aralin | Jasmine |
16 | Komunikasyon | Lifecycle | Ang yugtong ito ng lifecycle ng data science ay nakatuon sa pagpapakita ng mga insight mula sa data sa paraang mas madaling maunawaan ng mga gumagawa ng desisyon. | aralin | Jalen |
17 | Data Science sa Cloud | Cloud Data | Ang seryeng ito ng mga aralin ay nagpapakilala sa data science sa cloud at ang mga benepisyo nito. | aralin | Tiffany at Maud |
18 | Data Science sa Cloud | Cloud Data | Pagsasanay ng mga modelo gamit ang Low Code tools. | aralin | Tiffany at Maud |
19 | Data Science sa Cloud | Cloud Data | Pag-deploy ng mga modelo gamit ang Azure Machine Learning Studio. | aralin | Tiffany at Maud |
20 | Data Science sa Ligaw | Sa Ligaw | Mga proyektong pinapatakbo ng data science sa totoong mundo. | aralin | Nitya |
GitHub Codespaces
Sundin ang mga hakbang na ito upang buksan ang sample na ito sa isang Codespace:
- I-click ang drop-down na menu ng Code at piliin ang opsyong Open with Codespaces.
- Piliin ang + New codespace sa ibaba ng pane.
Para sa karagdagang impormasyon, tingnan ang dokumentasyon ng GitHub.
VSCode Remote - Containers
Sundin ang mga hakbang na ito upang buksan ang repo na ito sa isang container gamit ang iyong lokal na makina at VSCode gamit ang VS Code Remote - Containers extension:
- Kung ito ang iyong unang beses na gumamit ng development container, tiyaking ang iyong sistema ay nakakatugon sa mga kinakailangan (hal. may naka-install na Docker) sa dokumentasyon ng pagsisimula.
Upang gamitin ang repositoryong ito, maaari mo itong buksan sa isang nakahiwalay na Docker volume:
Tandaan: Sa ilalim ng hood, gagamitin nito ang Remote-Containers: Clone Repository in Container Volume... na utos upang i-clone ang source code sa isang Docker volume sa halip na sa lokal na filesystem. Ang Volumes ang mas pinapaborang mekanismo para sa pagpapanatili ng data ng container.
O buksan ang isang lokal na naka-clone o na-download na bersyon ng repositoryo:
- I-clone ang repositoryong ito sa iyong lokal na filesystem.
- Pindutin ang F1 at piliin ang Remote-Containers: Open Folder in Container... na utos.
- Piliin ang naka-clone na kopya ng folder na ito, hintayin ang pagsisimula ng container, at subukan ang mga bagay-bagay.
Offline na Pag-access
Maaari mong patakbuhin ang dokumentasyong ito offline gamit ang Docsify. I-fork ang repo na ito, i-install ang Docsify sa iyong lokal na makina, pagkatapos sa root folder ng repo na ito, i-type ang docsify serve
. Ang website ay magsisilbi sa port 3000 sa iyong localhost: localhost:3000
.
Tandaan, ang mga notebook ay hindi mare-render gamit ang Docsify, kaya kapag kailangan mong patakbuhin ang isang notebook, gawin ito nang hiwalay sa VS Code gamit ang isang Python kernel.
Iba Pang Kurikulum
Ang aming koponan ay gumagawa ng iba pang kurikulum! Tingnan ang:
- Generative AI para sa Mga Baguhan
- Generative AI para sa Mga Baguhan .NET
- Generative AI gamit ang JavaScript
- Generative AI gamit ang Java
- AI para sa Mga Baguhan
- Data Science para sa Mga Baguhan
- ML para sa Mga Baguhan
- Cybersecurity para sa Mga Baguhan
- Web Dev para sa Mga Baguhan
- IoT para sa Mga Baguhan
- XR Development para sa Mga Baguhan
- Mastering GitHub Copilot para sa Paired Programming
- Mastering GitHub Copilot para sa C#/.NET Developers
- Piliin ang Iyong Sariling Copilot Adventure
Paunawa:
Ang dokumentong ito ay isinalin gamit ang AI translation service na Co-op Translator. Bagama't sinisikap naming maging tumpak, pakitandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatugma. Ang orihinal na dokumento sa orihinal nitong wika ang dapat ituring na opisyal na sanggunian. Para sa mahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na dulot ng paggamit ng pagsasaling ito.