43 KiB
बिगिनर्ससाठी डेटा सायन्स - एक अभ्यासक्रम
मायक्रोसॉफ्टमधील Azure Cloud Advocates आपल्याला डेटा सायन्सबद्दल 10 आठवड्यांचा, 20 धड्यांचा एक अभ्यासक्रम प्रदान करण्यात आनंदित आहेत. प्रत्येक धडयात पूर्व-परीक्षा आणि पश्चात-परीक्षा, धड्याचे पूर्ण करण्यासाठी लेखी सूचना, एक समाधान आणि एक असाइनमेंट समाविष्ट आहे. आमच्या प्रोजेक्ट-आधारित शिक्षण पद्धतीमुळे तुम्हाला शिकतांना तयार करता येते, नवीन कौशल्ये 'जपण्याचा' एक सिद्ध मार्ग.
आपल्या लेखकांचे हार्दिक आभार: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 आमच्या Microsoft Student Ambassador लेखक, पुनरावलोकक आणि सामग्री योगदानकर्त्यांचे विशेष आभार 🙏, विशेषतः आर्यन अरोरा, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, छैलबिहारी दुबे, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, समृद्धी शर्मा, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, योगेंद्रसिंह पवार , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| बिगिनर्ससाठी डेटा सायन्स - स्केचनोート द्वारा @nitya |
🌐 बहुभाषिक समर्थन
GitHub Action द्वारे समर्थीत (स्वयंचलित आणि नेहमी अपडेट)
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
स्थानिक क्लोन करायचे आहे का?
या रेपॉजिटरीमध्ये 50+ भाषांमध्ये भाषांतर आहेत ज्यामुळे डाउनलोडचा आकार लक्षणीय वाढतो. भाषांतरांशिवाय क्लोन करण्यासाठी, sparse checkout वापरा:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'यामुळे तुम्हाला कोर्स पूर्ण करण्यासाठी सर्वकाही खूप वेगाने डाउनलोड होईल.
जर तुम्हाला अतिरिक्त भाषांतरांना समर्थन हवे असल्यास, ते येथे यादीबद्ध आहेत येथे
आमच्या समुदायात सामील व्हा
आमच्याकडे एक Discord AI सह शिका मालिका चालू आहे, अधिक जाणून घेण्यासाठी आणि सामील होण्यासाठी Learn with AI Series या ठिकाणी 18 - 30 सप्टेंबर, 2025 दरम्यान. तुम्हाला डेटा सायन्ससाठी GitHub Copilot वापरण्याचे टिप्स आणि ट्रिक्स मिळतील.
तुम्ही विद्यार्थी आहात का?
खालील संसाधनांपासून सुरु करा:
- विद्यार्थी हब पेज या पेजवर, तुम्हाला बिगिनर्ससाठी संसाधने, विद्यार्थी पॅक्स आणि अगदी मोफत प्रमाणपत्र व्हाउचर मिळवण्याचे मार्गही सापडतील. हा एक असा पृष्ठ आहे ज्याला तुम्ही bookmark करून ठेवा आणि वेळोवेळी तपासा कारण आम्ही महिनाभरांनी सामग्री बदलतो.
- Microsoft Learn Student Ambassadors जागतिक विद्यार्थी अँम्बॅसडर समुदायात सामील व्हा, हे तुमच्यासाठी मायक्रोसॉफ्टमध्ये प्रवेशाचा मार्ग असू शकतो.
सुरुवात कशी करावी
📚 दस्तऐवजीकरण
- इंस्टॉलेशन मार्गदर्शक - बिगिनर्ससाठी टप्प्याटप्प्याने सेटअप सूचना
- वापर मार्गदर्शक - उदाहरणे आणि सामान्य कार्यप्रवाह
- समस्या निवारण - सामान्य समस्यांसाठी उपाय
- योगदान मार्गदर्शक - या प्रकल्पात कसे योगदान द्यावे
- शिक्षकांसाठी - शिक्षण मार्गदर्शन आणि वर्गातील संसाधने
👨🎓 विद्यार्थ्यांसाठी
संपूर्ण नवशिक्या: डेटा सायन्समध्ये नवीन आहात? आमच्या नवशिक्यांसाठी सोप्या उदाहरणांपासून सुरुवात करा! हे सोपे, चांगले टिपण लिहिलेले उदाहरणे तुम्हाला मुलभूत गोष्टी समजून घेण्यास मदत करतील, पूर्ण अभ्यासक्रमात डोकावण्याआधी. विद्यार्थी: हा अभ्यासक्रम स्वतंत्रपणे वापरण्यासाठी, संपूर्ण रेपॉजिटरी फोर्क करा आणि व्यायाम स्वतः पूर्ण करा, पूर्व-व्याख्यान चाचणीने सुरु करा. मग व्याख्यान वाचा आणि उर्वरित क्रिया पूर्ण करा. प्रकल्प निवडायला शक्यतो धडा समजून घेऊन तयार करा, समाधान कोड कॉपी करण्याऐवजी; तरीही त्या कोड प्रकल्प-आधारित प्रत्येक धड्याच्या /solutions फोल्डरमध्ये उपलब्ध आहेत. आणखी एक कल्पना म्हणजे मित्रांसह अभ्यास गट बनवून एकत्रून सामग्री पूर्ण करणे. पुढील अभ्यासासाठी, आम्ही Microsoft Learn ची शिफारस करतो.
जलद सुरुवात:
- तुमचे वातावरण सेट करण्यासाठी इंस्टॉलेशन मार्गदर्शक पहा
- अभ्यासक्रमाशी कसे काम करायचे ते जाणून घेण्यासाठी वापर मार्गदर्शक पहा
- धडा 1 पासून सुरुवात करा आणि क्रमाने पुढे जा
- आमच्या Discord समुदायात सामील व्हा मदतीसाठी
👩🏫 शिक्षकांसाठी
शिक्षकांनो: आम्ही या अभ्यासक्रमाचा उपयोग कसा करावा याबाबत काही सूचना दिल्या आहेत. कृपया आमच्या चर्चा मंचावर तुमचा अभिप्राय द्या!
टीमला भेटा
गिफ मोहित जैसाळ यांनी
🎥 प्रोजेक्ट आणि त्याला तयार करणाऱ्या लोकांबद्दल व्हिडिओसाठी वरील प्रतिमा क्लिक करा!
अध्यापनशास्त्र
आम्ही या अभ्यासक्रमाच्या बांधणीसाठी दोन अध्यापन तत्त्व निवडले आहेत: हे प्रोजेक्ट-आधारित असणे आणि त्यात वारंवार क्विझ असणे. या मालिकेच्या शेवटी, विद्यार्थी डेटा विज्ञानाचे मूलभूत तत्त्वे शिकतील, ज्यात नैतिक संकल्पना, डेटा तयारी, डेटा हाताळण्याचे वेगवेगळे मार्ग, डेटा दृश्यांकन, डेटा विश्लेषण, डेटा विज्ञानाच्या प्रत्यक्ष वापराच्या बाबी आणि बरेच काही यांचा समावेश असेल.
याव्यतिरिक्त, वर्गाच्या आधीचा कमी धोका असलेला क्विझ विद्यार्थ्यांच्या विषय शिकण्याच्या हेतूची स्थापन करतो, तर वर्गानंतरचा दुसरा क्विझ अधिक रक्षण खात्री करतो. हा अभ्यासक्रम लवचिक आणि मजेदार बनविण्यासाठी तयार केला गेला असून तो पूर्ण किंवा भागात घेतला जाऊ शकतो. प्रोजेक्ट्स सुरुवातीला छोटे असून १० आठवड्यांच्या चक्राच्या शेवटी अधिक क्लिष्ट होतात.
आमचा व्यवहार संहिता, योगदान, अनुवाद मार्गदर्शक तत्त्वे पाहा. आम्ही तुमच्या रचनात्मक अभिप्रायाचे स्वागत करतो!
प्रत्येक धड्यामध्ये समाविष्ट आहे:
- ऐच्छिक स्केचनोट
- ऐच्छिक पूरक व्हिडिओ
- धड्यापूर्वीचे वॉर्मअप क्विझ
- लिहिलेले धडा
- प्रोजेक्ट-आधारित धड्यांसाठी प्रोजेक्ट कसा तयार करायचा याबाबत टप्प्याटप्प्याने मार्गदर्शने
- ज्ञान तपासणी
- एक आव्हान
- पूरक वाचन
- असाइनमेंट
- धड्यानंतरचा क्विझ
क्विझबद्दल एक टीप: सर्व क्विझ Quiz-App फोल्डरमध्ये आहेत, एकूण ४० क्विझ ज्या प्रत्येकी तीन प्रश्नांच्या आहेत. त्यांना धड्यांमधून लिंक केले जाते, पण क्विझ अॅप स्थानिकरित्या चालवला जाऊ शकतो किंवा Azure वर तैनात केला जाऊ शकतो;
quiz-appफोल्डरमधील सूचना पाळा. ते हळूहळू स्थानिक केले जात आहेत.
🎓 सुरुवातीसाठी सोपे उदाहरणे
डेटा सायन्समध्ये नवीन आहात? आम्ही एक विशेष उदाहरणे निर्देशिका तयार केली आहे ज्यात सोपे आणि चांगल्या प्रकारे टिप्पणीसहित कोड आहे ज्यामुळे तुम्हाला सुरुवात करणे सोपे जाईल:
- 🌟 हॅलो वर्ल्ड - तुमचा पहिला डेटा सायन्स प्रोग्राम
- 📂 डेटा लोड करणे - डेटासेट वाचणे आणि शोधणे शिका
- 📊 सोपे विश्लेषण - सांख्यिकी गणना करा आणि नमुने शोधा
- 📈 मूलभूत दृश्यांकन - चार्ट्स आणि ग्राफ तयार करा
- 🔬 खरी जगातील प्रोजेक्ट - सुरुवातीपासून शेवटपर्यंत पूर्ण प्रक्रिया
प्रत्येक उदाहरणात प्रत्येक टप्पा समजावणाऱ्या सविस्तर टिप्पण्या आहेत, ज्यामुळे ते पूर्णपणे नवख्या व्यक्तीसाठी परिपूर्ण आहे!
धडे
![]() |
|---|
| डेटा सायन्स फॉर बिंनर्स: रोडमॅप - स्केचनोट @nitya कडून |
| धडा क्रमांक | विषय | धडा गट | शिकण्याची उद्दिष्टे | लिंक केलेला धडा | लेखक |
|---|---|---|---|---|---|
| ०१ | डेटा सायन्सची व्याख्या | परिचय | डेटा सायन्सच्या मूलभूत संकल्पना आणि कसे ते कृत्रिम बुद्धिमत्ता, मशीन लर्निंग, आणि बिग डेटा यासंबंधीत आहे ते शिका. | धडा व्हिडिओ | डमित्रि |
| ०२ | डेटा सायन्स नैतिकता | परिचय | डेटा नैतिकता संकल्पना, आव्हाने आणि फ्रेमवर्क्स. | धडा | नित्या |
| ०३ | डेटा व्याख्या | परिचय | डेटा कसा वर्गीकृत केला जातो आणि त्याचे सामान्य स्रोत काय आहेत. | धडा | जॅस्मीन |
| ०४ | सांख्यिकी व संभाव्यता परिचय | परिचय | डेटा समजून घेण्यासाठी संभाव्यता आणि सांख्यिकी यांचे गणितीय तंत्र. | धडा व्हिडिओ | डमित्रि |
| ०५ | संबंधी डेटा सोबत काम करणे | डेटा सोबत काम करणे | संबंधी डेटाचा परिचय आणि SQL (ज्याला "सी-क्वेल" म्हणतात) वापरून संबंधी डेटा शोधणे आणि विश्लेषण करण्याचे मूलतत्त्वे. | धडा | क्रिस्टोफर |
| ०६ | नोSQL डेटासोबत काम करणे | डेटा सोबत काम करणे | नॉन-रिलेशनल डेटाचा परिचय, त्याचे वेगवेगळे प्रकार आणि दस्तऐवज डेटाबेस कसे शोधायचे आणि विश्लेषण करायचे याचे मूलतत्त्व. | धडा | जॅस्मीन |
| ०७ | पायथन सोबत काम करणे | डेटा सोबत काम करणे | पायथन वापरून डेटा तपासणीसाठी Pandas सारख्या लायब्ररीजची मूलभूत माहिती. पायथन प्रोग्रॅमिंगचा प्राथमिक समज आवश्यक. | धडा व्हिडिओ | डमित्रि |
| ०८ | डेटा तयारी | डेटा सोबत काम करणे | हरवलेला, चुकीचा किंवा अपूर्ण डेटा यांसारख्या आव्हानांसाठी डेटा स्वच्छीकरण आणि रूपांतरण तंत्रे. | धडा | जॅस्मीन |
| ०९ | प्रमाणांची दृश्यांकन | डेटा दृश्यांकन | Matplotlib वापरून पक्षी डेटा 🦆 कसा दृश्य करायचा ते शिका | धडा | जेन |
| १० | डेटा वितरण दृश्यांकन | डेटा दृश्यांकन | अवधीतील निरीक्षणे व प्रवाह दृश्य करणे. | धडा | जेन |
| ११ | प्रमाणांचे दृश्यांकन | डेटा दृश्यांकन | निरंतर व समूहित टक्केवारीचे दृश्यांकन. | धडा | जेन |
| १२ | नातेसंबंधांचे दृश्यांकन | डेटा दृश्यांकन | डेटा सेट्स व त्यांचे बदल यामधील संबंध व सहसंबंधांचे दृश्यांकन. | धडा | जेन |
| १३ | अर्थपूर्ण दृश्यांकन | डेटा दृश्यांकन | प्रभावी समस्या सोडवण्यासाठी आणि अंतर्दृष्टीसाठी तुमच्या दृश्यांकनांना कसे मूल्यवान बनवायचे याबाबत तंत्रे व मार्गदर्शन. | धडा | जेन |
| १४ | डेटा सायन्स जीवनचक्र परिचय | जीवनचक्र | डेटा सायन्स जीवनचक्राचा परिचय आणि डेटाची प्राप्ती व बाहेर काढण्याचा पहिला टप्पा. | धडा | जॅस्मीन |
| १५ | विश्लेषण | जीवनचक्र | डेटा सायन्स जीवनचक्राचा हा टप्पा डेटाचे विश्लेषण करण्याच्या तंत्रांवर लक्ष केंद्रित करतो. | धडा | जॅस्मीन |
| १६ | संवाद | जीवनचक्र | हा टप्पा डेटा मधील अंतर्दृष्टीजम्हणून निर्णय घेणाऱ्यांना समजायला सोप्या पद्धतीने सादर करण्यावर लक्ष केंद्रित करतो. | धडा | जालेन |
| १७ | क्लाउड मध्ये डेटा सायन्स | क्लाउड डेटा | क्लाउडमधील डेटा सायन्स आणि त्याचे फायदे याची मालिका परिचय देते. | धडा | टिफनी आणि मॉड |
| १८ | क्लाउड मध्ये डेटा सायन्स | क्लाउड डेटा | लो कोड साधने वापरून मॉडेल्स प्रशिक्षण. | धडा | टिफनी आणि मॉड |
| १९ | क्लाउड मध्ये डेटा सायन्स | क्लाउड डेटा | Azure Machine Learning Studio वापरून मॉडेल्स तैनात करणे. | धडा | टिफनी आणि मॉड |
| २० | वास्तविक जगात डेटा सायन्स | वैल्डमध्ये | प्रत्यक्ष जगातील डेटा सायन्स चालित प्रोजेक्ट्स. | धडा | नित्या |
GitHub Codespaces
या सॅम्पलला Codespace मध्ये उघडण्यासाठी हे पावले करा: १. कोड ड्रॉपडाऊन मेनू क्लिक करा आणि Open with Codespaces पर्याय निवडा. २. पॅनलखाली + New codespace निवडा. अधिक माहितीसाठी, GitHub दस्तऐवज पहा.
VSCode Remote - कंटेनर्स
तुमच्या स्थानिक संगणकावर आणि VSCode वापरून VS Code Remote - Containers एक्सटेंशन वापरून या रिपोजिटरीला कंटेनरमध्ये उघडण्यासाठी हे पावले करा:
१. जर तुम्ही प्रथमच डेव्हलपमेंट कंटेनर वापरत असाल तर, कृपया प्रारंभिक दस्तऐवज मध्ये नमूद केलेली पूर्वअट तपासा (उदा. Docker इन्स्टॉल केलेले आहे की नाही).
हा रिपोजिटरी वापरण्यासाठी, तुम्ही रिपोजिटरीला वेगळ्या Docker व्हॉल्यूममध्ये उघडू शकता:
टीप: यामुळे Remote-Containers: Clone Repository in Container Volume... कमांड वापरून स्रोत कोड स्थानिक फाइलसिस्टमऐवजी Docker व्हॉल्यूममध्ये क्लोन केला जाईल. व्हॉल्यूम ही कंटेनर डेटा टिकवण्यासाठी पसंतीची पद्धत आहे.
किंवा रिपोजिटरीची स्थानिक क्लोन किंवा डाउनलोड केलेली आवृत्ती उघडा:
- ही रिपोजिटरी तुमच्या स्थानिक फाइलसिस्टमवर क्लोन करा.
- F1 दाबा आणि Remote-Containers: Open Folder in Container... कमांड निवडा.
- या फोल्डरची क्लोन केलेली कॉपी निवडा, कंटेनर सुरू होईपर्यंत थांबा, आणि वापर करून पहा.
ऑफलाइन प्रवेश
तुम्ही हा दस्तऐवज ऑफलाइन चालवू शकता Docsify वापरून. या रिपोजिटरीला फोर्क करा, तुमच्या स्थानिक संगणकावर Docsify इंस्टॉल करा, नंतर या रिपोजिटरीच्या मूळ फोल्डरमध्ये docsify serve टाईप करा. वेबसाइट लोकलहोस्टच्या पोर्ट 3000 वर सेवा देईल: localhost:3000.
लक्षात ठेवा, नोटबुक्स Docsify द्वारे रेंडर केले जाणार नाहीत, त्यामुळे नोटबुक चालवणे आवश्यक असल्यास VS Code मध्ये वेगळे Python कर्नेल वापरून ते करा.
इतर अभ्यासक्रम
आमची टीम इतर अभ्यासक्रम देखील तयार करते! हे पाहा:
LangChain
Azure / Edge / MCP / एजंट्स
जनरेटिव्ह AI श्रेणी
कोअर शिक्षण
कोपायलट श्रेणी
मदत मिळविणे
समस्या येत आहेत? सामान्य समस्यांसाठी सोडवणुकीसाठी आमची तक्रार निराकरण मार्गदर्शिका तपासा.
जर तुम्हाला अडचण येत असेल किंवा AI अनुप्रयोग तयार करण्याबाबत काही प्रश्न असतील तर, MCP बद्दल चर्चा करण्यासाठी इतर शिकणाऱ्यांशी आणि अनुभवी विकसकांशी सामील व्हा. हे एक सहकार्यशील समुदाय आहे जिथे प्रश्न विचारणे स्वागतार्ह आहे आणि ज्ञान मुक्तपणे शेअर केले जाते.
तुमच्याकडे उत्पादन फीडबॅक किंवा त्रुटी असल्यास:
अस्वीकरण: हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्न करतो, तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरांमध्ये चुका किंवा अपूर्णता असू शकतात. मूळ दस्तऐवज त्याच्या नैसर्गिक भाषेत अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतर शिफारस केली जाते. या भाषांतराच्या वापरामुळे झालेल्या कोणत्याही गैरसमजुती किंवा चुकीच्या अर्थाच्या जबाबदारी आम्ही घेत नाही.



