You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/mr/6-Data-Science-In-Wild/20-Real-World-Examples
leestott 8029ff828a
🌐 Update translations via Co-op Translator
5 months ago
..
README.md 🌐 Update translations via Co-op Translator 5 months ago
assignment.md 🌐 Update translations via Co-op Translator 5 months ago

README.md

वास्तविक जगातील डेटा सायन्स

 Sketchnote by (@sketchthedocs)
वास्तविक जगातील डेटा सायन्स - Sketchnote by @nitya

आपल्या शिकण्याच्या प्रवासाचा शेवट जवळ आला आहे!

आपण डेटा सायन्स आणि नैतिकतेच्या व्याख्यांपासून सुरुवात केली, डेटा विश्लेषण आणि व्हिज्युअलायझेशनसाठी विविध साधने आणि तंत्रे शोधली, डेटा सायन्स जीवनचक्राचा आढावा घेतला आणि क्लाउड संगणन सेवांसह डेटा सायन्स वर्कफ्लो स्केलिंग आणि स्वयंचलित करण्याचा विचार केला. त्यामुळे तुम्ही कदाचित विचार करत असाल: "हे सर्व शिकलेले वास्तविक जगातील संदर्भांशी कसे जोडायचे?"

या धड्यात, आपण उद्योगातील डेटा सायन्सच्या वास्तविक-जगातील अनुप्रयोगांचा शोध घेऊ आणि संशोधन, डिजिटल मानविकी आणि शाश्वतता यासारख्या विशिष्ट उदाहरणांमध्ये डुबकी मारू. आपण विद्यार्थ्यांच्या प्रकल्पांच्या संधींचा विचार करू आणि आपल्या शिकण्याच्या प्रवासाला पुढे नेण्यासाठी उपयुक्त संसाधनांसह समाप्त करू!

पूर्व-व्याख्यान प्रश्नमंजुषा

पूर्व-व्याख्यान प्रश्नमंजुषा

डेटा सायन्स + उद्योग

AI च्या लोकशाहीकरणामुळे, विकसकांना आता AI-चालित निर्णय घेणे आणि डेटा-चालित अंतर्दृष्टी वापरकर्ता अनुभवांमध्ये आणि विकास कार्यप्रवाहांमध्ये डिझाइन करणे आणि समाकलित करणे सोपे झाले आहे. येथे डेटा सायन्स उद्योगभर "लागू" कसा केला जातो याची काही उदाहरणे आहेत:

  • Google Flu Trends ने शोध शब्दांचा फ्लू ट्रेंड्सशी संबंध जोडण्यासाठी डेटा सायन्सचा वापर केला. जरी या दृष्टिकोनात त्रुटी होत्या, तरीही याने डेटा-चालित आरोग्यसेवा अंदाजांच्या शक्यता (आणि आव्हाने) याबद्दल जागरूकता निर्माण केली.

  • UPS Routing Predictions - UPS कसे डेटा सायन्स आणि मशीन लर्निंगचा वापर करून हवामान परिस्थिती, वाहतूक नमुने, वितरणाच्या अंतिम मुदती आणि बरेच काही लक्षात घेऊन वितरणासाठी सर्वोत्तम मार्गांचा अंदाज लावतो हे स्पष्ट करते.

  • NYC Taxicab Route Visualization - माहिती स्वातंत्र्य कायद्यांचा वापर करून गोळा केलेल्या डेटाने NYC कॅब्सच्या एका दिवसाचे व्हिज्युअलायझेशन करण्यात मदत केली, ज्यामुळे आम्हाला समजले की ते व्यस्त शहरात कसे नेव्हिगेट करतात, ते किती पैसे कमवतात आणि प्रत्येक 24-तास कालावधीत प्रवास किती काळ टिकतो.

  • Uber Data Science Workbench - दररोज लाखो उबर ट्रिप्समधून गोळा केलेल्या डेटाचा (पिकअप आणि ड्रॉपऑफ स्थान, प्रवासाचा कालावधी, प्राधान्य दिलेले मार्ग इ.) डेटा विश्लेषण साधन तयार करण्यासाठी वापर केला जातो, ज्यामुळे किंमत निर्धारण, सुरक्षा, फसवणूक शोधणे आणि नेव्हिगेशन निर्णय घेण्यात मदत होते.

  • Sports Analytics - प्रेडिक्टिव अॅनालिटिक्स (संघ आणि खेळाडूंचे विश्लेषण - Moneyball विचार करा - आणि चाहत्यांचे व्यवस्थापन) आणि डेटा व्हिज्युअलायझेशन (संघ आणि चाहत्यांचे डॅशबोर्ड, खेळ इ.) वर लक्ष केंद्रित करते, ज्यामध्ये प्रतिभा शोधणे, क्रीडा जुगार आणि इन्व्हेंटरी/स्थळ व्यवस्थापन यासारख्या अनुप्रयोगांचा समावेश आहे.

  • Data Science in Banking - वित्तीय उद्योगातील डेटा सायन्सच्या मूल्यावर प्रकाश टाकते, ज्यामध्ये जोखीम मॉडेलिंग आणि फसवणूक शोधणे, ग्राहक विभागणी, रिअल-टाइम अंदाज आणि शिफारस प्रणाली यासारख्या अनुप्रयोगांचा समावेश आहे. प्रेडिक्टिव अॅनालिटिक्स देखील क्रेडिट स्कोअर्स यांसारख्या महत्त्वाच्या उपाययोजनांना चालना देते.

  • Data Science in Healthcare - वैद्यकीय प्रतिमा (उदा., एमआरआय, एक्स-रे, सीटी-स्कॅन), जीनोमिक्स (डीएनए अनुक्रमण), औषध विकास (जोखीम मूल्यांकन, यशाचा अंदाज), प्रेडिक्टिव अॅनालिटिक्स (रुग्णांची काळजी आणि पुरवठा लॉजिस्टिक्स), रोग ट्रॅकिंग आणि प्रतिबंध यांसारख्या अनुप्रयोगांवर प्रकाश टाकते.

वास्तविक जगातील डेटा सायन्स अनुप्रयोग प्रतिमा क्रेडिट: Data Flair: 6 Amazing Data Science Applications

आकृतीत डेटा सायन्स तंत्रे लागू करण्यासाठी इतर डोमेन आणि उदाहरणे दर्शविली आहेत. इतर अनुप्रयोगांचा शोध घ्यायचा आहे? खालील पुनरावलोकन आणि स्व-अभ्यास विभाग तपासा.

डेटा सायन्स + संशोधन

 Sketchnote by (@sketchthedocs)
डेटा सायन्स आणि संशोधन - Sketchnote by @nitya

वास्तविक-जगातील अनुप्रयोग प्रामुख्याने उद्योगातील मोठ्या प्रमाणातील वापराच्या प्रकरणांवर लक्ष केंद्रित करतात, तर संशोधन अनुप्रयोग आणि प्रकल्प दोन दृष्टिकोनांमधून उपयुक्त ठरू शकतात:

  • नाविन्यपूर्ण संधी - प्रगत संकल्पनांचे जलद प्रोटोटाइपिंग आणि पुढील पिढीच्या अनुप्रयोगांसाठी वापरकर्ता अनुभवांची चाचणी घेणे.
  • तैनाती आव्हाने - वास्तविक-जगातील संदर्भांमध्ये डेटा सायन्स तंत्रज्ञानाच्या संभाव्य हानी किंवा अनपेक्षित परिणामांची चौकशी करणे.

विद्यार्थ्यांसाठी, हे संशोधन प्रकल्प शिकण्याच्या आणि सहकार्याच्या संधी प्रदान करू शकतात, ज्यामुळे तुमच्या विषयाची समज सुधारेल आणि संबंधित लोक किंवा स्वारस्य असलेल्या क्षेत्रांमध्ये काम करणाऱ्या संघांशी तुमची जागरूकता आणि सहभाग वाढेल. तर संशोधन प्रकल्प कसे दिसतात आणि ते कसा प्रभाव पाडू शकतात?

चला एका उदाहरणावर नजर टाकूया - MIT Gender Shades Study - Joy Buolamwini (MIT Media Labs) यांचे संशोधन प्रकल्प, ज्यामध्ये Timnit Gebru (त्यावेळी Microsoft Research) सह-लेखक असलेल्या संशोधन पेपर वर लक्ष केंद्रित केले आहे.

  • काय: संशोधन प्रकल्पाचा उद्देश लिंग आणि त्वचेच्या प्रकारावर आधारित स्वयंचलित चेहर्यावरील विश्लेषण अल्गोरिदम आणि डेटासेट्समधील पूर्वग्रहांचे मूल्यांकन करणे हा होता.
  • का: चेहर्यावरील विश्लेषण कायद्याची अंमलबजावणी, विमानतळ सुरक्षा, भरती प्रणाली आणि बरेच काही यासारख्या क्षेत्रांमध्ये वापरले जाते - जिथे चुकीचे वर्गीकरण (उदा., पूर्वग्रहांमुळे) प्रभावित व्यक्ती किंवा गटांना संभाव्य आर्थिक आणि सामाजिक हानी पोहोचवू शकते. पूर्वग्रह समजून घेणे (आणि काढून टाकणे किंवा कमी करणे) हे वापरातील न्यायतेसाठी महत्त्वाचे आहे.
  • कसे: संशोधकांनी ओळखले की विद्यमान बेंचमार्कमध्ये प्रामुख्याने हलक्या त्वचेच्या विषयांचा समावेश आहे आणि त्यांनी एक नवीन डेटासेट (1000+ प्रतिमा) तयार केले जे लिंग आणि त्वचेच्या प्रकारानुसार अधिक संतुलित होते. डेटासेटचा वापर तीन लिंग वर्गीकरण उत्पादनांच्या अचूकतेचे मूल्यांकन करण्यासाठी केला गेला (Microsoft, IBM आणि Face++ कडून).

परिणामांनी दाखवले की एकूण वर्गीकरण अचूकता चांगली असली तरी, विविध उपगटांमधील त्रुटी दरांमध्ये लक्षणीय फरक होता - चुकीचे लिंग वर्गीकरण महिलांसाठी किंवा गडद त्वचेच्या प्रकारांसाठी जास्त होते, जे पूर्वग्रह दर्शविते.

महत्त्वाचे परिणाम: डेटा सायन्सला अधिक प्रतिनिधिक डेटासेट्स (संतुलित उपगट) आणि अधिक समावेशक संघ (विविध पार्श्वभूमी) आवश्यक आहेत हे समजून घेण्यासाठी आणि अशा पूर्वग्रहांना AI सोल्यूशन्समध्ये लवकर ओळखण्यासाठी आणि कमी करण्यासाठी जागरूकता निर्माण केली. अशा संशोधन प्रयत्नांमुळे अनेक संस्थांना त्यांच्या AI उत्पादनांमध्ये आणि प्रक्रियांमध्ये न्याय्यतेसाठी जबाबदार AI साठी तत्त्वे आणि पद्धती परिभाषित करण्यात मदत होते.

Microsoft मधील संबंधित संशोधन प्रयत्नांबद्दल जाणून घ्यायचे आहे?

डेटा सायन्स + मानविकी

 Sketchnote by (@sketchthedocs)
डेटा सायन्स आणि डिजिटल मानविकी - Sketchnote by @nitya

डिजिटल मानविकी असे परिभाषित केले गेले आहे की "मानवीय चौकशीसह संगणकीय पद्धती एकत्रित करणाऱ्या पद्धती आणि दृष्टिकोनांचा संग्रह". स्टॅनफोर्ड प्रकल्प जसे की "इतिहासाचा पुनरुज्जीवन" आणि "काव्यात्मक विचार" डिजिटल मानविकी आणि डेटा सायन्स यांच्यातील दुव्याचे उदाहरण देतात - नेटवर्क विश्लेषण, माहिती व्हिज्युअलायझेशन, स्थानिक आणि मजकूर विश्लेषण यांसारख्या तंत्रांवर भर देऊन, ज्यामुळे ऐतिहासिक आणि साहित्यिक डेटासेट्सचा पुनर्विचार करून नवीन अंतर्दृष्टी आणि दृष्टिकोन मिळवता येतो.

या क्षेत्रातील प्रकल्प शोधायचा आणि विस्तारित करायचा आहे?

"Emily Dickinson and the Meter of Mood" तपासा - Jen Looper यांचे एक उत्कृष्ट उदाहरण, जे विचारते की आपण डेटा सायन्सचा वापर करून परिचित कवितांचा पुनर्विचार कसा करू शकतो आणि नवीन संदर्भांमध्ये त्याचा अर्थ आणि लेखकाचे योगदान पुन्हा कसे मूल्यांकन करू शकतो. उदाहरणार्थ, कवितेच्या टोन किंवा भावना विश्लेषणाद्वारे ती कोणत्या ऋतूमध्ये लिहिली गेली याचा अंदाज लावता येतो का - आणि यामुळे संबंधित कालावधीत लेखकाच्या मानसिक स्थितीबद्दल काय सांगते?

त्या प्रश्नाचे उत्तर देण्यासाठी, आपण डेटा सायन्स जीवनचक्राच्या टप्प्यांचे अनुसरण करतो:

  • डेटा अधिग्रहण - विश्लेषणासाठी संबंधित डेटासेट गोळा करणे. API (उदा., Poetry DB API) वापरणे किंवा वेब पृष्ठे स्क्रॅप करणे (उदा., Project Gutenberg) यासारखे पर्याय.
  • डेटा स्वच्छता - मजकूर कसा स्वरूपित, स्वच्छ आणि सोपा केला जाऊ शकतो हे मूलभूत साधनांचा वापर करून स्पष्ट करते, जसे की Visual Studio Code आणि Microsoft Excel.
  • डेटा विश्लेषण - डेटासेट "नोटबुक्स" मध्ये आयात करून Python पॅकेजेस (जसे की pandas, numpy आणि matplotlib) चा वापर करून डेटा आयोजित आणि व्हिज्युअलायझेशन कसे करावे हे स्पष्ट करते.
  • भावना विश्लेषण - क्लाउड सेवांचा समावेश कसा करावा हे स्पष्ट करते, जसे की Text Analytics, कमी-कोड साधनांचा वापर करून Power Automate स्वयंचलित डेटा प्रक्रिया कार्यप्रवाहांसाठी.

या कार्यप्रवाहाचा वापर करून, आपण कवितांच्या भावनांवर ऋतूंचा प्रभाव शोधू शकतो आणि लेखकाबद्दल आपले स्वतःचे दृष्टिकोन तयार करू शकतो. स्वतः प्रयत्न करा - मग नोटबुक विस्तारित करा, इतर प्रश्न विचारा किंवा डेटाचे नवीन पद्धतीने व्हिज्युअलायझेशन करा!

तुम्ही डिजिटल मानविकी टूलकिट मधील काही साधनांचा वापर करून या चौकशीच्या मार्गांचा पाठपुरावा करू शकता.

डेटा सायन्स + शाश्वतता

 Sketchnote by (@sketchthedocs)
डेटा सायन्स आणि शाश्वतता - Sketchnote by @nitya

2030 साठी शाश्वत विकासाचा अजेंडा - 2015 मध्ये सर्व संयुक्त राष्ट्र सदस्यांनी स्वीकारलेला - 17 उद्दिष्टे ओळखतो, ज्यामध्ये ग्रहाचे संरक्षण करण्यावर आणि हवामान बदलाच्या परिणामांपासून संरक्षण करण्यावर लक्ष केंद्रित केले आहे. Microsoft Sustainability उपक्रम या उद्दिष्टांचे समर्थन करतो, तंत्रज्ञानाच्या उपायांनी अधिक शाश्वत भविष्ये कशी तयार करता येतील याचा शोध घेतो, आणि 4 उद्दिष्टांवर लक्ष केंद्रित करतो - 2030 पर्यंत कार्बन नकारात्मक, पाण्याचे सकारात्मक, शून्य कचरा आणि जैवविविधता.

या आव्हानांना स्केलेबल आणि वेळेवर हाताळण्यासाठी क्लाउड-स्केल विचार आवश्यक आहे - आणि मोठ्या प्रमाणात डेटा. Planetary Computer उपक्रम डेटा सायंटिस्ट्स आणि विकसकांना या प्रयत्नात मदत करण्यासाठी 4 घटक प्रदान करतो:

  • डेटा कॅटलॉग - पृथ्वी प्रणाली डेटाचे पेटाबाइट्स (मोफत आणि Azure-होस्ट केलेले).

  • Planetary API - वापरकर्त्यांना जागा आणि वेळेनुसार संबंधित प्लॅनेटरी कॉम्प्युटर प्रोजेक्ट सध्या प्रिव्ह्यूमध्ये आहे (सप्टेंबर 2021 पर्यंत) - डेटा सायन्स वापरून टिकाऊ उपायांमध्ये योगदान देण्यासाठी सुरुवात कशी करावी याबद्दल जाणून घ्या.

  • प्रवेशासाठी विनंती करा आणि शोध सुरू करा तसेच सहकाऱ्यांशी संपर्क साधा.

  • डॉक्युमेंटेशन एक्सप्लोर करा जेणेकरून समर्थित डेटासेट्स आणि API समजून घेता येतील.

  • इकोसिस्टम मॉनिटरिंग सारख्या अनुप्रयोगांचा अभ्यास करा जे अनुप्रयोग कल्पनांसाठी प्रेरणा देऊ शकतात.

डेटा व्हिज्युअलायझेशनचा वापर करून हवामान बदल आणि जंगलतोड यासारख्या क्षेत्रांमध्ये महत्त्वपूर्ण अंतर्दृष्टी कशी उघड करता येईल किंवा ती अधिक प्रभावीपणे कशी मांडता येईल याचा विचार करा. किंवा अशा अंतर्दृष्टींचा वापर करून नवीन वापरकर्ता अनुभव तयार करण्याचा विचार करा जे टिकाऊ जीवनासाठी वर्तनात्मक बदलांना प्रेरित करतात.

डेटा सायन्स + विद्यार्थी

आम्ही उद्योग आणि संशोधनातील वास्तविक-जागतिक अनुप्रयोगांबद्दल चर्चा केली आहे आणि डिजिटल ह्युमॅनिटीज आणि टिकाऊपणामध्ये डेटा सायन्स अनुप्रयोगांचे उदाहरणे पाहिले आहेत. तर, डेटा सायन्स नवशिक्यांप्रमाणे आपले कौशल्य कसे विकसित करावे आणि आपले तज्ज्ञ ज्ञान कसे सामायिक करावे?

येथे काही डेटा सायन्स विद्यार्थी प्रकल्प आहेत जे तुम्हाला प्रेरणा देतील.

🚀 आव्हान

डेटा सायन्स प्रकल्पांसाठी लेख शोधा जे नवशिक्यांसाठी सोपे आहेत - जसे हे 50 विषय क्षेत्र किंवा हे 21 प्रकल्प कल्पना किंवा सोर्स कोडसह 16 प्रकल्प जे तुम्ही डी-कॉन्स्ट्रक्ट आणि रीमिक्स करू शकता. आणि तुमच्या शिकण्याच्या प्रवासाबद्दल ब्लॉग लिहायला विसरू नका आणि तुमच्या अंतर्दृष्टी आमच्यासोबत शेअर करा.

पोस्ट-लेक्चर क्विझ

पोस्ट-लेक्चर क्विझ

पुनरावलोकन आणि स्व-अभ्यास

अधिक उपयोग प्रकरणे एक्सप्लोर करू इच्छिता? येथे काही संबंधित लेख आहेत:

असाइनमेंट

प्लॅनेटरी कॉम्प्युटर डेटासेट एक्सप्लोर करा


अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात ठेवा की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवलेल्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.