You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/mr/6-Data-Science-In-Wild/20-Real-World-Examples/README.md

35 KiB

वास्तविक जगातील डेटा सायन्स

 Sketchnote by (@sketchthedocs)
वास्तविक जगातील डेटा सायन्स - Sketchnote by @nitya

आपल्या शिकण्याच्या प्रवासाचा शेवट जवळ आला आहे!

आपण डेटा सायन्स आणि नैतिकतेच्या व्याख्यांपासून सुरुवात केली, डेटा विश्लेषण आणि व्हिज्युअलायझेशनसाठी विविध साधने आणि तंत्रे शोधली, डेटा सायन्स जीवनचक्राचा आढावा घेतला आणि क्लाउड संगणन सेवांसह डेटा सायन्स वर्कफ्लो स्केलिंग आणि ऑटोमेशन कसे करावे हे पाहिले. त्यामुळे तुम्ही कदाचित विचार करत असाल: "हे सर्व शिकलेले ज्ञान वास्तविक जगातील संदर्भांशी कसे जोडायचे?"

या धड्यात, आपण उद्योगातील डेटा सायन्सच्या वास्तविक जगातील अनुप्रयोगांचा शोध घेऊ आणि संशोधन, डिजिटल मानविकी आणि शाश्वतता यासारख्या विशिष्ट उदाहरणांमध्ये डोकावू. आपण विद्यार्थ्यांसाठी प्रकल्प संधी पाहू आणि आपल्या शिकण्याच्या प्रवासाला पुढे नेण्यासाठी उपयुक्त संसाधनांसह समाप्त करू!

पूर्व-व्याख्यान प्रश्नमंजुषा

पूर्व-व्याख्यान प्रश्नमंजुषा

डेटा सायन्स + उद्योग

AI च्या लोकशाहीकरणामुळे, विकसकांना आता AI-चालित निर्णय घेणे आणि डेटा-चालित अंतर्दृष्टी वापरकर्ता अनुभवांमध्ये आणि विकास कार्यप्रवाहांमध्ये समाकलित करणे सोपे झाले आहे. येथे उद्योगातील वास्तविक जगातील अनुप्रयोगांमध्ये डेटा सायन्स "लागू" कसा केला जातो याची काही उदाहरणे आहेत:

  • Google Flu Trends ने शोध शब्दांचा फ्लू ट्रेंड्सशी संबंध जोडण्यासाठी डेटा सायन्सचा वापर केला. जरी या दृष्टिकोनात त्रुटी होत्या, तरीही यामुळे डेटा-चालित आरोग्यसेवा अंदाजांच्या शक्यता (आणि आव्हाने) याबद्दल जागरूकता निर्माण झाली.

  • UPS Routing Predictions - UPS कसे डेटा सायन्स आणि मशीन लर्निंगचा वापर करून हवामान परिस्थिती, वाहतूक नमुने, वितरणाच्या अंतिम मुदती आणि इतर घटक विचारात घेऊन वितरणासाठी सर्वोत्तम मार्गांची भविष्यवाणी करते हे स्पष्ट करते.

  • NYC Taxicab Route Visualization - माहिती स्वातंत्र्य कायद्यांचा वापर करून गोळा केलेल्या डेटाने NYC कॅब्सच्या एका दिवसाचे व्हिज्युअलायझेशन केले, ज्यामुळे आम्हाला समजले की ते गजबजलेल्या शहरात कसे नेव्हिगेट करतात, ते किती पैसे कमावतात आणि प्रत्येक २४ तासांच्या कालावधीत प्रवास किती काळ टिकतो.

  • Uber Data Science Workbench - दररोज लाखो उबर ट्रिप्समधून गोळा केलेल्या डेटाचा (पिकअप आणि ड्रॉपऑफ स्थान, प्रवासाचा कालावधी, प्राधान्य मार्ग इ.) वापर करून किंमत निर्धारण, सुरक्षा, फसवणूक शोधणे आणि नेव्हिगेशन निर्णयांसाठी डेटा अॅनालिटिक्स साधन तयार केले.

  • Sports Analytics - भविष्यवाणी विश्लेषण (संघ आणि खेळाडू विश्लेषण - Moneyball विचार करा - आणि चाहत्यांचे व्यवस्थापन) आणि डेटा व्हिज्युअलायझेशन (संघ आणि चाहत्यांचे डॅशबोर्ड, खेळ इ.) वर लक्ष केंद्रित करते, ज्यामध्ये प्रतिभा शोधणे, क्रीडा जुगार आणि इन्व्हेंटरी/स्थळ व्यवस्थापन यासारख्या अनुप्रयोगांचा समावेश आहे.

  • Data Science in Banking - वित्तीय उद्योगातील डेटा सायन्सच्या मूल्यावर प्रकाश टाकते, ज्यामध्ये जोखीम मॉडेलिंग आणि फसवणूक शोधणे, ग्राहक विभागणी, रिअल-टाइम अंदाज आणि शिफारस प्रणाली यासारख्या अनुप्रयोगांचा समावेश आहे. भविष्यवाणी विश्लेषण देखील क्रेडिट स्कोअर्स सारख्या महत्त्वाच्या उपायांना चालना देते.

  • Data Science in Healthcare - वैद्यकीय प्रतिमा (उदा., MRI, X-Ray, CT-Scan), जीनोमिक्स (DNA अनुक्रमण), औषध विकास (जोखीम मूल्यांकन, यशस्वी अंदाज), भविष्यवाणी विश्लेषण (रुग्ण काळजी आणि पुरवठा लॉजिस्टिक्स), रोग ट्रॅकिंग आणि प्रतिबंध यासारख्या अनुप्रयोगांवर प्रकाश टाकते.

वास्तविक जगातील डेटा सायन्स अनुप्रयोग प्रतिमा श्रेय: Data Flair: 6 Amazing Data Science Applications

चित्रात डेटा सायन्स तंत्र लागू करण्यासाठी इतर डोमेन आणि उदाहरणे दर्शविली आहेत. इतर अनुप्रयोगांचा शोध घ्यायचा आहे का? खालील पुनरावलोकन आणि स्व-अभ्यास विभाग तपासा.

डेटा सायन्स + संशोधन

 Sketchnote by (@sketchthedocs)
डेटा सायन्स आणि संशोधन - Sketchnote by @nitya

वास्तविक जगातील अनुप्रयोग प्रामुख्याने उद्योगातील मोठ्या प्रमाणातील वापरावर लक्ष केंद्रित करतात, तर संशोधन अनुप्रयोग आणि प्रकल्प दोन दृष्टिकोनातून उपयुक्त ठरू शकतात:

  • नाविन्यपूर्ण संधी - पुढील पिढीच्या अनुप्रयोगांसाठी प्रगत संकल्पनांचे जलद प्रोटोटायपिंग आणि वापरकर्ता अनुभवांची चाचणी घेणे.
  • तैनाती आव्हाने - वास्तविक जगातील संदर्भांमध्ये डेटा सायन्स तंत्रज्ञानाच्या संभाव्य हानी किंवा अनपेक्षित परिणामांचा तपास करणे.

विद्यार्थ्यांसाठी, हे संशोधन प्रकल्प शिकण्याच्या आणि सहकार्याच्या संधी प्रदान करू शकतात, जे तुमच्या विषयावरील समज सुधारू शकतात आणि संबंधित लोक किंवा कार्यसंघांसोबत तुमची जागरूकता आणि सहभाग वाढवू शकतात. तर संशोधन प्रकल्प कसे दिसतात आणि ते कसा प्रभाव पाडू शकतात?

चला एका उदाहरणाकडे पाहूया - MIT Gender Shades Study ज्याचे नेतृत्व जॉय बुओलाम्विनी (MIT मीडिया लॅब्स) यांनी केले आणि टिम्निट गेब्रू यांच्यासोबत सह-लेखक असलेल्या संशोधन पेपरसह (त्यावेळी मायक्रोसॉफ्ट रिसर्चमध्ये) प्रकाशित केले. संशोधनाचा उद्देश होता:

  • काय: लिंग आणि त्वचेच्या प्रकारावर आधारित स्वयंचलित चेहर्यावरील विश्लेषण अल्गोरिदम आणि डेटासेट्समधील पूर्वग्रहांचे मूल्यांकन करणे.
  • का: चेहर्यावरील विश्लेषण कायद्याची अंमलबजावणी, विमानतळ सुरक्षा, भरती प्रणाली आणि इतर क्षेत्रांमध्ये वापरले जाते - जिथे चुकीचे वर्गीकरण (उदा., पूर्वग्रहांमुळे) प्रभावित व्यक्ती किंवा गटांसाठी संभाव्य आर्थिक आणि सामाजिक हानी होऊ शकते. वापरातील न्याय सुनिश्चित करण्यासाठी पूर्वग्रह समजून घेणे (आणि काढून टाकणे किंवा कमी करणे) महत्त्वाचे आहे.
  • कसे: संशोधकांनी ओळखले की विद्यमान बेंचमार्कमध्ये प्रामुख्याने फिकट त्वचेच्या व्यक्तींचा समावेश आहे आणि त्यांनी एक नवीन डेटासेट (१०००+ प्रतिमा) तयार केले जे लिंग आणि त्वचेच्या प्रकारानुसार अधिक संतुलित होते. डेटासेटचा वापर मायक्रोसॉफ्ट, IBM आणि Face++ च्या तीन लिंग वर्गीकरण उत्पादनांच्या अचूकतेचे मूल्यांकन करण्यासाठी केला गेला.

परिणामांमध्ये असे दिसून आले की एकूण वर्गीकरण अचूकता चांगली असली तरी विविध उपगटांमध्ये त्रुटी दरांमध्ये लक्षणीय फरक होता - मिसजेंडरिंग महिलांसाठी किंवा गडद त्वचेच्या प्रकारांसाठी जास्त होता, जो पूर्वग्रह दर्शवितो.

महत्त्वाचे परिणाम: डेटा सायन्सला अधिक प्रतिनिधिक डेटासेट्स (संतुलित उपगट) आणि अधिक समावेशक संघ (विविध पार्श्वभूमी) आवश्यक आहेत हे दाखवून दिले, जे AI सोल्यूशन्समध्ये असे पूर्वग्रह लवकर ओळखून काढून टाकण्यासाठी किंवा कमी करण्यासाठी महत्त्वाचे आहे. अशा संशोधन प्रयत्नांमुळे अनेक संस्थांना त्यांच्या AI उत्पादनांमध्ये आणि प्रक्रियांमध्ये न्याय सुनिश्चित करण्यासाठी जबाबदार AI साठी तत्त्वे आणि पद्धती परिभाषित करण्यात मदत झाली.

मायक्रोसॉफ्टमधील संबंधित संशोधन प्रयत्नांबद्दल जाणून घ्यायचे आहे का?

डेटा सायन्स + मानविकी

 Sketchnote by (@sketchthedocs)
डेटा सायन्स आणि डिजिटल मानविकी - Sketchnote by @nitya

डिजिटल मानविकी असे परिभाषित केले गेले आहे की "मानवीय चौकशीसह संगणकीय पद्धती एकत्र करणाऱ्या पद्धती आणि दृष्टिकोनांचा संग्रह". स्टॅनफोर्ड प्रकल्प जसे की "इतिहास पुन्हा सुरू करणे" आणि "काव्यात्मक विचार" डिजिटल मानविकी आणि डेटा सायन्स यांच्यातील दुव्याचे उदाहरण देतात - नेटवर्क विश्लेषण, माहिती व्हिज्युअलायझेशन, स्थानिक आणि मजकूर विश्लेषण यासारख्या तंत्रांवर भर देऊन ऐतिहासिक आणि साहित्यिक डेटासेट्सचा पुनर्विचार करण्यासाठी नवीन अंतर्दृष्टी आणि दृष्टिकोन प्राप्त करण्यासाठी मदत करतात.

या क्षेत्रातील प्रकल्प शोधायचा आणि विस्तारित करायचा आहे का?

"Emily Dickinson and the Meter of Mood" तपासा - Jen Looper यांच्याकडून एक उत्कृष्ट उदाहरण जे विचारते की आपण डेटा सायन्सचा वापर करून परिचित कवितांचा पुनर्विचार कसा करू शकतो आणि नवीन संदर्भांमध्ये त्याचा अर्थ आणि लेखकाचे योगदान पुन्हा कसे मूल्यांकन करू शकतो. उदाहरणार्थ, कवितेच्या टोन किंवा भावना विश्लेषणाद्वारे ती कोणत्या ऋतूमध्ये लिहिली गेली याचा अंदाज लावता येतो का - आणि यामुळे संबंधित कालावधीत लेखकाच्या मानसिक स्थितीबद्दल काय सांगते?

त्या प्रश्नाचे उत्तर देण्यासाठी, आपण डेटा सायन्स जीवनचक्राच्या टप्प्यांचे अनुसरण करतो:

  • डेटा संकलन - विश्लेषणासाठी संबंधित डेटासेट गोळा करणे. API (उदा., Poetry DB API) वापरणे किंवा वेब पृष्ठे स्क्रॅप करणे (उदा., Project Gutenberg) यासारखे पर्याय.
  • डेटा स्वच्छता - मजकूर स्वरूपित करणे, स्वच्छ करणे आणि सोपे करणे याचे स्पष्टीकरण देते, यासाठी Visual Studio Code आणि Microsoft Excel यासारखी मूलभूत साधने वापरली जातात.
  • डेटा विश्लेषण - डेटासेट "नोटबुक्स" मध्ये आयात करून Python पॅकेजेस (जसे pandas, numpy आणि matplotlib) चा वापर करून डेटा आयोजित आणि व्हिज्युअलायझेशन कसे करावे याचे स्पष्टीकरण देते.
  • भावना विश्लेषण - क्लाउड सेवांसारख्या Text Analytics चा समावेश कसा करू शकतो, याचे स्पष्टीकरण देते, कमी-कोड साधनांसह Power Automate वापरून स्वयंचलित डेटा प्रक्रिया कार्यप्रवाहांसाठी.

या कार्यप्रवाहाचा वापर करून, आपण कवितांच्या भावनांवर ऋतूंचा प्रभाव शोधू शकतो आणि लेखकाबद्दल आपले स्वतःचे दृष्टिकोन तयार करू शकतो. स्वतः प्रयत्न करा - मग नोटबुक विस्तारित करा, इतर प्रश्न विचारा किंवा डेटा नवीन पद्धतीने व्हिज्युअल करा!

तुम्ही डिजिटल मानविकी टूलकिट मधील काही साधनांचा वापर करून या चौकशीच्या मार्गांचा पाठपुरावा करू शकता.

डेटा सायन्स + शाश्वतता

 Sketchnote by (@sketchthedocs)
डेटा सायन्स आणि शाश्वतता - Sketchnote by @nitya

२०३० शाश्वत विकासासाठी अजेंडा - २०१५ मध्ये सर्व संयुक्त राष्ट्र सदस्यांनी स्वीकारलेला - १७ उद्दिष्टे ओळखतो, ज्यामध्ये ग्रहाचे संरक्षण हे उद्दिष्ट आहे, ज्यामध्ये हवामान बदलाचा परिणाम आणि पर्यावरणीय हानी यांचा समावेश आहे. Microsoft Sustainability उपक्रम या उद्दिष्टांचे समर्थन करतो, तंत्रज्ञानाच्या उपायांचा वापर करून अधिक शाश्वत भविष्य तयार करण्याच्या मार्गांचा शोध घेतो, ज्यामध्ये ४ उद्दिष्टांवर लक्ष केंद्रित केले आहे - २०३० पर्यंत कार्बन नकारात्मक, पाण्याचे सकारात्मक, शून्य कचरा आणि जैवविविधता.

या आव्हानांना स्केलेबल आणि वेळेवर हाताळण्यासाठी क्लाउड-स्केल विचार आणि मोठ्या प्रमाणातील डेटा आवश्यक आहे. Planetary Computer उपक्रम डेटा सायंटिस्ट्स आणि विकसकांना या प्रयत्नात मदत करण्यासाठी ४ घटक प्रदान करतो:

  • डेटा कॅटलॉग - पृथ्वी प्रणाली डेटाचे पेटाबाइट्स (मोफत आणि Azure-होस्ट केलेले).

  • Planetary API - वापरकर्त्यांना जागा आणि वेळेनुसार संबंधित डेटा शोधण्यात मदत करण्यासाठी.

  • Hub - वैज्ञानिकांसाठी मोठ्या प्रमाणातील भू-स्थानिक डेटासेट्स प्रक्रिया करण्यासाठी व्यवस्थापित प्लॅनेटरी कॉम्प्युटर प्रकल्प सध्या प्रीव्ह्यूमध्ये आहे (सप्टेंबर 2021 पर्यंत) - डेटा सायन्सचा वापर करून शाश्वततेसाठी उपाय शोधण्यासाठी कसे सुरुवात करायची ते येथे दिले आहे.

  • प्रवेशासाठी विनंती करा आणि अन्वेषण सुरू करा तसेच सहकाऱ्यांशी संपर्क साधा.

  • डॉक्युमेंटेशन एक्सप्लोर करा जेणेकरून समर्थित डेटासेट्स आणि API समजून घेता येतील.

  • Ecosystem Monitoring सारख्या अनुप्रयोगांचा अभ्यास करा, जे अनुप्रयोग कल्पनांसाठी प्रेरणा देऊ शकतात.

डेटा व्हिज्युअलायझेशनचा वापर करून हवामान बदल आणि जंगलतोड यांसारख्या क्षेत्रांमध्ये अंतर्दृष्टी कशी उघड करता येईल किंवा ती अधिक प्रभावीपणे कशी पोहोचवता येईल याचा विचार करा. किंवा अशा अंतर्दृष्टींचा वापर करून नवीन वापरकर्ता अनुभव तयार करण्याचा विचार करा, जे शाश्वत जीवनासाठी वर्तनात्मक बदलांना प्रेरित करतील.

डेटा सायन्स + विद्यार्थी

आम्ही उद्योग आणि संशोधनातील प्रत्यक्ष अनुप्रयोगांबद्दल चर्चा केली आहे आणि डिजिटल ह्युमॅनिटीज आणि शाश्वततेतील डेटा सायन्स अनुप्रयोगांचे उदाहरण पाहिले आहे. तर, डेटा सायन्समध्ये नवशिक्या म्हणून कौशल्ये कशी विकसित करायची आणि आपले ज्ञान कसे सामायिक करायचे?

येथे काही डेटा सायन्स विद्यार्थी प्रकल्पांची उदाहरणे दिली आहेत, जी तुम्हाला प्रेरणा देतील.

🚀 आव्हान

डेटा सायन्स प्रकल्पांसाठी अशा लेखांचा शोध घ्या जे नवशिक्यांसाठी सोपे आहेत - जसे की हे 50 विषय क्षेत्र किंवा हे 21 प्रकल्प कल्पना किंवा सोर्स कोडसह हे 16 प्रकल्प जे तुम्ही समजून घेऊन पुन्हा तयार करू शकता. आणि तुमच्या शिकण्याच्या प्रवासाबद्दल ब्लॉग लिहायला विसरू नका आणि तुमच्या अंतर्दृष्टी आमच्यासोबत शेअर करा.

व्याख्यानानंतरचा क्विझ

व्याख्यानानंतरचा क्विझ

पुनरावलोकन आणि स्व-अभ्यास

अधिक उपयोग प्रकरणे शोधायची आहेत? येथे काही संबंधित लेख आहेत:

असाइनमेंट

प्लॅनेटरी कॉम्प्युटर डेटासेट एक्सप्लोर करा


अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात घ्या की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील मूळ दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून उद्भवणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.