22 KiB

Raw Permalink Blame History

डेटासह काम करणे: रिलेशनल डेटाबेस


डेटासह काम करणे: रिलेशनल डेटाबेस - Sketchnote by @nitya

संभावना आहे की तुम्ही पूर्वी माहिती साठवण्यासाठी स्प्रेडशीट वापरले असेल. तुमच्याकडे रकाने आणि स्तंभांचा संच असेल, जिथे रकाने माहिती (किंवा डेटा) असते आणि स्तंभ माहितीचे वर्णन करतात (कधीकधी याला मेटाडेटा म्हणतात). रिलेशनल डेटाबेस हा टेबल्समधील रकाने आणि स्तंभांच्या या मुख्य तत्त्वावर आधारित असतो, ज्यामुळे तुम्हाला माहिती अनेक टेबल्समध्ये पसरवता येते. यामुळे तुम्हाला अधिक जटिल डेटासह काम करता येते, पुनरावृत्ती टाळता येते आणि डेटाचा शोध घेण्याच्या पद्धतींमध्ये लवचिकता मिळते. चला रिलेशनल डेटाबेसच्या संकल्पना समजून घेऊया.

पूर्व-व्याख्यान क्विझ

सर्व काही टेबल्सपासून सुरू होते

रिलेशनल डेटाबेसच्या केंद्रस्थानी टेबल्स असतात. स्प्रेडशीटप्रमाणेच, टेबल म्हणजे स्तंभ आणि रकान्यांचा संग्रह असतो. रकानेमध्ये आपण ज्या डेटासह काम करू इच्छितो ती माहिती असते, जसे की शहराचे नाव किंवा पावसाचे प्रमाण. स्तंभ साठवलेल्या डेटाचे वर्णन करतात.

चला शहरांबद्दल माहिती साठवण्यासाठी टेबल तयार करून आपला अभ्यास सुरू करूया. आपण त्यांच्या नावाने आणि देशाने सुरुवात करू शकतो. तुम्ही हे टेबलमध्ये खालीलप्रमाणे साठवू शकता:

शहर	देश
टोकियो	जपान
अटलांटा	युनायटेड स्टेट्स
ऑकलंड	न्यूझीलंड

लक्षात घ्या की शहर, देश आणि लोकसंख्या या स्तंभांची नावे साठवलेल्या डेटाचे वर्णन करतात, आणि प्रत्येक रकान्यात एका शहराची माहिती आहे.

एका टेबलच्या दृष्टिकोनातील मर्यादा

वरील टेबल तुम्हाला परिचित वाटत असेल. चला आपल्या डेटाबेसमध्ये वार्षिक पावसाची (मिलीमीटरमध्ये) अतिरिक्त माहिती जोडूया. आपण 2018, 2019 आणि 2020 या वर्षांवर लक्ष केंद्रित करू. जर आपण टोकियोसाठी ही माहिती जोडली, तर ती काहीशी अशी दिसेल:

शहर	देश	वर्ष	प्रमाण
टोकियो	जपान	2020	1690
टोकियो	जपान	2019	1874
टोकियो	जपान	2018	1445

तुम्हाला आपल्या टेबलमध्ये काय दिसते? तुम्हाला कदाचित लक्षात येईल की आपण शहराचे नाव आणि देश पुन्हा पुन्हा डुप्लिकेट करत आहोत. यामुळे बरीच स्टोरेज लागेल आणि एकाच गोष्टीच्या अनेक प्रती ठेवणे अनावश्यक आहे. शेवटी, टोकियोसाठी आपल्याला फक्त एकच नाव हवे आहे.

ठीक आहे, काहीतरी वेगळे करून पाहूया. प्रत्येक वर्षासाठी नवीन स्तंभ जोडूया:

शहर	देश	2018	2019	2020
टोकियो	जपान	1445	1874	1690
अटलांटा	युनायटेड स्टेट्स	1779	1111	1683
ऑकलंड	न्यूझीलंड	1386	942	1176

यामुळे रकान्यांची पुनरावृत्ती टळते, परंतु यामुळे इतर काही अडचणी निर्माण होतात. प्रत्येक वेळी नवीन वर्ष आल्यावर आपल्याला टेबलची रचना बदलावी लागेल. याशिवाय, आपला डेटा वाढल्यावर वर्षे स्तंभांमध्ये असल्याने मूल्ये शोधणे आणि गणना करणे कठीण होईल.

म्हणूनच आपल्याला एकापेक्षा जास्त टेबल्स आणि नातेसंबंधांची गरज आहे. आपला डेटा वेगळा करून आपण पुनरावृत्ती टाळू शकतो आणि डेटासह काम करण्याच्या पद्धतींमध्ये अधिक लवचिकता मिळवू शकतो.

नातेसंबंधांची संकल्पना

चला आपल्या डेटाकडे परत जाऊया आणि ते कसे विभाजित करायचे ते ठरवूया. आपल्याला माहित आहे की आपल्याला शहरांची नावे आणि देश साठवायचे आहेत, त्यामुळे हे एका टेबलमध्ये चांगले काम करेल.

शहर	देश
टोकियो	जपान
अटलांटा	युनायटेड स्टेट्स
ऑकलंड	न्यूझीलंड

पण पुढील टेबल तयार करण्यापूर्वी, आपल्याला प्रत्येक शहराचा संदर्भ कसा द्यायचा ते ठरवावे लागेल. आपल्याला ओळखण्यासाठी काहीतरी, आयडी किंवा (तांत्रिक डेटाबेस संज्ञेत) प्राथमिक कीची आवश्यकता आहे. प्राथमिक की म्हणजे टेबलमधील एका विशिष्ट रकान्याला ओळखण्यासाठी वापरलेले मूल्य. हे स्वतःच्या मूल्यावर आधारित असू शकते (उदाहरणार्थ, आपण शहराचे नाव वापरू शकतो), परंतु ते जवळजवळ नेहमीच एक संख्या किंवा इतर ओळखकर्ता असावा. आपण आयडी कधीही बदलू इच्छित नाही कारण त्यामुळे नातेसंबंध बिघडतील. बहुतेक प्रकरणांमध्ये प्राथमिक की किंवा आयडी ही स्वयंचलितपणे तयार केलेली संख्या असेल.

✅ प्राथमिक कीला अनेकदा PK असे संक्षेपित केले जाते

शहर

city_id	शहर	देश
1	टोकियो	जपान
2	अटलांटा	युनायटेड स्टेट्स
3	ऑकलंड	न्यूझीलंड

✅ तुम्हाला लक्षात येईल की या धड्यात आपण "आयडी" आणि "प्राथमिक की" या संज्ञा परस्परविनिमयाने वापरतो. येथे दिलेल्या संकल्पना DataFrames वर लागू होतात, ज्याचा तुम्ही नंतर अभ्यास कराल. DataFrames "प्राथमिक की" ही संज्ञा वापरत नाहीत, परंतु तुम्हाला दिसेल की ते जवळजवळ त्याच प्रकारे वागतात.

आपले शहरांचे टेबल तयार झाल्यावर, चला पावसाची माहिती साठवूया. शहराबद्दलची संपूर्ण माहिती डुप्लिकेट करण्याऐवजी, आपण आयडी वापरू शकतो. आपण तयार केलेल्या नवीन टेबलमध्ये आयडी स्तंभ देखील असावा याची खात्री करणे आवश्यक आहे, कारण सर्व टेबल्समध्ये आयडी किंवा प्राथमिक की असावी.

पाऊस

rainfall_id	city_id	वर्ष	प्रमाण
1	1	2018	1445
2	1	2019	1874
3	1	2020	1690
4	2	2018	1779
5	2	2019	1111
6	2	2020	1683
7	3	2018	1386
8	3	2019	942
9	3	2020	1176

लक्षात घ्या की city_id स्तंभ नव्याने तयार केलेल्या rainfall टेबलमध्ये आहे. या स्तंभात शहर टेबलमधील आयडींचा संदर्भ असलेली मूल्ये आहेत. तांत्रिक रिलेशनल डेटाच्या भाषेत, याला foreign key म्हणतात; हे दुसऱ्या टेबलमधील प्राथमिक की आहे. तुम्ही याला फक्त संदर्भ किंवा पॉइंटर म्हणून विचार करू शकता. city_id 1 टोकियोचा संदर्भ देते.

[!NOTE] Foreign key ला अनेकदा FK असे संक्षेपित केले जाते

डेटा मिळवणे

आपला डेटा दोन टेबल्समध्ये विभाजित केल्यावर, तुम्हाला कदाचित आश्चर्य वाटेल की आपण तो कसा मिळवतो. जर आपण MySQL, SQL Server किंवा Oracle सारखा रिलेशनल डेटाबेस वापरत असू, तर आपण Structured Query Language किंवा SQL नावाची भाषा वापरू शकतो. SQL (कधीकधी sequel असे उच्चारले जाते) ही रिलेशनल डेटाबेसमधील डेटा मिळवण्यासाठी आणि बदलण्यासाठी वापरली जाणारी मानक भाषा आहे.

डेटा मिळवण्यासाठी तुम्ही SELECT कमांड वापरता. त्याच्या मूळ स्वरूपात, तुम्ही select करू इच्छित असलेले स्तंभ from टेबलमध्ये सूचीबद्ध करता. जर तुम्हाला फक्त शहरांची नावे प्रदर्शित करायची असतील, तर तुम्ही खालीलप्रमाणे वापरू शकता:

SELECT city
FROM cities;

-- Output:
-- Tokyo
-- Atlanta
-- Auckland

SELECT म्हणजे तुम्ही स्तंभांची यादी करता, आणि FROM म्हणजे तुम्ही टेबलची यादी करता.

[NOTE] SQL सिंटॅक्स केस-इन्सेन्सिटिव्ह आहे, म्हणजे select आणि SELECT याचा अर्थ समान आहे. तथापि, तुम्ही वापरत असलेल्या डेटाबेसच्या प्रकारावर अवलंबून स्तंभ आणि टेबल्स केस सेंसिटिव्ह असू शकतात. परिणामी, प्रोग्रामिंगमध्ये सर्वकाही केस सेंसिटिव्ह असल्यासारखे वागवणे ही सर्वोत्तम पद्धत आहे. SQL क्वेरी लिहिताना कीवर्ड्स सर्व अपर-केस अक्षरांमध्ये लिहिण्याचा प्रघात आहे.

वरील क्वेरी सर्व शहरांचे प्रदर्शन करेल. कल्पना करा की आपल्याला फक्त न्यूझीलंडमधील शहरांचे प्रदर्शन करायचे आहे. आपल्याला काहीतरी फिल्टर करण्याची गरज आहे. यासाठी SQL कीवर्ड WHERE आहे, म्हणजे "जिथे काहीतरी खरे आहे".

SELECT city
FROM cities
WHERE country = 'New Zealand';

-- Output:
-- Auckland

डेटा जोडणे

आत्तापर्यंत आपण एका टेबलमधून डेटा मिळवला आहे. आता आपल्याला शहर आणि पाऊस या दोन्ही टेबल्समधील डेटा एकत्र आणायचा आहे. हे त्यांना जोडून केले जाते. तुम्ही मूलत: दोन टेबल्समध्ये सीम तयार कराल आणि प्रत्येक टेबलमधील एका स्तंभातील मूल्ये जुळवाल.

आपल्या उदाहरणात, आपण rainfall मधील city_id स्तंभ cities मधील city_id स्तंभाशी जुळवू. यामुळे पावसाचे मूल्य त्याच्या संबंधित शहराशी जुळेल. आपण करणार असलेला जोड inner join म्हणतो, म्हणजे जर कोणत्याही रकान्यांचे दुसऱ्या टेबलमधील कोणत्याही गोष्टीशी जुळत नसेल, तर ते प्रदर्शित होणार नाही. आपल्या प्रकरणात प्रत्येक शहराला पाऊस आहे, त्यामुळे सर्व काही प्रदर्शित होईल.

चला 2019 साठी सर्व शहरांचा पाऊस मिळवूया.

आपण हे टप्प्याटप्प्याने करू. पहिला टप्पा म्हणजे city_id स्तंभाद्वारे डेटा जोडणे.

SELECT cities.city
    rainfall.amount
FROM cities
    INNER JOIN rainfall ON cities.city_id = rainfall.city_id

आता आपण हवे असलेले दोन स्तंभ हायलाइट केले आहेत, आणि city_id द्वारे टेबल्स जोडायचे आहेत हे नमूद केले आहे. आता आपण WHERE स्टेटमेंट जोडून फक्त 2019 वर्ष फिल्टर करू शकतो.

SELECT cities.city
    rainfall.amount
FROM cities
    INNER JOIN rainfall ON cities.city_id = rainfall.city_id
WHERE rainfall.year = 2019

-- Output

-- city     | amount
-- -------- | ------
-- Tokyo    | 1874
-- Atlanta  | 1111
-- Auckland |  942

सारांश

रिलेशनल डेटाबेस ही माहिती अनेक टेबल्समध्ये विभागण्यावर केंद्रित असते, जी नंतर प्रदर्शन आणि विश्लेषणासाठी पुन्हा एकत्र आणली जाते. यामुळे गणना करण्यासाठी आणि अन्यथा डेटा हाताळण्यासाठी उच्च स्तराची लवचिकता मिळते. तुम्ही रिलेशनल डेटाबेसच्या मुख्य संकल्पना पाहिल्या आहेत आणि दोन टेबल्समधील जोड कसा करायचा हे शिकले आहे.

🚀 आव्हान

इंटरनेटवर अनेक रिलेशनल डेटाबेस उपलब्ध आहेत. तुम्ही वरील कौशल्यांचा वापर करून डेटा एक्सप्लोर करू शकता.

व्याख्यानानंतरचा क्विझ

पुनरावलोकन आणि स्व-अभ्यास

SQL आणि रिलेशनल डेटाबेस संकल्पनांचा अभ्यास सुरू ठेवण्यासाठी Microsoft Learn वर अनेक संसाधने उपलब्ध आहेत.

रिलेशनल डेटाच्या संकल्पना वर्णन करा
Transact-SQL सह क्वेरी करणे सुरू करा (Transact-SQL ही SQL ची आवृत्ती आहे)
Microsoft Learn वरील SQL सामग्री

असाइनमेंट

असाइनमेंट शीर्षक

अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator वापरून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी, कृपया लक्षात ठेवा की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी, व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.

22 KiB Raw Permalink Blame History

डेटासह काम करणे: रिलेशनल डेटाबेस

पूर्व-व्याख्यान क्विझ

सर्व काही टेबल्सपासून सुरू होते

एका टेबलच्या दृष्टिकोनातील मर्यादा

नातेसंबंधांची संकल्पना

शहर

पाऊस

डेटा मिळवणे

डेटा जोडणे

सारांश

🚀 आव्हान

व्याख्यानानंतरचा क्विझ

व्याख्यानानंतरचा क्विझ

पुनरावलोकन आणि स्व-अभ्यास

असाइनमेंट

22 KiB

Raw Permalink Blame History