|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| README.md | 2 weeks ago | |
| assignment.md | 2 weeks ago | |
README.md
క్లౌడ్లో డేటా సైన్స్ పరిచయం
![]() |
|---|
| క్లౌడ్లో డేటా సైన్స్: పరిచయం - Sketchnote by @nitya |
ఈ పాఠంలో, మీరు క్లౌడ్ యొక్క ప్రాథమిక సూత్రాలను నేర్చుకుంటారు, ఆపై మీ డేటా సైన్స్ ప్రాజెక్టులను నడపడానికి క్లౌడ్ సేవలను ఉపయోగించడం మీకు ఎందుకు ఆసక్తికరంగా ఉండవచ్చో చూడగలుగుతారు మరియు క్లౌడ్లో నడిచే కొన్ని డేటా సైన్స్ ప్రాజెక్టుల ఉదాహరణలను పరిశీలిస్తాము.
పాఠం ముందు క్విజ్
క్లౌడ్ అంటే ఏమిటి?
క్లౌడ్, లేదా క్లౌడ్ కంప్యూటింగ్, ఇంటర్నెట్ ద్వారా హోస్ట్ చేయబడిన ఇన్ఫ్రాస్ట్రక్చర్పై పేమెంట్-ఆస్-యూ-గో (pay-as-you-go) కంప్యూటింగ్ సేవల విస్తృత శ్రేణిని అందించడం. సేవలలో నిల్వ, డేటాబేసులు, నెట్వర్కింగ్, సాఫ్ట్వేర్, విశ్లేషణలు మరియు తెలివైన సేవలు వంటి పరిష్కారాలు ఉంటాయి.
మనం సాధారణంగా పబ్లిక్, ప్రైవేట్ మరియు హైబ్రిడ్ క్లౌడ్లను క్రింది విధంగా వేరుచేస్తాము:
- పబ్లిక్ క్లౌడ్: పబ్లిక్ క్లౌడ్ అనేది మూడవ పక్ష క్లౌడ్ సేవా ప్రదాత చేత యాజమాన్యం మరియు నిర్వహణ చేయబడుతుంది, ఇది తన కంప్యూటింగ్ వనరులను ఇంటర్నెట్ ద్వారా ప్రజలకు అందిస్తుంది.
- ప్రైవేట్ క్లౌడ్: ఒకే వ్యాపారం లేదా సంస్థ ప్రత్యేకంగా ఉపయోగించే క్లౌడ్ కంప్యూటింగ్ వనరులను సూచిస్తుంది, సేవలు మరియు ఇన్ఫ్రాస్ట్రక్చర్ ప్రైవేట్ నెట్వర్క్లో నిర్వహించబడతాయి.
- హైబ్రిడ్ క్లౌడ్: హైబ్రిడ్ క్లౌడ్ అనేది పబ్లిక్ మరియు ప్రైవేట్ క్లౌడ్లను కలిపిన వ్యవస్థ. వినియోగదారులు ఆన్-ప్రెమైసెస్ డేటాసెంటర్ను ఎంచుకుంటారు, అదే సమయంలో ఒకటి లేదా ఎక్కువ పబ్లిక్ క్లౌడ్లపై డేటా మరియు అప్లికేషన్లను నడపడానికి అనుమతిస్తారు.
అధిక భాగం క్లౌడ్ కంప్యూటింగ్ సేవలు మూడు వర్గాలలో వస్తాయి: ఇన్ఫ్రాస్ట్రక్చర్ యాజమాన్యంగా సేవ (IaaS), ప్లాట్ఫారమ్ యాజమాన్యంగా సేవ (PaaS) మరియు సాఫ్ట్వేర్ యాజమాన్యంగా సేవ (SaaS).
- ఇన్ఫ్రాస్ట్రక్చర్ యాజమాన్యంగా సేవ (IaaS): వినియోగదారులు సర్వర్లు మరియు వర్చువల్ మెషీన్లు (VMs), నిల్వ, నెట్వర్కులు, ఆపరేటింగ్ సిస్టమ్స్ వంటి IT ఇన్ఫ్రాస్ట్రక్చర్ను అద్దెకు తీసుకుంటారు
- ప్లాట్ఫారమ్ యాజమాన్యంగా సేవ (PaaS): వినియోగదారులు సాఫ్ట్వేర్ అప్లికేషన్లను అభివృద్ధి, పరీక్ష, డెలివరీ మరియు నిర్వహణ కోసం ఒక వాతావరణాన్ని అద్దెకు తీసుకుంటారు. అభివృద్ధికి అవసరమైన సర్వర్లు, నిల్వ, నెట్వర్క్ మరియు డేటాబేసుల మౌలిక సదుపాయాలను ఏర్పాటు చేయడం లేదా నిర్వహించడం గురించి వినియోగదారులు ఆందోళన చెందాల్సిన అవసరం లేదు.
- సాఫ్ట్వేర్ యాజమాన్యంగా సేవ (SaaS): వినియోగదారులు ఇంటర్నెట్ ద్వారా, డిమాండ్పై మరియు సాధారణంగా సబ్స్క్రిప్షన్ ఆధారంగా సాఫ్ట్వేర్ అప్లికేషన్లకు ప్రాప్తి పొందుతారు. సాఫ్ట్వేర్ అప్లికేషన్, మౌలిక సదుపాయాలు లేదా నిర్వహణ, ఉదాహరణకు సాఫ్ట్వేర్ అప్గ్రేడ్లు మరియు భద్రతా ప్యాచింగ్ వంటి వాటిని హోస్ట్ చేయడం మరియు నిర్వహించడం గురించి వినియోగదారులు ఆందోళన చెందాల్సిన అవసరం లేదు.
అత్యంత పెద్ద క్లౌడ్ ప్రొవైడర్లు Amazon Web Services, Google Cloud Platform మరియు Microsoft Azure.
డేటా సైన్స్ కోసం క్లౌడ్ ఎందుకు ఎంచుకోవాలి?
డెవలపర్లు మరియు IT నిపుణులు అనేక కారణాల వల్ల క్లౌడ్తో పని చేయాలని ఎంచుకుంటారు, వాటిలో ముఖ్యమైనవి:
- ఆవిష్కరణ: మీరు మీ అప్లికేషన్లలో నేరుగా క్లౌడ్ ప్రొవైడర్లు సృష్టించిన ఆవిష్కరణాత్మక సేవలను సమ్మిళితం చేయడం ద్వారా మీ అప్లికేషన్లకు శక్తిని అందించవచ్చు.
- అనుకూలత: మీరు అవసరమైన సేవలకు మాత్రమే చెల్లిస్తారు మరియు విస్తృత శ్రేణి సేవల నుండి ఎంచుకోవచ్చు. మీరు సాధారణంగా ఉపయోగించినంత మాత్రాన చెల్లిస్తారు మరియు మీ అభివృద్ధి చెందుతున్న అవసరాలకు అనుగుణంగా మీ సేవలను సర్దుబాటు చేసుకోవచ్చు.
- బడ్జెట్: హార్డ్వేర్ మరియు సాఫ్ట్వేర్ కొనుగోలు చేయడానికి ప్రారంభ పెట్టుబడులు పెట్టాల్సిన అవసరం లేదు, ఆన్-సైట్ డేటాసెంటర్లను ఏర్పాటు చేసి నడపాల్సిన అవసరం లేదు మరియు మీరు ఉపయోగించినదానికి మాత్రమే చెల్లించవచ్చు.
- స్కేలబిలిటీ: మీ వనరులు మీ ప్రాజెక్ట్ అవసరాలకు అనుగుణంగా పెరుగుతాయి లేదా తగ్గుతాయి, అంటే మీ అప్లికేషన్లు ఎక్కువ లేదా తక్కువ కంప్యూటింగ్ శక్తి, నిల్వ మరియు బ్యాండ్విడ్త్ను ఉపయోగించవచ్చు, ఏ సమయంలోనైనా బాహ్య అంశాలకు అనుగుణంగా సర్దుబాటు చేసుకోవచ్చు.
- ఉత్పాదకత: డేటాసెంటర్ల నిర్వహణ వంటి పనులపై సమయం ఖర్చు చేయకుండా మీ వ్యాపారంపై దృష్టి పెట్టవచ్చు.
- నమ్మకదరితనం: క్లౌడ్ కంప్యూటింగ్ మీ డేటాను నిరంతరం బ్యాకప్ చేయడానికి అనేక మార్గాలను అందిస్తుంది మరియు మీరు విపత్తు పునరుద్ధరణ ప్రణాళికలను ఏర్పాటు చేయవచ్చు, ఇది సంక్షోభ సమయంలో కూడా మీ వ్యాపారం మరియు సేవలను కొనసాగించడానికి సహాయపడుతుంది.
- భద్రత: మీరు మీ ప్రాజెక్ట్ భద్రతను బలోపేతం చేసే విధానాలు, సాంకేతికతలు మరియు నియంత్రణల నుండి లాభం పొందవచ్చు.
ఇవి క్లౌడ్ సేవలను ఉపయోగించడానికి ప్రజలు ఎంచుకునే సాధారణ కారణాలలో కొన్ని. ఇప్పుడు క్లౌడ్ అంటే ఏమిటి మరియు దాని ప్రధాన లాభాలు ఏమిటి అనే విషయాలను బాగా అర్థం చేసుకున్న తర్వాత, డేటా శాస్త్రవేత్తలు మరియు డేటాతో పని చేసే డెవలపర్లు చేసే పనులపై మరింత స్పష్టంగా చూద్దాం, మరియు క్లౌడ్ వారు ఎదుర్కొనే అనేక సవాళ్లలో ఎలా సహాయపడగలదో చూద్దాం:
- పెద్ద మొత్తంలో డేటాను నిల్వ చేయడం: పెద్ద సర్వర్లను కొనుగోలు చేయడం, నిర్వహించడం మరియు రక్షించడం బదులు, మీరు Azure Cosmos DB, Azure SQL Database మరియు Azure Data Lake Storage వంటి పరిష్కారాలతో మీ డేటాను నేరుగా క్లౌడ్లో నిల్వ చేయవచ్చు.
- డేటా ఇంటిగ్రేషన్ నిర్వహించడం: డేటా ఇంటిగ్రేషన్ డేటా సైన్స్లో ఒక ముఖ్యమైన భాగం, ఇది డేటా సేకరణ నుండి చర్యలు తీసుకోవడం వరకు మార్పును అనుమతిస్తుంది. క్లౌడ్లో అందించే డేటా ఇంటిగ్రేషన్ సేవలతో, మీరు వివిధ మూలాల నుండి డేటాను సేకరించి, మార్చి, ఒకే డేటా వేర్హౌస్లో సమ్మిళితం చేయవచ్చు, Data Factory తో.
- డేటాను ప్రాసెస్ చేయడం: భారీ మొత్తంలో డేటాను ప్రాసెస్ చేయడానికి చాలా కంప్యూటింగ్ శక్తి అవసరం, అందుకు సరిపడా శక్తివంతమైన యంత్రాలు అందుబాటులో లేకపోవచ్చు, అందుకే చాలా మంది తమ పరిష్కారాలను నడపడానికి మరియు అమలు చేయడానికి నేరుగా క్లౌడ్ యొక్క భారీ కంప్యూటింగ్ శక్తిని ఉపయోగించుకోవడం ఎంచుకుంటారు.
- డేటా విశ్లేషణ సేవలను ఉపయోగించడం: Azure Synapse Analytics, Azure Stream Analytics మరియు Azure Databricks వంటి క్లౌడ్ సేవలు మీ డేటాను కార్యాచరణాత్మక అవగాహనలుగా మార్చడంలో సహాయపడతాయి.
- మెషీన్ లెర్నింగ్ మరియు డేటా ఇంటెలిజెన్స్ సేవలను ఉపయోగించడం: మొదలుపెట్టడం బదులు, మీరు క్లౌడ్ ప్రొవైడర్ అందించే మెషీన్ లెర్నింగ్ అల్గోరిథమ్స్ను ఉపయోగించవచ్చు, AzureML వంటి సేవలతో. మీరు స్పీచ్-టు-టెక్స్ట్, టెక్స్ట్ టు స్పీచ్, కంప్యూటర్ విజన్ మరియు మరిన్ని వంటి కాగ్నిటివ్ సేవలను కూడా ఉపయోగించవచ్చు.
క్లౌడ్లో డేటా సైన్స్ ఉదాహరణలు
ఇది మరింత స్పష్టంగా చేసుకోవడానికి కొన్ని సన్నివేశాలను చూద్దాం.
రియల్-టైమ్ సోషల్ మీడియా భావోద్వేగ విశ్లేషణ
మనం మెషీన్ లెర్నింగ్తో ప్రారంభించే వారు సాధారణంగా అధ్యయనం చేసే ఒక సన్నివేశంతో ప్రారంభిస్తాము: రియల్ టైమ్లో సోషల్ మీడియా భావోద్వేగ విశ్లేషణ.
మీరు ఒక వార్తా మీడియా వెబ్సైట్ నడుపుతున్నారని అనుకుందాం మరియు మీ పాఠకులు ఆసక్తి చూపవచ్చని కంటెంట్ను అర్థం చేసుకోవడానికి ప్రత్యక్ష డేటాను ఉపయోగించాలనుకుంటున్నారు.
దానికి సంబంధించిన విషయాలను తెలుసుకోవడానికి, మీరు ట్విట్టర్ ప్రచురణల నుండి డేటా యొక్క రియల్-టైమ్ భావోద్వేగ విశ్లేషణను నిర్వహించే ప్రోగ్రామ్ను నిర్మించవచ్చు, ఇది మీ పాఠకులకు సంబంధించి అంశాలపై ఉంటుంది.
మీరు చూడబోయే ముఖ్య సూచికలు నిర్దిష్ట అంశాలపై (హ్యాష్ట్యాగ్లు) ట్వీట్ల పరిమాణం మరియు భావోద్వేగం, ఇది నిర్దిష్ట అంశాల చుట్టూ భావోద్వేగ విశ్లేషణ నిర్వహించే విశ్లేషణా సాధనాలతో స్థాపించబడుతుంది.
ఈ ప్రాజెక్టును సృష్టించడానికి అవసరమైన దశలు:
- ట్విట్టర్ నుండి డేటాను సేకరించడానికి స్ట్రీమింగ్ ఇన్పుట్ కోసం ఈవెంట్ హబ్ సృష్టించండి
- ట్విట్టర్ స్ట్రీమింగ్ APIలను పిలవడానికి ట్విట్టర్ క్లయింట్ అప్లికేషన్ను కాన్ఫిగర్ చేసి ప్రారంభించండి
- స్ట్రీమ్ అనలిటిక్స్ జాబ్ సృష్టించండి
- జాబ్ ఇన్పుట్ మరియు క్వెరీని నిర్దేశించండి
- అవుట్పుట్ సింక్ సృష్టించి జాబ్ అవుట్పుట్ను నిర్దేశించండి
- జాబ్ను ప్రారంభించండి
పూర్తి ప్రక్రియను చూడడానికి, డాక్యుమెంటేషన్ను చూడండి.
శాస్త్రీయ పత్రాల విశ్లేషణ
మరొక ఉదాహరణగా, ఈ పాఠ్యాంశ రచయితలలో ఒకరు అయిన Dmitry Soshnikov సృష్టించిన ప్రాజెక్టును తీసుకుందాం.
Dmitry COVID పత్రాలను విశ్లేషించే ఒక సాధనాన్ని సృష్టించాడు. ఈ ప్రాజెక్టును సమీక్షించడం ద్వారా, మీరు శాస్త్రీయ పత్రాల నుండి జ్ఞానాన్ని తీసుకురావడం, అవగాహనలను పొందడం మరియు పరిశోధకులు పెద్ద పత్రాల సేకరణలలో సమర్థవంతంగా నావిగేట్ చేయడంలో సహాయపడే సాధనాన్ని ఎలా సృష్టించవచ్చో చూడగలుగుతారు.
ఇది చేయడానికి ఉపయోగించిన వివిధ దశలు:
- Text Analytics for Healthతో సమాచారం తీసుకోవడం మరియు ప్రీ-ప్రాసెసింగ్
- ప్రాసెసింగ్ను సమాంతరంగా చేయడానికి Azure ML ఉపయోగించడం
- Cosmos DBతో సమాచారం నిల్వ చేయడం మరియు క్వెరీ చేయడం
- Power BI ఉపయోగించి డేటా అన్వేషణ మరియు విజువలైజేషన్ కోసం ఇంటరాక్టివ్ డాష్బోర్డ్ సృష్టించడం
పూర్తి ప్రక్రియను చూడడానికి, Dmitry బ్లాగ్ను సందర్శించండి.
మీరు చూడగలిగినట్లుగా, డేటా సైన్స్ నిర్వహించడానికి క్లౌడ్ సేవలను అనేక విధాలుగా ఉపయోగించవచ్చు.
ఫుట్నోట్
మూలాలు:
- https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
- https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
- https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
పాఠం తర్వాత క్విజ్
పాఠం తర్వాత క్విజ్
అసైన్మెంట్
అస్పష్టత:
ఈ పత్రాన్ని AI అనువాద సేవ Co-op Translator ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.
