You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
localizeflow[bot] f64682928a
chore(i18n): sync translations with latest source changes (chunk 10/10, 34 files)
2 weeks ago
..
README.md chore(i18n): sync translations with latest source changes (chunk 10/10, 34 files) 2 weeks ago
assignment.md chore(i18n): sync translations with latest source changes (chunk 10/10, 34 files) 2 weeks ago

README.md

క్లౌడ్‌లో డేటా సైన్స్ పరిచయం

 Sketchnote by (@sketchthedocs)
క్లౌడ్‌లో డేటా సైన్స్: పరిచయం - Sketchnote by @nitya

ఈ పాఠంలో, మీరు క్లౌడ్ యొక్క ప్రాథమిక సూత్రాలను నేర్చుకుంటారు, ఆపై మీ డేటా సైన్స్ ప్రాజెక్టులను నడపడానికి క్లౌడ్ సేవలను ఉపయోగించడం మీకు ఎందుకు ఆసక్తికరంగా ఉండవచ్చో చూడగలుగుతారు మరియు క్లౌడ్‌లో నడిచే కొన్ని డేటా సైన్స్ ప్రాజెక్టుల ఉదాహరణలను పరిశీలిస్తాము.

పాఠం ముందు క్విజ్

క్లౌడ్ అంటే ఏమిటి?

క్లౌడ్, లేదా క్లౌడ్ కంప్యూటింగ్, ఇంటర్నెట్ ద్వారా హోస్ట్ చేయబడిన ఇన్‌ఫ్రాస్ట్రక్చర్‌పై పేమెంట్-ఆస్-యూ-గో (pay-as-you-go) కంప్యూటింగ్ సేవల విస్తృత శ్రేణిని అందించడం. సేవలలో నిల్వ, డేటాబేసులు, నెట్‌వర్కింగ్, సాఫ్ట్‌వేర్, విశ్లేషణలు మరియు తెలివైన సేవలు వంటి పరిష్కారాలు ఉంటాయి.

మనం సాధారణంగా పబ్లిక్, ప్రైవేట్ మరియు హైబ్రిడ్ క్లౌడ్‌లను క్రింది విధంగా వేరుచేస్తాము:

  • పబ్లిక్ క్లౌడ్: పబ్లిక్ క్లౌడ్ అనేది మూడవ పక్ష క్లౌడ్ సేవా ప్రదాత చేత యాజమాన్యం మరియు నిర్వహణ చేయబడుతుంది, ఇది తన కంప్యూటింగ్ వనరులను ఇంటర్నెట్ ద్వారా ప్రజలకు అందిస్తుంది.
  • ప్రైవేట్ క్లౌడ్: ఒకే వ్యాపారం లేదా సంస్థ ప్రత్యేకంగా ఉపయోగించే క్లౌడ్ కంప్యూటింగ్ వనరులను సూచిస్తుంది, సేవలు మరియు ఇన్‌ఫ్రాస్ట్రక్చర్ ప్రైవేట్ నెట్‌వర్క్‌లో నిర్వహించబడతాయి.
  • హైబ్రిడ్ క్లౌడ్: హైబ్రిడ్ క్లౌడ్ అనేది పబ్లిక్ మరియు ప్రైవేట్ క్లౌడ్‌లను కలిపిన వ్యవస్థ. వినియోగదారులు ఆన్-ప్రెమైసెస్ డేటాసెంటర్‌ను ఎంచుకుంటారు, అదే సమయంలో ఒకటి లేదా ఎక్కువ పబ్లిక్ క్లౌడ్‌లపై డేటా మరియు అప్లికేషన్లను నడపడానికి అనుమతిస్తారు.

అధిక భాగం క్లౌడ్ కంప్యూటింగ్ సేవలు మూడు వర్గాలలో వస్తాయి: ఇన్‌ఫ్రాస్ట్రక్చర్ యాజమాన్యంగా సేవ (IaaS), ప్లాట్‌ఫారమ్ యాజమాన్యంగా సేవ (PaaS) మరియు సాఫ్ట్‌వేర్ యాజమాన్యంగా సేవ (SaaS).

  • ఇన్‌ఫ్రాస్ట్రక్చర్ యాజమాన్యంగా సేవ (IaaS): వినియోగదారులు సర్వర్లు మరియు వర్చువల్ మెషీన్లు (VMs), నిల్వ, నెట్‌వర్కులు, ఆపరేటింగ్ సిస్టమ్స్ వంటి IT ఇన్‌ఫ్రాస్ట్రక్చర్‌ను అద్దెకు తీసుకుంటారు
  • ప్లాట్‌ఫారమ్ యాజమాన్యంగా సేవ (PaaS): వినియోగదారులు సాఫ్ట్‌వేర్ అప్లికేషన్లను అభివృద్ధి, పరీక్ష, డెలివరీ మరియు నిర్వహణ కోసం ఒక వాతావరణాన్ని అద్దెకు తీసుకుంటారు. అభివృద్ధికి అవసరమైన సర్వర్లు, నిల్వ, నెట్‌వర్క్ మరియు డేటాబేసుల మౌలిక సదుపాయాలను ఏర్పాటు చేయడం లేదా నిర్వహించడం గురించి వినియోగదారులు ఆందోళన చెందాల్సిన అవసరం లేదు.
  • సాఫ్ట్‌వేర్ యాజమాన్యంగా సేవ (SaaS): వినియోగదారులు ఇంటర్నెట్ ద్వారా, డిమాండ్‌పై మరియు సాధారణంగా సబ్‌స్క్రిప్షన్ ఆధారంగా సాఫ్ట్‌వేర్ అప్లికేషన్లకు ప్రాప్తి పొందుతారు. సాఫ్ట్‌వేర్ అప్లికేషన్, మౌలిక సదుపాయాలు లేదా నిర్వహణ, ఉదాహరణకు సాఫ్ట్‌వేర్ అప్‌గ్రేడ్‌లు మరియు భద్రతా ప్యాచింగ్ వంటి వాటిని హోస్ట్ చేయడం మరియు నిర్వహించడం గురించి వినియోగదారులు ఆందోళన చెందాల్సిన అవసరం లేదు.

అత్యంత పెద్ద క్లౌడ్ ప్రొవైడర్లు Amazon Web Services, Google Cloud Platform మరియు Microsoft Azure.

డేటా సైన్స్ కోసం క్లౌడ్ ఎందుకు ఎంచుకోవాలి?

డెవలపర్లు మరియు IT నిపుణులు అనేక కారణాల వల్ల క్లౌడ్‌తో పని చేయాలని ఎంచుకుంటారు, వాటిలో ముఖ్యమైనవి:

  • ఆవిష్కరణ: మీరు మీ అప్లికేషన్లలో నేరుగా క్లౌడ్ ప్రొవైడర్లు సృష్టించిన ఆవిష్కరణాత్మక సేవలను సమ్మిళితం చేయడం ద్వారా మీ అప్లికేషన్లకు శక్తిని అందించవచ్చు.
  • అనుకూలత: మీరు అవసరమైన సేవలకు మాత్రమే చెల్లిస్తారు మరియు విస్తృత శ్రేణి సేవల నుండి ఎంచుకోవచ్చు. మీరు సాధారణంగా ఉపయోగించినంత మాత్రాన చెల్లిస్తారు మరియు మీ అభివృద్ధి చెందుతున్న అవసరాలకు అనుగుణంగా మీ సేవలను సర్దుబాటు చేసుకోవచ్చు.
  • బడ్జెట్: హార్డ్‌వేర్ మరియు సాఫ్ట్‌వేర్ కొనుగోలు చేయడానికి ప్రారంభ పెట్టుబడులు పెట్టాల్సిన అవసరం లేదు, ఆన్-సైట్ డేటాసెంటర్లను ఏర్పాటు చేసి నడపాల్సిన అవసరం లేదు మరియు మీరు ఉపయోగించినదానికి మాత్రమే చెల్లించవచ్చు.
  • స్కేలబిలిటీ: మీ వనరులు మీ ప్రాజెక్ట్ అవసరాలకు అనుగుణంగా పెరుగుతాయి లేదా తగ్గుతాయి, అంటే మీ అప్లికేషన్లు ఎక్కువ లేదా తక్కువ కంప్యూటింగ్ శక్తి, నిల్వ మరియు బ్యాండ్‌విడ్త్‌ను ఉపయోగించవచ్చు, ఏ సమయంలోనైనా బాహ్య అంశాలకు అనుగుణంగా సర్దుబాటు చేసుకోవచ్చు.
  • ఉత్పాదకత: డేటాసెంటర్ల నిర్వహణ వంటి పనులపై సమయం ఖర్చు చేయకుండా మీ వ్యాపారంపై దృష్టి పెట్టవచ్చు.
  • నమ్మకదరితనం: క్లౌడ్ కంప్యూటింగ్ మీ డేటాను నిరంతరం బ్యాకప్ చేయడానికి అనేక మార్గాలను అందిస్తుంది మరియు మీరు విపత్తు పునరుద్ధరణ ప్రణాళికలను ఏర్పాటు చేయవచ్చు, ఇది సంక్షోభ సమయంలో కూడా మీ వ్యాపారం మరియు సేవలను కొనసాగించడానికి సహాయపడుతుంది.
  • భద్రత: మీరు మీ ప్రాజెక్ట్ భద్రతను బలోపేతం చేసే విధానాలు, సాంకేతికతలు మరియు నియంత్రణల నుండి లాభం పొందవచ్చు.

ఇవి క్లౌడ్ సేవలను ఉపయోగించడానికి ప్రజలు ఎంచుకునే సాధారణ కారణాలలో కొన్ని. ఇప్పుడు క్లౌడ్ అంటే ఏమిటి మరియు దాని ప్రధాన లాభాలు ఏమిటి అనే విషయాలను బాగా అర్థం చేసుకున్న తర్వాత, డేటా శాస్త్రవేత్తలు మరియు డేటాతో పని చేసే డెవలపర్లు చేసే పనులపై మరింత స్పష్టంగా చూద్దాం, మరియు క్లౌడ్ వారు ఎదుర్కొనే అనేక సవాళ్లలో ఎలా సహాయపడగలదో చూద్దాం:

  • పెద్ద మొత్తంలో డేటాను నిల్వ చేయడం: పెద్ద సర్వర్లను కొనుగోలు చేయడం, నిర్వహించడం మరియు రక్షించడం బదులు, మీరు Azure Cosmos DB, Azure SQL Database మరియు Azure Data Lake Storage వంటి పరిష్కారాలతో మీ డేటాను నేరుగా క్లౌడ్‌లో నిల్వ చేయవచ్చు.
  • డేటా ఇంటిగ్రేషన్ నిర్వహించడం: డేటా ఇంటిగ్రేషన్ డేటా సైన్స్‌లో ఒక ముఖ్యమైన భాగం, ఇది డేటా సేకరణ నుండి చర్యలు తీసుకోవడం వరకు మార్పును అనుమతిస్తుంది. క్లౌడ్‌లో అందించే డేటా ఇంటిగ్రేషన్ సేవలతో, మీరు వివిధ మూలాల నుండి డేటాను సేకరించి, మార్చి, ఒకే డేటా వేర్‌హౌస్‌లో సమ్మిళితం చేయవచ్చు, Data Factory తో.
  • డేటాను ప్రాసెస్ చేయడం: భారీ మొత్తంలో డేటాను ప్రాసెస్ చేయడానికి చాలా కంప్యూటింగ్ శక్తి అవసరం, అందుకు సరిపడా శక్తివంతమైన యంత్రాలు అందుబాటులో లేకపోవచ్చు, అందుకే చాలా మంది తమ పరిష్కారాలను నడపడానికి మరియు అమలు చేయడానికి నేరుగా క్లౌడ్ యొక్క భారీ కంప్యూటింగ్ శక్తిని ఉపయోగించుకోవడం ఎంచుకుంటారు.
  • డేటా విశ్లేషణ సేవలను ఉపయోగించడం: Azure Synapse Analytics, Azure Stream Analytics మరియు Azure Databricks వంటి క్లౌడ్ సేవలు మీ డేటాను కార్యాచరణాత్మక అవగాహనలుగా మార్చడంలో సహాయపడతాయి.
  • మెషీన్ లెర్నింగ్ మరియు డేటా ఇంటెలిజెన్స్ సేవలను ఉపయోగించడం: మొదలుపెట్టడం బదులు, మీరు క్లౌడ్ ప్రొవైడర్ అందించే మెషీన్ లెర్నింగ్ అల్గోరిథమ్స్‌ను ఉపయోగించవచ్చు, AzureML వంటి సేవలతో. మీరు స్పీచ్-టు-టెక్స్ట్, టెక్స్ట్ టు స్పీచ్, కంప్యూటర్ విజన్ మరియు మరిన్ని వంటి కాగ్నిటివ్ సేవలను కూడా ఉపయోగించవచ్చు.

క్లౌడ్‌లో డేటా సైన్స్ ఉదాహరణలు

ఇది మరింత స్పష్టంగా చేసుకోవడానికి కొన్ని సన్నివేశాలను చూద్దాం.

రియల్-టైమ్ సోషల్ మీడియా భావోద్వేగ విశ్లేషణ

మనం మెషీన్ లెర్నింగ్‌తో ప్రారంభించే వారు సాధారణంగా అధ్యయనం చేసే ఒక సన్నివేశంతో ప్రారంభిస్తాము: రియల్ టైమ్‌లో సోషల్ మీడియా భావోద్వేగ విశ్లేషణ.

మీరు ఒక వార్తా మీడియా వెబ్‌సైట్ నడుపుతున్నారని అనుకుందాం మరియు మీ పాఠకులు ఆసక్తి చూపవచ్చని కంటెంట్‌ను అర్థం చేసుకోవడానికి ప్రత్యక్ష డేటాను ఉపయోగించాలనుకుంటున్నారు.

దానికి సంబంధించిన విషయాలను తెలుసుకోవడానికి, మీరు ట్విట్టర్ ప్రచురణల నుండి డేటా యొక్క రియల్-టైమ్ భావోద్వేగ విశ్లేషణను నిర్వహించే ప్రోగ్రామ్‌ను నిర్మించవచ్చు, ఇది మీ పాఠకులకు సంబంధించి అంశాలపై ఉంటుంది.

మీరు చూడబోయే ముఖ్య సూచికలు నిర్దిష్ట అంశాలపై (హ్యాష్‌ట్యాగ్‌లు) ట్వీట్ల పరిమాణం మరియు భావోద్వేగం, ఇది నిర్దిష్ట అంశాల చుట్టూ భావోద్వేగ విశ్లేషణ నిర్వహించే విశ్లేషణా సాధనాలతో స్థాపించబడుతుంది.

ఈ ప్రాజెక్టును సృష్టించడానికి అవసరమైన దశలు:

  • ట్విట్టర్ నుండి డేటాను సేకరించడానికి స్ట్రీమింగ్ ఇన్‌పుట్ కోసం ఈవెంట్ హబ్ సృష్టించండి
  • ట్విట్టర్ స్ట్రీమింగ్ APIలను పిలవడానికి ట్విట్టర్ క్లయింట్ అప్లికేషన్‌ను కాన్ఫిగర్ చేసి ప్రారంభించండి
  • స్ట్రీమ్ అనలిటిక్స్ జాబ్ సృష్టించండి
  • జాబ్ ఇన్‌పుట్ మరియు క్వెరీని నిర్దేశించండి
  • అవుట్‌పుట్ సింక్ సృష్టించి జాబ్ అవుట్‌పుట్‌ను నిర్దేశించండి
  • జాబ్‌ను ప్రారంభించండి

పూర్తి ప్రక్రియను చూడడానికి, డాక్యుమెంటేషన్ను చూడండి.

శాస్త్రీయ పత్రాల విశ్లేషణ

మరొక ఉదాహరణగా, ఈ పాఠ్యాంశ రచయితలలో ఒకరు అయిన Dmitry Soshnikov సృష్టించిన ప్రాజెక్టును తీసుకుందాం.

Dmitry COVID పత్రాలను విశ్లేషించే ఒక సాధనాన్ని సృష్టించాడు. ఈ ప్రాజెక్టును సమీక్షించడం ద్వారా, మీరు శాస్త్రీయ పత్రాల నుండి జ్ఞానాన్ని తీసుకురావడం, అవగాహనలను పొందడం మరియు పరిశోధకులు పెద్ద పత్రాల సేకరణలలో సమర్థవంతంగా నావిగేట్ చేయడంలో సహాయపడే సాధనాన్ని ఎలా సృష్టించవచ్చో చూడగలుగుతారు.

ఇది చేయడానికి ఉపయోగించిన వివిధ దశలు:

  • Text Analytics for Healthతో సమాచారం తీసుకోవడం మరియు ప్రీ-ప్రాసెసింగ్
  • ప్రాసెసింగ్‌ను సమాంతరంగా చేయడానికి Azure ML ఉపయోగించడం
  • Cosmos DBతో సమాచారం నిల్వ చేయడం మరియు క్వెరీ చేయడం
  • Power BI ఉపయోగించి డేటా అన్వేషణ మరియు విజువలైజేషన్ కోసం ఇంటరాక్టివ్ డాష్‌బోర్డ్ సృష్టించడం

పూర్తి ప్రక్రియను చూడడానికి, Dmitry బ్లాగ్ను సందర్శించండి.

మీరు చూడగలిగినట్లుగా, డేటా సైన్స్ నిర్వహించడానికి క్లౌడ్ సేవలను అనేక విధాలుగా ఉపయోగించవచ్చు.

ఫుట్‌నోట్

మూలాలు:

పాఠం తర్వాత క్విజ్

పాఠం తర్వాత క్విజ్

అసైన్‌మెంట్

మార్కెట్ రీసెర్చ్


అస్పష్టత:
ఈ పత్రాన్ని AI అనువాద సేవ Co-op Translator ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారితీసే అర్థాలు కోసం మేము బాధ్యత వహించము.