You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/te/1-Introduction/01-defining-data-science
localizeflow[bot] 810a53be1d
chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes)
1 month ago
..
solution chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 1 month ago
README.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 1 month ago
assignment.md chore(i18n): sync translations with latest source changes (chunk 1/1, 213 changes) 1 month ago
notebook.ipynb chore(i18n): sync translations with latest source changes (chunk 9/10, 100 files) 2 months ago

README.md

డేటా సైన్స్ నిర్వచనం

 Sketchnote by (@sketchthedocs)
డేటా సైన్స్ నిర్వచనం - స్కెచ్ నోట్ @nitya ద్వారా

డేటా సైన్స్ నిర్వచనం వీడియో

పూర్వ-లెక్చర్ క్విజ్

డేటా అంటే ఏమిటి?

మన రోజువారీ జీవితంలో, మనం ఎప్పుడూ డేటాతో చుట్టబడి ఉంటాము. మీరు ఇప్పుడు చదువుతున్న వచనం డేటానే. మీ స్మార్ట్‌ఫోన్‌లో మీ స్నేహితుల ఫోన్ నంబర్ల జాబితా డేటా, అలాగే మీ గడియారంలో ప్రదర్శించబడుతున్న ప్రస్తుత సమయం కూడా డేటానే. మనుషులుగా, మనం సహజంగానే డేటాతో పనిచేస్తాము, మన దగ్గర ఉన్న డబ్బును లెక్కించడం లేదా స్నేహితులకు లేఖలు రాయడం ద్వారా.

కానీ, కంప్యూటర్లు సృష్టించబడిన తర్వాత డేటా చాలా ముఖ్యమైంది అయింది. కంప్యూటర్ల ప్రాథమిక పాత్ర గణనలను నిర్వహించడం, కానీ అవి ఆపరేట్ చేయడానికి డేటా అవసరం. కాబట్టి, మనం కంప్యూటర్లు డేటాను ఎలా నిల్వ చేస్తాయో, ప్రాసెస్ చేస్తాయో అర్థం చేసుకోవాలి.

ఇంటర్నెట్ ఉద్భవంతో, కంప్యూటర్ల పాత్ర డేటా నిర్వహణ పరికరాలుగా పెరిగింది. మీరు ఆలోచిస్తే, ఇప్పుడు మనం కంప్యూటర్లను గణనలకు కాకుండా డేటా ప్రాసెసింగ్ మరియు కమ్యూనికేషన్ కోసం ఎక్కువగా ఉపయోగిస్తున్నాము. మనం స్నేహితునికి ఇమెయిల్ రాస్తున్నప్పుడు లేదా ఇంటర్నెట్‌లో సమాచారాన్ని శోధిస్తున్నప్పుడు - మనం అసలు డేటాను సృష్టించడం, నిల్వ చేయడం, ప్రసారం చేయడం మరియు మార్చడం చేస్తున్నాము.

మీరు చివరిసారిగా కంప్యూటర్లను వాస్తవంగా ఏదైనా గణన చేయడానికి ఉపయోగించినప్పుడు గుర్తు చేసుకోగలరా?

డేటా సైన్స్ అంటే ఏమిటి?

వికీపీడియా ప్రకారం, డేటా సైన్స్ అనేది సంఘటిత మరియు అసంఘటిత డేటా నుండి జ్ఞానం మరియు అవగాహనలను పొందడానికి శాస్త్రీయ పద్ధతులను ఉపయోగించే శాస్త్రీయ రంగం, మరియు విస్తృత అనువర్తన రంగాలలో డేటా నుండి జ్ఞానం మరియు అమలు చేయదగిన అవగాహనలను వర్తింపజేసే రంగంగా నిర్వచించబడింది.

ఈ నిర్వచనం డేటా సైన్స్ యొక్క క్రింది ముఖ్యాంశాలను హైలైట్ చేస్తుంది:

  • డేటా సైన్స్ యొక్క ప్రధాన లక్ష్యం డేటా నుండి జ్ఞానం పొందడం, అంటే - డేటాను అర్థం చేసుకోవడం, కొన్ని దాగి ఉన్న సంబంధాలను కనుగొనడం మరియు ఒక మోడల్ నిర్మించడం.
  • డేటా సైన్స్ శాస్త్రీయ పద్ధతులను ఉపయోగిస్తుంది, ఉదాహరణకు సంభావ్యత మరియు గణాంకాలు. వాస్తవానికి, డేటా సైన్స్ అనే పదం మొదట ప్రవేశపెట్టినప్పుడు, కొంతమంది డేటా సైన్స్ గణాంకాలకి కొత్త ఫ్యాన్సీ పేరు మాత్రమే అని వాదించారు. ఇప్పుడు ఈ రంగం చాలా విస్తృతమైందని స్పష్టమైంది.
  • పొందిన జ్ఞానం కొన్ని అమలు చేయదగిన అవగాహనలను ఉత్పత్తి చేయడానికి ఉపయోగించాలి, అంటే మీరు వాస్తవ వ్యాపార పరిస్థితులకు వర్తింపజేయగల ప్రాక్టికల్ అవగాహన.
  • మనం సంఘటిత మరియు అసంఘటిత డేటా రెండింటిపై కూడా ఆపరేట్ చేయగలగాలి. కోర్సులో తరువాత డేటా రకాల గురించి మళ్ళీ చర్చిస్తాము.
  • అనువర్తన రంగం ఒక ముఖ్యమైన భావన, మరియు డేటా శాస్త్రవేత్తలు తరచుగా సమస్య రంగంలో కనీసం కొంత నైపుణ్యం కలిగి ఉండాలి, ఉదాహరణకు: ఫైనాన్స్, వైద్యం, మార్కెటింగ్ మొదలైనవి.

డేటా సైన్స్ యొక్క మరో ముఖ్యాంశం ఏమిటంటే, ఇది డేటాను కంప్యూటర్ల ద్వారా ఎలా సేకరించవచ్చో, నిల్వ చేయవచ్చో, ఆపరేట్ చేయవచ్చో అధ్యయనం చేస్తుంది. గణాంకాలు మనకు గణిత శాస్త్రపు ఆధారాలను ఇస్తే, డేటా సైన్స్ గణిత సూత్రాలను వాస్తవంగా డేటా నుండి అవగాహనలను పొందడానికి వర్తింపజేస్తుంది.

డేటా సైన్స్‌ను చూడటానికి ఒక మార్గం (జిమ్ గ్రేకి అప్పగించబడింది) ఇది శాస్త్రం యొక్క వేరే ఒక పారడైమ్‌గా పరిగణించవచ్చు:

  • ప్రయోగాత్మక (Empirical), ఇందులో మనం ఎక్కువగా పరిశీలనలు మరియు ప్రయోగాల ఫలితాలపై ఆధారపడతాము
  • సిద్ధాంతాత్మక (Theoretical), ఇక్కడ కొత్త భావనలు ఉన్న శాస్త్రీయ జ్ఞానంలో నుండి ఉద్భవిస్తాయి
  • గణనాత్మక (Computational), ఇక్కడ మనం కొన్ని గణనాత్మక ప్రయోగాల ఆధారంగా కొత్త సూత్రాలను కనుగొంటాము
  • డేటా-ఆధారిత (Data-Driven), డేటాలో సంబంధాలు మరియు నమూనాలను కనుగొనడంపై ఆధారపడి ఉంటుంది

ఇతర సంబంధిత రంగాలు

డేటా విస్తృతంగా ఉండటంతో, డేటా సైన్స్ కూడా విస్తృత రంగం, అనేక ఇతర శాస్త్రాలను స్పర్శిస్తుంది.

డేటాబేసులు
ముఖ్యమైన పరిగణన ఏమిటంటే డేటాను ఎలా నిల్వ చేయాలి, అంటే వేగంగా ప్రాసెస్ చేయడానికి ఎలా నిర్మించాలి. వివిధ రకాల డేటాబేసులు ఉన్నాయి, అవి సంఘటిత మరియు అసంఘటిత డేటాను నిల్వ చేస్తాయి, వాటిని మన కోర్సులో పరిశీలిస్తాము.
బిగ్ డేటా
చాలా పెద్ద పరిమాణంలో సాదారణ నిర్మాణంతో ఉన్న డేటాను నిల్వ చేసి ప్రాసెస్ చేయాల్సి వస్తుంది. కంప్యూటర్ క్లస్టర్‌లో పంపిణీ చేయబడిన విధంగా ఆ డేటాను నిల్వ చేయడానికి మరియు సమర్థవంతంగా ప్రాసెస్ చేయడానికి ప్రత్యేక పద్ధతులు మరియు సాధనాలు ఉన్నాయి.
మిషన్ లెర్నింగ్
డేటాను అర్థం చేసుకోవడానికి ఒక మార్గం అనేది కావలసిన ఫలితాన్ని అంచనా వేయగలిగే మోడల్ నిర్మించడం. డేటా నుండి మోడల్స్ అభివృద్ధి చేయడం మిషన్ లెర్నింగ్ అని పిలవబడుతుంది. దీని గురించి మరింత తెలుసుకోవడానికి మన Machine Learning for Beginners పాఠ్యాంశాన్ని చూడవచ్చు.
కృత్రిమ మేధస్సు
మిషన్ లెర్నింగ్ యొక్క ఒక విభాగం అయిన కృత్రిమ మేధస్సు (AI) కూడా డేటాపై ఆధారపడి ఉంటుంది, మరియు ఇది మానవ ఆలోచనా ప్రక్రియలను అనుకరించే అధిక సంక్లిష్టత మోడల్స్ నిర్మించడంలో నిమగ్నమవుతుంది. AI పద్ధతులు తరచుగా అసంఘటిత డేటాను (ఉదా: సహజ భాష) సంఘటిత అవగాహనలుగా మార్చడానికి సహాయపడతాయి.
విజువలైజేషన్
చాలా పెద్ద పరిమాణంలో ఉన్న డేటా మనుషులకు అర్థం కాకపోవచ్చు, కానీ ఆ డేటాను ఉపయోగించి ఉపయోగకరమైన విజువలైజేషన్లు సృష్టించినప్పుడు, మనం డేటాను బాగా అర్థం చేసుకుని కొన్ని తర్కాలను తీసుకోవచ్చు. కాబట్టి, సమాచారాన్ని విజువలైజ్ చేయడానికి అనేక మార్గాలను తెలుసుకోవడం ముఖ్యం - ఇది మన కోర్సు మూడు సెక్షన్లో కవర్ చేస్తాము. సంబంధిత రంగాలు ఇన్ఫోగ్రాఫిక్స్ మరియు సాధారణంగా హ్యూమన్-కంప్యూటర్ ఇంటరాక్షన్ కూడా ఉన్నాయి.

డేటా రకాలు

మనం ఇప్పటికే చెప్పినట్లుగా, డేటా ఎక్కడా ఉంటుంది. మనం దాన్ని సరైన విధంగా సేకరించాలి! సంఘటిత మరియు అసంఘటిత డేటాను వేరుచేయడం ఉపయోగకరం. మొదటిది సాధారణంగా బాగా నిర్మించబడిన రూపంలో ఉంటుంది, తరచుగా ఒక పట్టిక లేదా పలు పట్టికల రూపంలో, మరొకటి కేవలం ఫైళ్ల సేకరణ మాత్రమే. కొన్నిసార్లు మనం అర్ధ-సంఘటిత డేటా గురించి కూడా మాట్లాడవచ్చు, దీనికి కొంత నిర్మాణం ఉంటుంది కానీ అది చాలా మారవచ్చు.

సంఘటిత అర్ధ-సంఘటిత అసంఘటిత
వ్యక్తుల ఫోన్ నంబర్ల జాబితా లింకులతో ఉన్న వికీపీడియా పేజీలు ఎన్సైక్లోపిడియా బ్రిటానికా వచనం
గత 20 సంవత్సరాల పాటు ప్రతి నిమిషం భవనం లోని అన్ని గదుల ఉష్ణోగ్రత రచయితలు, ప్రచురణ తేదీ, సారాంశంతో JSON ఫార్మాట్‌లో శాస్త్రీయ పత్రాల సేకరణ కార్పొరేట్ డాక్యుమెంట్లతో ఫైల్ షేర్
భవనంలో ప్రవేశించే అన్ని వ్యక్తుల వయస్సు మరియు లింగం డేటా ఇంటర్నెట్ పేజీలు పర్యవేక్షణ కెమెరా నుండి రా వీడియో ఫీడ్

డేటా ఎక్కడ నుండి పొందాలి

డేటా పొందడానికి అనేక సాధ్యమైన మూలాలు ఉన్నాయి, వాటన్నింటినీ జాబితా చేయడం అసాధ్యం! అయినప్పటికీ, మీరు డేటా పొందగల సాధారణ ప్రదేశాలను కొన్ని చెప్పుకుందాం:

  • సంఘటిత
    • ఇంటర్నెట్ ఆఫ్ థింగ్స్ (IoT), ఉష్ణోగ్రత లేదా ఒత్తిడి సెన్సార్ల వంటి వివిధ సెన్సార్ల నుండి డేటా సహా, చాలా ఉపయోగకరమైన డేటాను అందిస్తుంది. ఉదాహరణకు, ఒక కార్యాలయ భవనం IoT సెన్సార్లతో సజ్జమైతే, మనం ఆటోమేటిక్‌గా వేడి మరియు లైటింగ్‌ను నియంత్రించి ఖర్చులను తగ్గించవచ్చు.
    • సర్వేలు వినియోగదారులు కొనుగోలు తర్వాత లేదా వెబ్ సైట్ సందర్శించిన తర్వాత పూర్తి చేయమని అడిగే ప్రశ్నావళి.
    • ప్రవర్తన విశ్లేషణ ఉదాహరణకు, వినియోగదారు ఒక సైట్ లో ఎంత లోతుగా వెళ్తున్నాడో, మరియు సైట్ నుండి బయటకు వెళ్లడానికి సాధారణ కారణం ఏమిటో అర్థం చేసుకోవడంలో సహాయపడుతుంది.
  • అసంఘటిత
    • వచనాలు ఒక సంపూర్ణ భావోద్వేగ స్కోరు లేదా కీలకపదాలు మరియు సారాంశాన్ని తీసివేయడం వంటి అవగాహనల సమృద్ధి మూలం కావచ్చు.
    • చిత్రాలు లేదా వీడియో. పర్యవేక్షణ కెమెరా నుండి వీడియో రోడ్డుపై ట్రాఫిక్ అంచనా వేయడానికి మరియు ట్రాఫిక్ జామ్‌ల గురించి ప్రజలకు సమాచారం ఇవ్వడానికి ఉపయోగించవచ్చు.
    • వెబ్ సర్వర్ లాగ్స్ మన సైట్ లో ఏ పేజీలు ఎక్కువగా సందర్శించబడుతున్నాయో, మరియు ఎంతసేపు ఉంటున్నారో అర్థం చేసుకోవడానికి ఉపయోగించవచ్చు.
  • అర్ధ-సంఘటిత
    • సోషల్ నెట్‌వర్క్ గ్రాఫ్లు వినియోగదారుల వ్యక్తిత్వాలు మరియు సమాచారాన్ని వ్యాప్తి చేయడంలో సామర్థ్యం గురించి మంచి డేటా మూలాలు కావచ్చు.
    • పార్టీ నుండి ఫోటోలు ఉన్నప్పుడు, మనం ఒకరితో ఒకరు ఫోటోలు తీసుకునే వ్యక్తుల గ్రాఫ్ నిర్మించి గ్రూప్ డైనమిక్స్ డేటాను తీసివేయవచ్చు.

వివిధ డేటా మూలాలను తెలుసుకోవడం ద్వారా, మీరు వివిధ పరిస్థితుల గురించి ఆలోచించి, డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి పరిస్థితిని మెరుగుపరచడానికి ప్రయత్నించవచ్చు.

డేటాతో మీరు ఏమి చేయగలరు

డేటా సైన్స్‌లో, మనం డేటా ప్రయాణం క్రింది దశలపై దృష్టి పెడతాము:

1) డేటా సేకరణ
మొదటి దశ డేటాను సేకరించడం. చాలా సందర్భాల్లో ఇది సులభమైన ప్రక్రియ కావచ్చు, ఉదాహరణకు వెబ్ అప్లికేషన్ నుండి డేటా డేటాబేస్‌కు వస్తుంది, కానీ కొన్నిసార్లు ప్రత్యేక సాంకేతికతలు ఉపయోగించాల్సి ఉంటుంది. ఉదాహరణకు, IoT సెన్సార్ల నుండి డేటా అధికంగా ఉండవచ్చు, అందువల్ల IoT హబ్ వంటి బఫరింగ్ ఎండ్పాయింట్లను ఉపయోగించి అన్ని డేటాను సేకరించి తర్వాత ప్రాసెస్ చేయడం మంచి పద్ధతి.
2) డేటా నిల్వ
డేటాను నిల్వ చేయడం సవాలు కావచ్చు, ముఖ్యంగా బిగ్ డేటా గురించి మాట్లాడుతున్నప్పుడు. డేటాను ఎలా నిల్వ చేయాలో నిర్ణయించేటప్పుడు, భవిష్యత్తులో మీరు డేటాను ఎలా క్వెరీ చేయాలనుకుంటున్నారో ముందుగా ఊహించడం మంచిది. డేటాను నిల్వ చేసే కొన్ని మార్గాలు ఉన్నాయి:
  • ఒక రిలేషనల్ డేటాబేస్ పట్టికల సేకరణను నిల్వ చేస్తుంది, మరియు వాటిని క్వెరీ చేయడానికి SQL అనే ప్రత్యేక భాషను ఉపయోగిస్తుంది. సాధారణంగా, పట్టికలు వివిధ గ్రూపులుగా, స్కీమాలుగా పిలవబడతాయి. చాలా సందర్భాల్లో డేటాను అసలు రూపం నుండి స్కీమాకు సరిపడేలా మార్చాల్సి ఉంటుంది.
  • NoSQL డేటాబేస్, ఉదాహరణకు CosmosDB, డేటాపై స్కీమాలను అమలు చేయదు, మరియు మరింత సంక్లిష్టమైన డేటాను నిల్వ చేయడానికి అనుమతిస్తుంది, ఉదాహరణకు, హైరార్కికల్ JSON డాక్యుమెంట్లు లేదా గ్రాఫ్లు. అయితే, NoSQL డేటాబేసులకు SQL లాంటి సమృద్ధి క్వెరీ సామర్థ్యాలు లేవు, మరియు రిఫరెన్షియల్ ఇంటిగ్రిటీని అమలు చేయలేవు, అంటే పట్టికల నిర్మాణం మరియు పట్టికల మధ్య సంబంధాలను నియంత్రించే నియమాలు.
  • డేటా లేక్ నిల్వ అనేది పెద్ద పరిమాణంలో ఉన్న రా, అసంఘటిత డేటా సేకరణ కోసం ఉపయోగిస్తారు. డేటా లేక్స్ తరచుగా బిగ్ డేటాతో ఉపయోగిస్తారు, అందులో అన్ని డేటా ఒకే యంత్రంలో సరిపోదు, కాబట్టి క్లస్టర్ సర్వర్ల ద్వారా నిల్వ చేసి ప్రాసెస్ చేయాలి. పార్కెట్ అనేది బిగ్ డేటాతో తరచుగా ఉపయోగించే డేటా ఫార్మాట్.
3) డేటా ప్రాసెసింగ్
ఇది డేటా ప్రయాణంలో అత్యంత ఆసక్తికరమైన భాగం, ఇది డేటాను అసలు రూపం నుండి విజువలైజేషన్/మోడల్ శిక్షణకు ఉపయోగించే రూపంలోకి మార్చడం. వచనం లేదా చిత్రాల వంటి అసంఘటిత డేటాతో వ్యవహరించేటప్పుడు, మనం కొంత AI సాంకేతికతలను ఉపయోగించి డేటా నుండి ఫీచర్లు తీసివేయవచ్చు, తద్వారా దాన్ని సంఘటిత రూపంలోకి మార్చవచ్చు.
4) విజువలైజేషన్ / మానవ అవగాహన
చాలాసార్లు, డేటాను అర్థం చేసుకోవడానికి, మనం దాన్ని విజువలైజ్ చేయాలి. మన టూల్‌బాక్స్‌లో అనేక విజువలైజేషన్ పద్ధతులు ఉండటం వల్ల, సరైన దృశ్యాన్ని కనుగొని అవగాహన పొందవచ్చు. తరచుగా, డేటా శాస్త్రవేత్త డేటాతో "ఆడుకుంటూ", దాన్ని ఎన్నో సార్లు విజువలైజ్ చేసి సంబంధాలను వెతుకుతాడు. అలాగే, మనం గణాంక పద్ధతులను ఉపయోగించి ఒక హైపోథసిస్‌ను పరీక్షించవచ్చు లేదా డేటా భాగాల మధ్య సంబంధాన్ని నిరూపించవచ్చు.
5) అంచనా మోడల్ శిక్షణ
డేటా సైన్స్ యొక్క తుది లక్ష్యం డేటా ఆధారంగా నిర్ణయాలు తీసుకోవడం కావడంతో, మనం మిషన్ లెర్నింగ్ సాంకేతికతలను ఉపయోగించి అంచనా మోడల్ నిర్మించవచ్చు. తరువాత, ఈ మోడల్‌ను ఉపయోగించి సమాన నిర్మాణాలున్న కొత్త డేటా సెట్‌లపై అంచనాలు చేయవచ్చు.

తప్పకుండా, వాస్తవ డేటాపై ఆధారపడి, కొన్ని దశలు లేకపోవచ్చు (ఉదా: మనకు ఇప్పటికే డేటా డేటాబేస్‌లో ఉన్నప్పుడు, లేదా మోడల్ శిక్షణ అవసరం లేకపోతే), లేదా కొన్ని దశలు పలు సార్లు పునరావృతమవ్వచ్చు (ఉదా: డేటా ప్రాసెసింగ్).

డిజిటలైజేషన్ మరియు డిజిటల్ ట్రాన్స్‌ఫర్మేషన్

గత దశాబ్దంలో, అనేక వ్యాపారాలు వ్యాపార నిర్ణయాలు తీసుకునేటప్పుడు డేటా ప్రాముఖ్యతను అర్థం చేసుకున్నాయి. వ్యాపారాన్ని నడిపించడానికి డేటా సైన్స్ సూత్రాలను వర్తింపజేయడానికి, మొదట కొంత డేటాను సేకరించాలి, అంటే వ్యాపార ప్రక్రియలను డిజిటల్ రూపంలోకి మార్చాలి. దీనిని డిజిటలైజేషన్ అంటారు. ఈ డేటాపై డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి నిర్ణయాలను మార్గనిర్దేశం చేయడం ద్వారా ఉత్పాదకతలో గణనీయమైన పెరుగుదల (లేదా వ్యాపార మార్పు) సాధించవచ్చు, దీనిని డిజిటల్ ట్రాన్స్‌ఫర్మేషన్ అంటారు.

ఒక ఉదాహరణను పరిశీలిద్దాం. మనకు ఒక డేటా సైన్స్ కోర్సు (ఇలాంటి ఒకటి) ఉంది, దీన్ని మనం ఆన్‌లైన్‌లో విద్యార్థులకు అందిస్తున్నాము, మరియు దీన్ని మెరుగుపరచడానికి డేటా సైన్స్ ఉపయోగించాలనుకుంటున్నాము. మనం ఎలా చేయగలం?

మనం మొదట అడగవచ్చు "ఏం డిజిటలైజ్ చేయవచ్చు?" సులభమైన మార్గం ప్రతి విద్యార్థి ప్రతి మాడ్యూల్ పూర్తి చేయడానికి తీసుకునే సమయాన్ని కొలవడం, మరియు ప్రతి మాడ్యూల్ చివరలో బహుళ ఎంపిక పరీక్ష ద్వారా పొందిన జ్ఞానాన్ని కొలవడం. అన్ని విద్యార్థుల సమయాన్ని సగటు తీసుకుంటే, ఏ మాడ్యూల్స్ విద్యార్థులకు ఎక్కువ కష్టాలు కలిగిస్తున్నాయో తెలుసుకుని వాటిని సులభతరం చేయడానికి పని చేయవచ్చు.

మీరు ఈ విధానం సరైనది కాదని వాదించవచ్చు, ఎందుకంటే మాడ్యూల్స్ వివిధ పొడవులలో ఉండవచ్చు. మాడ్యూల్ పొడవు (అక్షరాల సంఖ్యలో) ద్వారా సమయాన్ని భాగించటం మరింత న్యాయమైనది, మరియు ఆ విలువలను పోల్చటం మంచిది.

మేము బహుళ-ఎంపిక పరీక్షల ఫలితాలను విశ్లేషించడం ప్రారంభించినప్పుడు, విద్యార్థులు అర్థం చేసుకోవడంలో కష్టపడుతున్న భావనలను గుర్తించడానికి ప్రయత్నించవచ్చు, మరియు ఆ సమాచారాన్ని ఉపయోగించి కంటెంట్‌ను మెరుగుపరచవచ్చు. దానికి, ప్రతి ప్రశ్న ఒక నిర్దిష్ట భావన లేదా జ్ఞాన భాగానికి మ్యాప్ అయ్యే విధంగా పరీక్షలను రూపకల్పన చేయాలి.

మరింత క్లిష్టంగా చేయాలనుకుంటే, మేము ప్రతి మాడ్యూల్ కోసం తీసుకున్న సమయాన్ని విద్యార్థుల వయస్సు వర్గంతో పోల్చి గ్రాఫ్ చేయవచ్చు. కొన్ని వయస్సు వర్గాల కోసం మాడ్యూల్ పూర్తి చేయడానికి అనవసరంగా ఎక్కువ సమయం పడుతుందని లేదా విద్యార్థులు పూర్తి చేయకముందే వదిలివేస్తారని కనుగొనవచ్చు. ఇది మాడ్యూల్ కోసం వయస్సు సిఫార్సులను అందించడంలో సహాయపడుతుంది, మరియు తప్పు అంచనాల వల్ల ప్రజల అసంతృప్తిని తగ్గిస్తుంది.

🚀 సవాలు

ఈ సవాలలో, మేము డేటా సైన్స్ రంగానికి సంబంధించిన భావనలను పాఠ్యాలను పరిశీలించడం ద్వారా కనుగొనడానికి ప్రయత్నిస్తాము. మేము డేటా సైన్స్ పై వికీపీడియా వ్యాసాన్ని తీసుకుని, టెక్స్ట్‌ను డౌన్లోడ్ చేసి ప్రాసెస్ చేసి, ఈ విధమైన పద మేఘాన్ని నిర్మిస్తాము:

Word Cloud for Data Science

కోడ్‌ను చదవడానికి notebook.ipynb ను సందర్శించండి. మీరు కోడ్‌ను కూడా నడిపించి, అన్ని డేటా మార్పిడి ప్రక్రియలను ప్రత్యక్షంగా చూడవచ్చు.

మీరు జూపిటర్ నోట్‌బుక్‌లో కోడ్ ఎలా నడిపించాలో తెలియకపోతే, ఈ వ్యాసం చూడండి.

పోస్ట్-లెక్చర్ క్విజ్

అసైన్‌మెంట్లు

క్రెడిట్స్

ఈ పాఠం ♥️ తో Dmitry Soshnikov రచించారు


అస్పష్టత:
ఈ పత్రాన్ని AI అనువాద సేవ Co-op Translator ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.