|
|
1 month ago | |
|---|---|---|
| .. | ||
| solution | 1 month ago | |
| README.md | 1 month ago | |
| assignment.md | 1 month ago | |
| notebook.ipynb | 2 months ago | |
README.md
డేటా సైన్స్ నిర్వచనం
![]() |
|---|
| డేటా సైన్స్ నిర్వచనం - స్కెచ్ నోట్ @nitya ద్వారా |
పూర్వ-లెక్చర్ క్విజ్
డేటా అంటే ఏమిటి?
మన రోజువారీ జీవితంలో, మనం ఎప్పుడూ డేటాతో చుట్టబడి ఉంటాము. మీరు ఇప్పుడు చదువుతున్న వచనం డేటానే. మీ స్మార్ట్ఫోన్లో మీ స్నేహితుల ఫోన్ నంబర్ల జాబితా డేటా, అలాగే మీ గడియారంలో ప్రదర్శించబడుతున్న ప్రస్తుత సమయం కూడా డేటానే. మనుషులుగా, మనం సహజంగానే డేటాతో పనిచేస్తాము, మన దగ్గర ఉన్న డబ్బును లెక్కించడం లేదా స్నేహితులకు లేఖలు రాయడం ద్వారా.
కానీ, కంప్యూటర్లు సృష్టించబడిన తర్వాత డేటా చాలా ముఖ్యమైంది అయింది. కంప్యూటర్ల ప్రాథమిక పాత్ర గణనలను నిర్వహించడం, కానీ అవి ఆపరేట్ చేయడానికి డేటా అవసరం. కాబట్టి, మనం కంప్యూటర్లు డేటాను ఎలా నిల్వ చేస్తాయో, ప్రాసెస్ చేస్తాయో అర్థం చేసుకోవాలి.
ఇంటర్నెట్ ఉద్భవంతో, కంప్యూటర్ల పాత్ర డేటా నిర్వహణ పరికరాలుగా పెరిగింది. మీరు ఆలోచిస్తే, ఇప్పుడు మనం కంప్యూటర్లను గణనలకు కాకుండా డేటా ప్రాసెసింగ్ మరియు కమ్యూనికేషన్ కోసం ఎక్కువగా ఉపయోగిస్తున్నాము. మనం స్నేహితునికి ఇమెయిల్ రాస్తున్నప్పుడు లేదా ఇంటర్నెట్లో సమాచారాన్ని శోధిస్తున్నప్పుడు - మనం అసలు డేటాను సృష్టించడం, నిల్వ చేయడం, ప్రసారం చేయడం మరియు మార్చడం చేస్తున్నాము.
మీరు చివరిసారిగా కంప్యూటర్లను వాస్తవంగా ఏదైనా గణన చేయడానికి ఉపయోగించినప్పుడు గుర్తు చేసుకోగలరా?
డేటా సైన్స్ అంటే ఏమిటి?
వికీపీడియా ప్రకారం, డేటా సైన్స్ అనేది సంఘటిత మరియు అసంఘటిత డేటా నుండి జ్ఞానం మరియు అవగాహనలను పొందడానికి శాస్త్రీయ పద్ధతులను ఉపయోగించే శాస్త్రీయ రంగం, మరియు విస్తృత అనువర్తన రంగాలలో డేటా నుండి జ్ఞానం మరియు అమలు చేయదగిన అవగాహనలను వర్తింపజేసే రంగంగా నిర్వచించబడింది.
ఈ నిర్వచనం డేటా సైన్స్ యొక్క క్రింది ముఖ్యాంశాలను హైలైట్ చేస్తుంది:
- డేటా సైన్స్ యొక్క ప్రధాన లక్ష్యం డేటా నుండి జ్ఞానం పొందడం, అంటే - డేటాను అర్థం చేసుకోవడం, కొన్ని దాగి ఉన్న సంబంధాలను కనుగొనడం మరియు ఒక మోడల్ నిర్మించడం.
- డేటా సైన్స్ శాస్త్రీయ పద్ధతులను ఉపయోగిస్తుంది, ఉదాహరణకు సంభావ్యత మరియు గణాంకాలు. వాస్తవానికి, డేటా సైన్స్ అనే పదం మొదట ప్రవేశపెట్టినప్పుడు, కొంతమంది డేటా సైన్స్ గణాంకాలకి కొత్త ఫ్యాన్సీ పేరు మాత్రమే అని వాదించారు. ఇప్పుడు ఈ రంగం చాలా విస్తృతమైందని స్పష్టమైంది.
- పొందిన జ్ఞానం కొన్ని అమలు చేయదగిన అవగాహనలను ఉత్పత్తి చేయడానికి ఉపయోగించాలి, అంటే మీరు వాస్తవ వ్యాపార పరిస్థితులకు వర్తింపజేయగల ప్రాక్టికల్ అవగాహన.
- మనం సంఘటిత మరియు అసంఘటిత డేటా రెండింటిపై కూడా ఆపరేట్ చేయగలగాలి. కోర్సులో తరువాత డేటా రకాల గురించి మళ్ళీ చర్చిస్తాము.
- అనువర్తన రంగం ఒక ముఖ్యమైన భావన, మరియు డేటా శాస్త్రవేత్తలు తరచుగా సమస్య రంగంలో కనీసం కొంత నైపుణ్యం కలిగి ఉండాలి, ఉదాహరణకు: ఫైనాన్స్, వైద్యం, మార్కెటింగ్ మొదలైనవి.
డేటా సైన్స్ యొక్క మరో ముఖ్యాంశం ఏమిటంటే, ఇది డేటాను కంప్యూటర్ల ద్వారా ఎలా సేకరించవచ్చో, నిల్వ చేయవచ్చో, ఆపరేట్ చేయవచ్చో అధ్యయనం చేస్తుంది. గణాంకాలు మనకు గణిత శాస్త్రపు ఆధారాలను ఇస్తే, డేటా సైన్స్ గణిత సూత్రాలను వాస్తవంగా డేటా నుండి అవగాహనలను పొందడానికి వర్తింపజేస్తుంది.
డేటా సైన్స్ను చూడటానికి ఒక మార్గం (జిమ్ గ్రేకి అప్పగించబడింది) ఇది శాస్త్రం యొక్క వేరే ఒక పారడైమ్గా పరిగణించవచ్చు:
- ప్రయోగాత్మక (Empirical), ఇందులో మనం ఎక్కువగా పరిశీలనలు మరియు ప్రయోగాల ఫలితాలపై ఆధారపడతాము
- సిద్ధాంతాత్మక (Theoretical), ఇక్కడ కొత్త భావనలు ఉన్న శాస్త్రీయ జ్ఞానంలో నుండి ఉద్భవిస్తాయి
- గణనాత్మక (Computational), ఇక్కడ మనం కొన్ని గణనాత్మక ప్రయోగాల ఆధారంగా కొత్త సూత్రాలను కనుగొంటాము
- డేటా-ఆధారిత (Data-Driven), డేటాలో సంబంధాలు మరియు నమూనాలను కనుగొనడంపై ఆధారపడి ఉంటుంది
ఇతర సంబంధిత రంగాలు
డేటా విస్తృతంగా ఉండటంతో, డేటా సైన్స్ కూడా విస్తృత రంగం, అనేక ఇతర శాస్త్రాలను స్పర్శిస్తుంది.
- డేటాబేసులు
- ముఖ్యమైన పరిగణన ఏమిటంటే డేటాను ఎలా నిల్వ చేయాలి, అంటే వేగంగా ప్రాసెస్ చేయడానికి ఎలా నిర్మించాలి. వివిధ రకాల డేటాబేసులు ఉన్నాయి, అవి సంఘటిత మరియు అసంఘటిత డేటాను నిల్వ చేస్తాయి, వాటిని మన కోర్సులో పరిశీలిస్తాము.
- బిగ్ డేటా
- చాలా పెద్ద పరిమాణంలో సాదారణ నిర్మాణంతో ఉన్న డేటాను నిల్వ చేసి ప్రాసెస్ చేయాల్సి వస్తుంది. కంప్యూటర్ క్లస్టర్లో పంపిణీ చేయబడిన విధంగా ఆ డేటాను నిల్వ చేయడానికి మరియు సమర్థవంతంగా ప్రాసెస్ చేయడానికి ప్రత్యేక పద్ధతులు మరియు సాధనాలు ఉన్నాయి.
- మిషన్ లెర్నింగ్
- డేటాను అర్థం చేసుకోవడానికి ఒక మార్గం అనేది కావలసిన ఫలితాన్ని అంచనా వేయగలిగే మోడల్ నిర్మించడం. డేటా నుండి మోడల్స్ అభివృద్ధి చేయడం మిషన్ లెర్నింగ్ అని పిలవబడుతుంది. దీని గురించి మరింత తెలుసుకోవడానికి మన Machine Learning for Beginners పాఠ్యాంశాన్ని చూడవచ్చు.
- కృత్రిమ మేధస్సు
- మిషన్ లెర్నింగ్ యొక్క ఒక విభాగం అయిన కృత్రిమ మేధస్సు (AI) కూడా డేటాపై ఆధారపడి ఉంటుంది, మరియు ఇది మానవ ఆలోచనా ప్రక్రియలను అనుకరించే అధిక సంక్లిష్టత మోడల్స్ నిర్మించడంలో నిమగ్నమవుతుంది. AI పద్ధతులు తరచుగా అసంఘటిత డేటాను (ఉదా: సహజ భాష) సంఘటిత అవగాహనలుగా మార్చడానికి సహాయపడతాయి.
- విజువలైజేషన్
- చాలా పెద్ద పరిమాణంలో ఉన్న డేటా మనుషులకు అర్థం కాకపోవచ్చు, కానీ ఆ డేటాను ఉపయోగించి ఉపయోగకరమైన విజువలైజేషన్లు సృష్టించినప్పుడు, మనం డేటాను బాగా అర్థం చేసుకుని కొన్ని తర్కాలను తీసుకోవచ్చు. కాబట్టి, సమాచారాన్ని విజువలైజ్ చేయడానికి అనేక మార్గాలను తెలుసుకోవడం ముఖ్యం - ఇది మన కోర్సు మూడు సెక్షన్లో కవర్ చేస్తాము. సంబంధిత రంగాలు ఇన్ఫోగ్రాఫిక్స్ మరియు సాధారణంగా హ్యూమన్-కంప్యూటర్ ఇంటరాక్షన్ కూడా ఉన్నాయి.
డేటా రకాలు
మనం ఇప్పటికే చెప్పినట్లుగా, డేటా ఎక్కడా ఉంటుంది. మనం దాన్ని సరైన విధంగా సేకరించాలి! సంఘటిత మరియు అసంఘటిత డేటాను వేరుచేయడం ఉపయోగకరం. మొదటిది సాధారణంగా బాగా నిర్మించబడిన రూపంలో ఉంటుంది, తరచుగా ఒక పట్టిక లేదా పలు పట్టికల రూపంలో, మరొకటి కేవలం ఫైళ్ల సేకరణ మాత్రమే. కొన్నిసార్లు మనం అర్ధ-సంఘటిత డేటా గురించి కూడా మాట్లాడవచ్చు, దీనికి కొంత నిర్మాణం ఉంటుంది కానీ అది చాలా మారవచ్చు.
| సంఘటిత | అర్ధ-సంఘటిత | అసంఘటిత |
|---|---|---|
| వ్యక్తుల ఫోన్ నంబర్ల జాబితా | లింకులతో ఉన్న వికీపీడియా పేజీలు | ఎన్సైక్లోపిడియా బ్రిటానికా వచనం |
| గత 20 సంవత్సరాల పాటు ప్రతి నిమిషం భవనం లోని అన్ని గదుల ఉష్ణోగ్రత | రచయితలు, ప్రచురణ తేదీ, సారాంశంతో JSON ఫార్మాట్లో శాస్త్రీయ పత్రాల సేకరణ | కార్పొరేట్ డాక్యుమెంట్లతో ఫైల్ షేర్ |
| భవనంలో ప్రవేశించే అన్ని వ్యక్తుల వయస్సు మరియు లింగం డేటా | ఇంటర్నెట్ పేజీలు | పర్యవేక్షణ కెమెరా నుండి రా వీడియో ఫీడ్ |
డేటా ఎక్కడ నుండి పొందాలి
డేటా పొందడానికి అనేక సాధ్యమైన మూలాలు ఉన్నాయి, వాటన్నింటినీ జాబితా చేయడం అసాధ్యం! అయినప్పటికీ, మీరు డేటా పొందగల సాధారణ ప్రదేశాలను కొన్ని చెప్పుకుందాం:
- సంఘటిత
- ఇంటర్నెట్ ఆఫ్ థింగ్స్ (IoT), ఉష్ణోగ్రత లేదా ఒత్తిడి సెన్సార్ల వంటి వివిధ సెన్సార్ల నుండి డేటా సహా, చాలా ఉపయోగకరమైన డేటాను అందిస్తుంది. ఉదాహరణకు, ఒక కార్యాలయ భవనం IoT సెన్సార్లతో సజ్జమైతే, మనం ఆటోమేటిక్గా వేడి మరియు లైటింగ్ను నియంత్రించి ఖర్చులను తగ్గించవచ్చు.
- సర్వేలు వినియోగదారులు కొనుగోలు తర్వాత లేదా వెబ్ సైట్ సందర్శించిన తర్వాత పూర్తి చేయమని అడిగే ప్రశ్నావళి.
- ప్రవర్తన విశ్లేషణ ఉదాహరణకు, వినియోగదారు ఒక సైట్ లో ఎంత లోతుగా వెళ్తున్నాడో, మరియు సైట్ నుండి బయటకు వెళ్లడానికి సాధారణ కారణం ఏమిటో అర్థం చేసుకోవడంలో సహాయపడుతుంది.
- అసంఘటిత
- వచనాలు ఒక సంపూర్ణ భావోద్వేగ స్కోరు లేదా కీలకపదాలు మరియు సారాంశాన్ని తీసివేయడం వంటి అవగాహనల సమృద్ధి మూలం కావచ్చు.
- చిత్రాలు లేదా వీడియో. పర్యవేక్షణ కెమెరా నుండి వీడియో రోడ్డుపై ట్రాఫిక్ అంచనా వేయడానికి మరియు ట్రాఫిక్ జామ్ల గురించి ప్రజలకు సమాచారం ఇవ్వడానికి ఉపయోగించవచ్చు.
- వెబ్ సర్వర్ లాగ్స్ మన సైట్ లో ఏ పేజీలు ఎక్కువగా సందర్శించబడుతున్నాయో, మరియు ఎంతసేపు ఉంటున్నారో అర్థం చేసుకోవడానికి ఉపయోగించవచ్చు.
- అర్ధ-సంఘటిత
- సోషల్ నెట్వర్క్ గ్రాఫ్లు వినియోగదారుల వ్యక్తిత్వాలు మరియు సమాచారాన్ని వ్యాప్తి చేయడంలో సామర్థ్యం గురించి మంచి డేటా మూలాలు కావచ్చు.
- పార్టీ నుండి ఫోటోలు ఉన్నప్పుడు, మనం ఒకరితో ఒకరు ఫోటోలు తీసుకునే వ్యక్తుల గ్రాఫ్ నిర్మించి గ్రూప్ డైనమిక్స్ డేటాను తీసివేయవచ్చు.
వివిధ డేటా మూలాలను తెలుసుకోవడం ద్వారా, మీరు వివిధ పరిస్థితుల గురించి ఆలోచించి, డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి పరిస్థితిని మెరుగుపరచడానికి ప్రయత్నించవచ్చు.
డేటాతో మీరు ఏమి చేయగలరు
డేటా సైన్స్లో, మనం డేటా ప్రయాణం క్రింది దశలపై దృష్టి పెడతాము:
- 1) డేటా సేకరణ
- మొదటి దశ డేటాను సేకరించడం. చాలా సందర్భాల్లో ఇది సులభమైన ప్రక్రియ కావచ్చు, ఉదాహరణకు వెబ్ అప్లికేషన్ నుండి డేటా డేటాబేస్కు వస్తుంది, కానీ కొన్నిసార్లు ప్రత్యేక సాంకేతికతలు ఉపయోగించాల్సి ఉంటుంది. ఉదాహరణకు, IoT సెన్సార్ల నుండి డేటా అధికంగా ఉండవచ్చు, అందువల్ల IoT హబ్ వంటి బఫరింగ్ ఎండ్పాయింట్లను ఉపయోగించి అన్ని డేటాను సేకరించి తర్వాత ప్రాసెస్ చేయడం మంచి పద్ధతి.
- 2) డేటా నిల్వ
-
డేటాను నిల్వ చేయడం సవాలు కావచ్చు, ముఖ్యంగా బిగ్ డేటా గురించి మాట్లాడుతున్నప్పుడు. డేటాను ఎలా నిల్వ చేయాలో నిర్ణయించేటప్పుడు, భవిష్యత్తులో మీరు డేటాను ఎలా క్వెరీ చేయాలనుకుంటున్నారో ముందుగా ఊహించడం మంచిది. డేటాను నిల్వ చేసే కొన్ని మార్గాలు ఉన్నాయి:
- ఒక రిలేషనల్ డేటాబేస్ పట్టికల సేకరణను నిల్వ చేస్తుంది, మరియు వాటిని క్వెరీ చేయడానికి SQL అనే ప్రత్యేక భాషను ఉపయోగిస్తుంది. సాధారణంగా, పట్టికలు వివిధ గ్రూపులుగా, స్కీమాలుగా పిలవబడతాయి. చాలా సందర్భాల్లో డేటాను అసలు రూపం నుండి స్కీమాకు సరిపడేలా మార్చాల్సి ఉంటుంది.
- NoSQL డేటాబేస్, ఉదాహరణకు CosmosDB, డేటాపై స్కీమాలను అమలు చేయదు, మరియు మరింత సంక్లిష్టమైన డేటాను నిల్వ చేయడానికి అనుమతిస్తుంది, ఉదాహరణకు, హైరార్కికల్ JSON డాక్యుమెంట్లు లేదా గ్రాఫ్లు. అయితే, NoSQL డేటాబేసులకు SQL లాంటి సమృద్ధి క్వెరీ సామర్థ్యాలు లేవు, మరియు రిఫరెన్షియల్ ఇంటిగ్రిటీని అమలు చేయలేవు, అంటే పట్టికల నిర్మాణం మరియు పట్టికల మధ్య సంబంధాలను నియంత్రించే నియమాలు.
- డేటా లేక్ నిల్వ అనేది పెద్ద పరిమాణంలో ఉన్న రా, అసంఘటిత డేటా సేకరణ కోసం ఉపయోగిస్తారు. డేటా లేక్స్ తరచుగా బిగ్ డేటాతో ఉపయోగిస్తారు, అందులో అన్ని డేటా ఒకే యంత్రంలో సరిపోదు, కాబట్టి క్లస్టర్ సర్వర్ల ద్వారా నిల్వ చేసి ప్రాసెస్ చేయాలి. పార్కెట్ అనేది బిగ్ డేటాతో తరచుగా ఉపయోగించే డేటా ఫార్మాట్.
- 3) డేటా ప్రాసెసింగ్
- ఇది డేటా ప్రయాణంలో అత్యంత ఆసక్తికరమైన భాగం, ఇది డేటాను అసలు రూపం నుండి విజువలైజేషన్/మోడల్ శిక్షణకు ఉపయోగించే రూపంలోకి మార్చడం. వచనం లేదా చిత్రాల వంటి అసంఘటిత డేటాతో వ్యవహరించేటప్పుడు, మనం కొంత AI సాంకేతికతలను ఉపయోగించి డేటా నుండి ఫీచర్లు తీసివేయవచ్చు, తద్వారా దాన్ని సంఘటిత రూపంలోకి మార్చవచ్చు.
- 4) విజువలైజేషన్ / మానవ అవగాహన
- చాలాసార్లు, డేటాను అర్థం చేసుకోవడానికి, మనం దాన్ని విజువలైజ్ చేయాలి. మన టూల్బాక్స్లో అనేక విజువలైజేషన్ పద్ధతులు ఉండటం వల్ల, సరైన దృశ్యాన్ని కనుగొని అవగాహన పొందవచ్చు. తరచుగా, డేటా శాస్త్రవేత్త డేటాతో "ఆడుకుంటూ", దాన్ని ఎన్నో సార్లు విజువలైజ్ చేసి సంబంధాలను వెతుకుతాడు. అలాగే, మనం గణాంక పద్ధతులను ఉపయోగించి ఒక హైపోథసిస్ను పరీక్షించవచ్చు లేదా డేటా భాగాల మధ్య సంబంధాన్ని నిరూపించవచ్చు.
- 5) అంచనా మోడల్ శిక్షణ
- డేటా సైన్స్ యొక్క తుది లక్ష్యం డేటా ఆధారంగా నిర్ణయాలు తీసుకోవడం కావడంతో, మనం మిషన్ లెర్నింగ్ సాంకేతికతలను ఉపయోగించి అంచనా మోడల్ నిర్మించవచ్చు. తరువాత, ఈ మోడల్ను ఉపయోగించి సమాన నిర్మాణాలున్న కొత్త డేటా సెట్లపై అంచనాలు చేయవచ్చు.
తప్పకుండా, వాస్తవ డేటాపై ఆధారపడి, కొన్ని దశలు లేకపోవచ్చు (ఉదా: మనకు ఇప్పటికే డేటా డేటాబేస్లో ఉన్నప్పుడు, లేదా మోడల్ శిక్షణ అవసరం లేకపోతే), లేదా కొన్ని దశలు పలు సార్లు పునరావృతమవ్వచ్చు (ఉదా: డేటా ప్రాసెసింగ్).
డిజిటలైజేషన్ మరియు డిజిటల్ ట్రాన్స్ఫర్మేషన్
గత దశాబ్దంలో, అనేక వ్యాపారాలు వ్యాపార నిర్ణయాలు తీసుకునేటప్పుడు డేటా ప్రాముఖ్యతను అర్థం చేసుకున్నాయి. వ్యాపారాన్ని నడిపించడానికి డేటా సైన్స్ సూత్రాలను వర్తింపజేయడానికి, మొదట కొంత డేటాను సేకరించాలి, అంటే వ్యాపార ప్రక్రియలను డిజిటల్ రూపంలోకి మార్చాలి. దీనిని డిజిటలైజేషన్ అంటారు. ఈ డేటాపై డేటా సైన్స్ సాంకేతికతలను వర్తింపజేసి నిర్ణయాలను మార్గనిర్దేశం చేయడం ద్వారా ఉత్పాదకతలో గణనీయమైన పెరుగుదల (లేదా వ్యాపార మార్పు) సాధించవచ్చు, దీనిని డిజిటల్ ట్రాన్స్ఫర్మేషన్ అంటారు.
ఒక ఉదాహరణను పరిశీలిద్దాం. మనకు ఒక డేటా సైన్స్ కోర్సు (ఇలాంటి ఒకటి) ఉంది, దీన్ని మనం ఆన్లైన్లో విద్యార్థులకు అందిస్తున్నాము, మరియు దీన్ని మెరుగుపరచడానికి డేటా సైన్స్ ఉపయోగించాలనుకుంటున్నాము. మనం ఎలా చేయగలం?
మనం మొదట అడగవచ్చు "ఏం డిజిటలైజ్ చేయవచ్చు?" సులభమైన మార్గం ప్రతి విద్యార్థి ప్రతి మాడ్యూల్ పూర్తి చేయడానికి తీసుకునే సమయాన్ని కొలవడం, మరియు ప్రతి మాడ్యూల్ చివరలో బహుళ ఎంపిక పరీక్ష ద్వారా పొందిన జ్ఞానాన్ని కొలవడం. అన్ని విద్యార్థుల సమయాన్ని సగటు తీసుకుంటే, ఏ మాడ్యూల్స్ విద్యార్థులకు ఎక్కువ కష్టాలు కలిగిస్తున్నాయో తెలుసుకుని వాటిని సులభతరం చేయడానికి పని చేయవచ్చు.
మీరు ఈ విధానం సరైనది కాదని వాదించవచ్చు, ఎందుకంటే మాడ్యూల్స్ వివిధ పొడవులలో ఉండవచ్చు. మాడ్యూల్ పొడవు (అక్షరాల సంఖ్యలో) ద్వారా సమయాన్ని భాగించటం మరింత న్యాయమైనది, మరియు ఆ విలువలను పోల్చటం మంచిది.
మేము బహుళ-ఎంపిక పరీక్షల ఫలితాలను విశ్లేషించడం ప్రారంభించినప్పుడు, విద్యార్థులు అర్థం చేసుకోవడంలో కష్టపడుతున్న భావనలను గుర్తించడానికి ప్రయత్నించవచ్చు, మరియు ఆ సమాచారాన్ని ఉపయోగించి కంటెంట్ను మెరుగుపరచవచ్చు. దానికి, ప్రతి ప్రశ్న ఒక నిర్దిష్ట భావన లేదా జ్ఞాన భాగానికి మ్యాప్ అయ్యే విధంగా పరీక్షలను రూపకల్పన చేయాలి.
మరింత క్లిష్టంగా చేయాలనుకుంటే, మేము ప్రతి మాడ్యూల్ కోసం తీసుకున్న సమయాన్ని విద్యార్థుల వయస్సు వర్గంతో పోల్చి గ్రాఫ్ చేయవచ్చు. కొన్ని వయస్సు వర్గాల కోసం మాడ్యూల్ పూర్తి చేయడానికి అనవసరంగా ఎక్కువ సమయం పడుతుందని లేదా విద్యార్థులు పూర్తి చేయకముందే వదిలివేస్తారని కనుగొనవచ్చు. ఇది మాడ్యూల్ కోసం వయస్సు సిఫార్సులను అందించడంలో సహాయపడుతుంది, మరియు తప్పు అంచనాల వల్ల ప్రజల అసంతృప్తిని తగ్గిస్తుంది.
🚀 సవాలు
ఈ సవాలలో, మేము డేటా సైన్స్ రంగానికి సంబంధించిన భావనలను పాఠ్యాలను పరిశీలించడం ద్వారా కనుగొనడానికి ప్రయత్నిస్తాము. మేము డేటా సైన్స్ పై వికీపీడియా వ్యాసాన్ని తీసుకుని, టెక్స్ట్ను డౌన్లోడ్ చేసి ప్రాసెస్ చేసి, ఈ విధమైన పద మేఘాన్ని నిర్మిస్తాము:
కోడ్ను చదవడానికి notebook.ipynb ను సందర్శించండి. మీరు కోడ్ను కూడా నడిపించి, అన్ని డేటా మార్పిడి ప్రక్రియలను ప్రత్యక్షంగా చూడవచ్చు.
మీరు జూపిటర్ నోట్బుక్లో కోడ్ ఎలా నడిపించాలో తెలియకపోతే, ఈ వ్యాసం చూడండి.
పోస్ట్-లెక్చర్ క్విజ్
అసైన్మెంట్లు
- టాస్క్ 1: పై కోడ్ను మార్చి బిగ్ డేటా మరియు మిషన్ లెర్నింగ్ రంగాలకు సంబంధించిన భావనలను కనుగొనండి
- టాస్క్ 2: డేటా సైన్స్ సన్నివేశాల గురించి ఆలోచించండి
క్రెడిట్స్
ఈ పాఠం ♥️ తో Dmitry Soshnikov రచించారు
అస్పష్టత:
ఈ పత్రాన్ని AI అనువాద సేవ Co-op Translator ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. అసలు పత్రం దాని స్వదేశీ భాషలోనే అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.


