|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| solution | 1 month ago | |
| working | 1 month ago | |
| README.md | 2 weeks ago | |
| assignment.md | 1 month ago | |
README.md
టైమ్ సిరీస్ ఫోర్కాస్టింగ్ పరిచయం
స్కెచ్ నోట్ Tomomi Imura ద్వారా
ఈ పాఠంలో మరియు తదుపరి పాఠంలో, మీరు టైమ్ సిరీస్ ఫోర్కాస్టింగ్ గురించి కొంత తెలుసుకుంటారు, ఇది ఒక ఆసక్తికరమైన మరియు విలువైన భాగం, ఇది ఇతర విషయాల కంటే కొంత తక్కువగా తెలిసినది. టైమ్ సిరీస్ ఫోర్కాస్టింగ్ అనేది ఒక రకమైన 'క్రిస్టల్ బాల్': ధర వంటి ఒక వేరియబుల్ గత ప్రదర్శన ఆధారంగా, మీరు దాని భవిష్యత్తు సామర్థ్య విలువను అంచనా వేయవచ్చు.
🎥 టైమ్ సిరీస్ ఫోర్కాస్టింగ్ గురించి వీడియో కోసం పై చిత్రాన్ని క్లిక్ చేయండి
పాఠం ముందు క్విజ్
ఇది వ్యాపారానికి ప్రత్యక్ష ప్రయోజనాన్ని కలిగించే ఉపయోగకరమైన మరియు ఆసక్తికరమైన రంగం, ధర నిర్ణయం, నిల్వ, మరియు సరఫరా గొలుసు సమస్యలకు ప్రత్యక్ష అన్వయంతో. భవిష్యత్తు ప్రదర్శనను మెరుగ్గా అంచనా వేయడానికి లోతైన అభ్యాస సాంకేతికతలు ఉపయోగించబడుతున్నప్పటికీ, టైమ్ సిరీస్ ఫోర్కాస్టింగ్ క్లాసిక్ ML సాంకేతికతల ద్వారా చాలా సమాచారం పొందిన రంగంగా కొనసాగుతుంది.
Penn State యొక్క ఉపయోగకరమైన టైమ్ సిరీస్ పాఠ్యక్రమం ఇక్కడ చూడవచ్చు
పరిచయం
మీరు ఒక స్మార్ట్ పార్కింగ్ మీటర్ల శ్రేణిని నిర్వహిస్తున్నారని ఊహించుకోండి, అవి ఎంతసేపు మరియు ఎంతసేపు ఉపయోగించబడుతున్నాయో గమనిస్తాయి.
మీటర్ గత ప్రదర్శన ఆధారంగా, సరఫరా మరియు డిమాండ్ చట్టాల ప్రకారం దాని భవిష్య విలువను మీరు అంచనా వేయగలిగితే?
మీ లక్ష్యాన్ని సాధించడానికి ఎప్పుడు చర్య తీసుకోవాలో ఖచ్చితంగా అంచనా వేయడం టైమ్ సిరీస్ ఫోర్కాస్టింగ్ ద్వారా పరిష్కరించదగిన సవాలు. పార్కింగ్ స్థలం కోసం చూస్తున్నప్పుడు బిజీ సమయాల్లో ఎక్కువ చార్జ్ చేయడం ప్రజలను సంతోషపరచదు, కానీ వీధులను శుభ్రపరచడానికి ఆదాయం సృష్టించడానికి ఇది ఖచ్చితమైన మార్గం!
టైమ్ సిరీస్ అల్గోరిథమ్స్ కొన్ని రకాల గురించి తెలుసుకుందాం మరియు కొన్ని డేటాను శుభ్రపరచి సిద్ధం చేయడానికి ఒక నోట్బుక్ ప్రారంభిద్దాం. మీరు విశ్లేషించబోయే డేటా GEFCom2014 ఫోర్కాస్టింగ్ పోటీ నుండి తీసుకోబడింది. ఇది 2012 నుండి 2014 వరకు 3 సంవత్సరాల గంటల వారీ విద్యుత్ లోడ్ మరియు ఉష్ణోగ్రత విలువలను కలిగి ఉంది. విద్యుత్ లోడ్ మరియు ఉష్ణోగ్రత యొక్క చారిత్రక నమూనాలను బట్టి, మీరు భవిష్యత్తు విద్యుత్ లోడ్ విలువలను అంచనా వేయవచ్చు.
ఈ ఉదాహరణలో, మీరు చారిత్రక లోడ్ డేటాను మాత్రమే ఉపయోగించి ఒక టైమ్ స్టెప్ ముందుకు ఫోర్కాస్ట్ చేయడం నేర్చుకుంటారు. ప్రారంభించడానికి ముందు, అయితే, వెనుక జరిగేది ఏమిటో అర్థం చేసుకోవడం ఉపయోగకరం.
కొన్ని నిర్వచనాలు
'టైమ్ సిరీస్' అనే పదం ఎదురైనప్పుడు దాని వాడుకను వివిధ సందర్భాలలో అర్థం చేసుకోవాలి.
🎓 టైమ్ సిరీస్
గణితంలో, "టైమ్ సిరీస్ అనేది సమయ క్రమంలో సూచికలతో (లేదా జాబితా లేదా గ్రాఫ్) ఉన్న డేటా పాయింట్ల శ్రేణి. సాధారణంగా, టైమ్ సిరీస్ అనేది సమయ క్రమంలో సమానంగా విభజించిన వరుసగా తీసుకున్న శ్రేణి." టైమ్ సిరీస్ ఉదాహరణగా డౌ జోన్స్ ఇండస్ట్రియల్ అవరేజ్ యొక్క రోజువారీ ముగింపు విలువ ఉంటుంది. టైమ్ సిరీస్ ప్లాట్లు మరియు గణాంక నమూనా తయారీ సిగ్నల్ ప్రాసెసింగ్, వాతావరణ అంచనా, భూకంప అంచనా మరియు ఇతర రంగాలలో తరచుగా ఉపయోగిస్తారు, అక్కడ సంఘటనలు జరుగుతాయి మరియు డేటా పాయింట్లు సమయంతో ప్లాట్ చేయబడతాయి.
🎓 టైమ్ సిరీస్ విశ్లేషణ
టైమ్ సిరీస్ విశ్లేషణ అనేది పై పేర్కొన్న టైమ్ సిరీస్ డేటా యొక్క విశ్లేషణ. టైమ్ సిరీస్ డేటా విభిన్న రూపాలు తీసుకోవచ్చు, అందులో 'ఇంటరప్ట్ చేసిన టైమ్ సిరీస్' కూడా ఉంటుంది, ఇది ఒక అంతరాయం సంఘటన ముందు మరియు తర్వాత టైమ్ సిరీస్ అభివృద్ధిలో నమూనాలను గుర్తిస్తుంది. టైమ్ సిరీస్ కోసం అవసరమైన విశ్లేషణ డేటా స్వభావంపై ఆధారపడి ఉంటుంది. టైమ్ సిరీస్ డేటా సంఖ్యల లేదా అక్షరాల శ్రేణి రూపంలో ఉండవచ్చు.
విశ్లేషణకు వివిధ పద్ధతులు ఉపయోగిస్తారు, అందులో ఫ్రీక్వెన్సీ-డొమైన్ మరియు టైమ్-డొమైన్, లీనియర్ మరియు నాన్లీనియర్, మరియు మరిన్ని ఉన్నాయి. ఈ రకమైన డేటాను విశ్లేషించే అనేక మార్గాల గురించి ఇంకా తెలుసుకోండి.
🎓 టైమ్ సిరీస్ ఫోర్కాస్టింగ్
టైమ్ సిరీస్ ఫోర్కాస్టింగ్ అనేది గతంలో సేకరించిన డేటా ద్వారా ప్రదర్శించిన నమూనాల ఆధారంగా భవిష్యత్తు విలువలను అంచనా వేయడానికి ఒక నమూనాను ఉపయోగించడం. టైమ్ సిరీస్ డేటాను అన్వేషించడానికి రిగ్రెషన్ నమూనాలను ఉపయోగించడం సాధ్యమే అయినప్పటికీ, టైమ్ సూచికలను x వేరియబుల్స్గా ప్లాట్లో ఉపయోగించి, అలాంటి డేటాను ప్రత్యేక రకాల నమూనాలతో విశ్లేషించడం ఉత్తమం.
టైమ్ సిరీస్ డేటా అనేది ఆర్డర్ చేయబడిన పరిశీలనల జాబితా, ఇది లీనియర్ రిగ్రెషన్ ద్వారా విశ్లేషించదగిన డేటా కాదు. అత్యంత సాధారణమైనది ARIMA, ఇది "ఆటోరెగ్రెసివ్ ఇంటిగ్రేటెడ్ మూవింగ్ అవరేజ్" అనే సంక్షిప్త రూపం.
ARIMA నమూనాలు "ఒక శ్రేణి ప్రస్తుత విలువను గత విలువలు మరియు గత అంచనా లోపాలతో సంబంధపరుస్తాయి." ఇవి టైమ్-డొమైన్ డేటాను విశ్లేషించడానికి అత్యంత అనుకూలంగా ఉంటాయి, అక్కడ డేటా సమయ క్రమంలో ఆర్డర్ చేయబడింది.
ARIMA నమూనాల అనేక రకాలు ఉన్నాయి, వాటిని మీరు ఇక్కడ గురించి తెలుసుకోవచ్చు మరియు తదుపరి పాఠంలో మీరు వాటిని పరిచయం చేస్తారు.
తదుపరి పాఠంలో, మీరు యూనివేరియేట్ టైమ్ సిరీస్ ఉపయోగించి ARIMA నమూనాను నిర్మిస్తారు, ఇది ఒక వేరియబుల్ మాత్రమే సమయంతో మారుతుంది. ఈ రకమైన డేటా ఉదాహరణగా ఈ డేటాసెట్ ఉంది, ఇది మౌనా లోఆ ఆబ్జర్వేటరీలో నెలవారీ C02 సాంద్రతను నమోదు చేస్తుంది:
| CO2 | YearMonth | Year | Month |
|---|---|---|---|
| 330.62 | 1975.04 | 1975 | 1 |
| 331.40 | 1975.13 | 1975 | 2 |
| 331.87 | 1975.21 | 1975 | 3 |
| 333.18 | 1975.29 | 1975 | 4 |
| 333.92 | 1975.38 | 1975 | 5 |
| 333.43 | 1975.46 | 1975 | 6 |
| 331.85 | 1975.54 | 1975 | 7 |
| 330.01 | 1975.63 | 1975 | 8 |
| 328.51 | 1975.71 | 1975 | 9 |
| 328.41 | 1975.79 | 1975 | 10 |
| 329.25 | 1975.88 | 1975 | 11 |
| 330.97 | 1975.96 | 1975 | 12 |
✅ ఈ డేటాసెట్లో సమయంతో మారే వేరియబుల్ను గుర్తించండి
టైమ్ సిరీస్ డేటా లక్షణాలు పరిగణించవలసినవి
టైమ్ సిరీస్ డేటాను పరిశీలించినప్పుడు, దానిలో కొన్ని లక్షణాలు ఉంటాయని గమనించవచ్చు, వాటిని పరిగణలోకి తీసుకుని వాటిని తగ్గించాలి, తద్వారా దాని నమూనాలను మెరుగ్గా అర్థం చేసుకోవచ్చు. మీరు టైమ్ సిరీస్ డేటాను ఒక 'సిగ్నల్'గా భావిస్తే, ఈ లక్షణాలు 'శబ్దం'గా భావించవచ్చు. ఈ 'శబ్దం'ని కొంతమేర తగ్గించడానికి గణాంక సాంకేతికతలు ఉపయోగించి ఈ లక్షణాలను ఆఫ్సెట్ చేయాల్సి ఉంటుంది.
టైమ్ సిరీస్తో పని చేయడానికి మీరు తెలుసుకోవలసిన కొన్ని భావనలు:
🎓 ట్రెండ్లు
ట్రెండ్లు అనేవి సమయంతో కొలవదగిన పెరుగుదలలు మరియు తగ్గుదలలు. ఇంకా చదవండి. టైమ్ సిరీస్ సందర్భంలో, ట్రెండ్లను ఎలా ఉపయోగించాలి మరియు అవసరమైతే వాటిని ఎలా తొలగించాలి అనేది.
సీజనాలిటీ అనేది కాలపరిమితి మార్పులు, ఉదాహరణకు సెలవుల సమయంలో అమ్మకాలు పెరగడం. చూడండి వివిధ రకాల ప్లాట్లు డేటాలో సీజనాలిటీని ఎలా చూపిస్తాయో.
🎓 అత్యంత భిన్నమైన విలువలు (Outliers)
అత్యంత భిన్నమైన విలువలు సాధారణ డేటా వ్యత్యాసం నుండి చాలా దూరంగా ఉంటాయి.
🎓 దీర్ఘకాలిక చక్రం
సీజనాలిటీకి సంబంధం లేకుండా, డేటా దీర్ఘకాలిక చక్రాన్ని చూపవచ్చు, ఉదాహరణకు ఆర్థిక మాంద్యం ఇది ఒక సంవత్సరం కంటే ఎక్కువకాలం ఉండవచ్చు.
🎓 స్థిరమైన వ్యత్యాసం
సమయంతో, కొన్ని డేటా స్థిరమైన మార్పులను చూపుతాయి, ఉదాహరణకు రోజూ మరియు రాత్రి విద్యుత్ వినియోగం.
🎓 అचानक మార్పులు
డేటా ఒక అకస్మాత్తు మార్పును చూపవచ్చు, దీనికి మరింత విశ్లేషణ అవసరం. ఉదాహరణకు COVID కారణంగా వ్యాపారాల అకస్మాత్తు మూసివేత డేటాలో మార్పులు కలిగించింది.
✅ ఇది ఒక నమూనా టైమ్ సిరీస్ ప్లాట్, ఇది కొన్ని సంవత్సరాల పాటు రోజువారీ గేమ్ కరెన్సీ ఖర్చును చూపిస్తుంది. మీరు పై పేర్కొన్న లక్షణాలలో ఏవైనా ఈ డేటాలో గుర్తించగలరా?
వ్యాయామం - విద్యుత్ వినియోగ డేటాతో ప్రారంభం
గత వినియోగం ఆధారంగా భవిష్యత్తు విద్యుత్ వినియోగాన్ని అంచనా వేయడానికి టైమ్ సిరీస్ నమూనాను సృష్టించడం ప్రారంభిద్దాం.
ఈ ఉదాహరణలో డేటా GEFCom2014 ఫోర్కాస్టింగ్ పోటీ నుండి తీసుకోబడింది. ఇది 2012 నుండి 2014 వరకు 3 సంవత్సరాల గంటల వారీ విద్యుత్ లోడ్ మరియు ఉష్ణోగ్రత విలువలను కలిగి ఉంది.
Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli మరియు Rob J. Hyndman, "Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond", International Journal of Forecasting, vol.32, no.3, pp 896-913, July-September, 2016.
-
ఈ పాఠం యొక్క
workingఫోల్డర్లో, notebook.ipynb ఫైల్ను తెరవండి. డేటాను లోడ్ చేసి దృశ్యీకరించడానికి సహాయపడే లైబ్రరీలను జోడించడం ప్రారంభించండిimport os import matplotlib.pyplot as plt from common.utils import load_data %matplotlib inlineగమనిక, మీరు చేర్చబడిన
commonఫోల్డర్ నుండి ఫైళ్లను ఉపయోగిస్తున్నారు, ఇది మీ వాతావరణాన్ని సెట్ చేస్తుంది మరియు డేటాను డౌన్లోడ్ చేయడాన్ని నిర్వహిస్తుంది. -
తరువాత,
load_data()మరియుhead()పిలిచి డేటాను డేటాఫ్రేమ్గా పరిశీలించండి:data_dir = './data' energy = load_data(data_dir)[['load']] energy.head()మీరు రెండు కాలమ్స్ ఉన్నాయని చూడవచ్చు, అవి తేదీ మరియు లోడ్ను సూచిస్తాయి:
load 2012-01-01 00:00:00 2698.0 2012-01-01 01:00:00 2558.0 2012-01-01 02:00:00 2444.0 2012-01-01 03:00:00 2402.0 2012-01-01 04:00:00 2403.0 -
ఇప్పుడు,
plot()పిలిచి డేటాను ప్లాట్ చేయండి:energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) plt.xlabel('timestamp', fontsize=12) plt.ylabel('load', fontsize=12) plt.show() -
ఇప్పుడు, 2014 జూలై మొదటి వారాన్ని
[from date]: [to date]నమూనాలోenergyకి ఇన్పుట్గా అందించి ప్లాట్ చేయండి:energy['2014-07-01':'2014-07-07'].plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) plt.xlabel('timestamp', fontsize=12) plt.ylabel('load', fontsize=12) plt.show()ఒక అందమైన ప్లాట్! ఈ ప్లాట్లను పరిశీలించి పై పేర్కొన్న లక్షణాలలో ఏవైనా మీరు గుర్తించగలరా? డేటాను దృశ్యీకరించడం ద్వారా మనం ఏమి అర్థం చేసుకోవచ్చు?
తదుపరి పాఠంలో, మీరు ARIMA నమూనాను సృష్టించి కొన్ని ఫోర్కాస్ట్లు తయారు చేస్తారు.
🚀సవాలు
టైమ్ సిరీస్ ఫోర్కాస్టింగ్ నుండి లాభపడే అన్ని పరిశ్రమలు మరియు పరిశోధనా రంగాల జాబితాను తయారు చేయండి. ఈ సాంకేతికతలను కళల్లో, ఆర్థిక శాస్త్రంలో, పర్యావరణ శాస్త్రంలో, రిటైల్, పరిశ్రమ, ఆర్థిక రంగాలలో ఎలా ఉపయోగించవచ్చో మీరు ఆలోచించగలరా? మరెక్కడ?
పాఠం తర్వాత క్విజ్
సమీక్ష & స్వీయ అధ్యయనం
ఇక్కడ మనం చర్చించకపోయినా, న్యూరల్ నెట్వర్క్స్ కొన్నిసార్లు టైమ్ సిరీస్ ఫోర్కాస్టింగ్ యొక్క క్లాసిక్ పద్ధతులను మెరుగుపరచడానికి ఉపయోగిస్తారు. వాటి గురించి ఈ వ్యాసంలో మరింత చదవండి
అసైన్మెంట్
మరిన్ని టైమ్ సిరీస్లను దృశ్యీకరించండి
అస్పష్టత:
ఈ పత్రాన్ని AI అనువాద సేవ Co-op Translator ఉపయోగించి అనువదించబడింది. మేము ఖచ్చితత్వానికి ప్రయత్నించినప్పటికీ, ఆటోమేటెడ్ అనువాదాల్లో పొరపాట్లు లేదా తప్పిదాలు ఉండవచ్చు. మూల పత్రం దాని స్వదేశీ భాషలో అధికారిక మూలంగా పరిగణించాలి. ముఖ్యమైన సమాచారానికి, ప్రొఫెషనల్ మానవ అనువాదం సిఫార్సు చేయబడుతుంది. ఈ అనువాదం వాడకంలో ఏర్పడిన ఏవైనా అపార్థాలు లేదా తప్పుదారుల కోసం మేము బాధ్యత వహించము.




