You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
ML-For-Beginners/translations/ne/7-TimeSeries/1-Introduction
leestott f915efe2b4
🌐 Update translations via Co-op Translator
2 weeks ago
..
solution 🌐 Update translations via Co-op Translator 3 weeks ago
working 🌐 Update translations via Co-op Translator 3 weeks ago
README.md 🌐 Update translations via Co-op Translator 2 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

समय श्रृंखला पूर्वानुमानको परिचय

समय श्रृंखला को स्केच नोटमा सारांश

स्केच नोट Tomomi Imura द्वारा

यस पाठ र अर्को पाठमा, तपाईं समय श्रृंखला पूर्वानुमानको बारेमा केही सिक्नुहुनेछ, जुन मेसिन लर्निङ वैज्ञानिकको ज्ञानको महत्त्वपूर्ण र मूल्यवान भाग हो, तर अन्य विषयहरूको तुलनामा अलिक कम परिचित छ। समय श्रृंखला पूर्वानुमान एक प्रकारको 'क्रिस्टल बल' जस्तै हो: जस्तै मूल्य जस्ता भूतकालीन प्रदर्शनको आधारमा, यसको भविष्यको सम्भावित मूल्यको भविष्यवाणी गर्न सकिन्छ।

समय श्रृंखला पूर्वानुमानको परिचय

🎥 माथिको तस्बिरमा क्लिक गरेर समय श्रृंखला पूर्वानुमानको बारेमा भिडियो हेर्नुहोस्

पाठ अघि क्विज

यो एउटा उपयोगी र रोचक क्षेत्र हो जसले व्यवसायलाई प्रत्यक्ष रूपमा मूल्य प्रदान गर्दछ, विशेष गरी मूल्य निर्धारण, इन्वेन्टरी, र आपूर्ति श्रृंखला समस्याहरूको समाधानमा यसको प्रयोगका कारण। गहिरो सिकाइ प्रविधिहरूले भविष्यको प्रदर्शनलाई अझ राम्रोसँग भविष्यवाणी गर्न थप जानकारी प्राप्त गर्न प्रयोग गर्न थालिएको भए तापनि, समय श्रृंखला पूर्वानुमान अझै पनि क्लासिक मेसिन लर्निङ प्रविधिहरूबाट धेरै प्रभावित क्षेत्र हो।

पेन स्टेटको उपयोगी समय श्रृंखला पाठ्यक्रम यहाँ फेला पार्न सकिन्छ।

परिचय

मानौं तपाईंले स्मार्ट पार्किङ मिटरहरूको एउटा समूह व्यवस्थापन गर्नुहुन्छ, जसले समयसँगै तिनीहरूको प्रयोग र अवधि सम्बन्धी डेटा प्रदान गर्दछ।

के तपाईं मिटरको भूतकालीन प्रदर्शनको आधारमा, आपूर्ति र मागको नियम अनुसार यसको भविष्यको मूल्यको भविष्यवाणी गर्न सक्नुहुन्छ?

तपाईंको लक्ष्य प्राप्त गर्न कहिले कार्य गर्नुपर्छ भनेर सही रूपमा भविष्यवाणी गर्नु समय श्रृंखला पूर्वानुमानले समाधान गर्न सक्ने चुनौती हो। व्यस्त समयमा पार्किङ स्थान खोज्दै गर्दा बढी शुल्क तिर्नु पर्ने कुरा मानिसहरूलाई खुसी बनाउने छैन, तर यो सडक सफा गर्न राजस्व उत्पन्न गर्ने निश्चित उपाय हुनेछ!

हामी समय श्रृंखला एल्गोरिदमका केही प्रकारहरूको अन्वेषण गरौं र केही डेटा सफा र तयार गर्न नोटबुक सुरु गरौं। तपाईंले विश्लेषण गर्ने डेटा GEFCom2014 पूर्वानुमान प्रतियोगिताबाट लिइएको हो। यसमा २०१२ देखि २०१४ सम्मको ३ वर्षको घण्टाको आधारमा बिजुली लोड र तापक्रमको मानहरू समावेश छन्। बिजुली लोड र तापक्रमको ऐतिहासिक ढाँचाहरूलाई ध्यानमा राख्दै, तपाईं बिजुली लोडको भविष्यको मानहरूको भविष्यवाणी गर्न सक्नुहुन्छ।

यस उदाहरणमा, तपाईंले केवल ऐतिहासिक लोड डेटा प्रयोग गरेर एक समय चरण अगाडि भविष्यवाणी गर्न सिक्नुहुनेछ। तर सुरु गर्नु अघि, पर्दा पछाडि के भइरहेको छ भन्ने कुरा बुझ्नु उपयोगी हुन्छ।

केही परिभाषाहरू

'समय श्रृंखला' शब्द सुन्दा, तपाईंले यसलाई विभिन्न सन्दर्भहरूमा प्रयोग गरिने कुरा बुझ्न आवश्यक छ।

🎓 समय श्रृंखला

गणितमा, "समय श्रृंखला भनेको समयको क्रममा अनुक्रमित (वा सूचीबद्ध वा ग्राफ गरिएको) डेटा बिन्दुहरूको श्रृंखला हो। सामान्यतया, समय श्रृंखला भनेको समयको समान अन्तरालमा लिइएको अनुक्रम हो।" समय श्रृंखलाको उदाहरण भनेको Dow Jones Industrial Average को दैनिक बन्द मूल्य हो। समय श्रृंखला प्लट र सांख्यिकीय मोडलिङको प्रयोग प्रायः सिग्नल प्रोसेसिङ, मौसम पूर्वानुमान, भूकम्पको भविष्यवाणी, र अन्य क्षेत्रहरूमा पाइन्छ, जहाँ घटनाहरू हुन्छन् र डेटा बिन्दुहरू समयसँगै प्लट गर्न सकिन्छ।

🎓 समय श्रृंखला विश्लेषण

समय श्रृंखला विश्लेषण भनेको माथि उल्लिखित समय श्रृंखला डेटाको विश्लेषण हो। समय श्रृंखला डेटा फरक-फरक रूप लिन सक्छ, जस्तै 'अवरोधित समय श्रृंखला', जसले कुनै अवरोधक घटनाको अघि र पछि समय श्रृंखलाको विकासमा ढाँचाहरू पत्ता लगाउँछ। समय श्रृंखलाको लागि आवश्यक विश्लेषण, डेटाको प्रकृतिमा निर्भर गर्दछ। समय श्रृंखला डेटा आफैंले संख्याहरू वा अक्षरहरूको श्रृंखलाको रूपमा रूप लिन सक्छ।

विश्लेषण गर्नका लागि विभिन्न विधिहरू प्रयोग गरिन्छ, जस्तै फ्रिक्वेन्सी-डोमेन र समय-डोमेन, रेखीय र गैर-रेखीय, र अन्य। थप जान्नुहोस् यस प्रकारको डेटा विश्लेषण गर्ने धेरै तरिकाहरूको बारेमा।

🎓 समय श्रृंखला पूर्वानुमान

समय श्रृंखला पूर्वानुमान भनेको भूतकालमा संकलित डेटाले देखाएको ढाँचाहरूको आधारमा भविष्यका मानहरूको भविष्यवाणी गर्न मोडेलको प्रयोग हो। समय श्रृंखला डेटाको अन्वेषण गर्न रेखीय प्रतिगमन मोडेलहरू प्रयोग गर्न सम्भव भए तापनि, समय सूचकांकहरूलाई प्लटमा x चरहरूका रूपमा प्रयोग गरेर, यस्तो डेटा विशेष प्रकारका मोडेलहरू प्रयोग गरेर विश्लेषण गर्न उत्तम हुन्छ।

समय श्रृंखला डेटा भनेको क्रमबद्ध अवलोकनहरूको सूची हो, जुन रेखीय प्रतिगमनद्वारा विश्लेषण गर्न सकिने डेटाभन्दा फरक हुन्छ। सबैभन्दा सामान्य मोडेल ARIMA हो, जसको अर्थ "Autoregressive Integrated Moving Average" हो।

ARIMA मोडेलहरू "श्रृंखलाको वर्तमान मानलाई भूतकालीन मानहरू र भूतकालीन भविष्यवाणी त्रुटिहरूसँग सम्बन्धित गर्दछ।" यी मोडेलहरू समय-डोमेन डेटाको विश्लेषणका लागि सबैभन्दा उपयुक्त हुन्छन्, जहाँ डेटा समयसँगै क्रमबद्ध हुन्छ।

ARIMA मोडेलका विभिन्न प्रकारहरू छन्, जसको बारेमा तपाईं यहाँ जान्न सक्नुहुन्छ र तपाईंले अर्को पाठमा यसलाई छुनुहुनेछ।

अर्को पाठमा, तपाईं Univariate Time Series प्रयोग गरेर ARIMA मोडेल निर्माण गर्नुहुनेछ, जसले समयसँगै आफ्नो मान परिवर्तन गर्ने एक चरमा केन्द्रित हुन्छ। यस्तो प्रकारको डेटाको उदाहरण यो डेटासेट हो, जसले Mauna Loa Observatory मा मासिक CO2 सांद्रता रेकर्ड गर्दछ:

CO2 YearMonth Year Month
330.62 1975.04 1975 1
331.40 1975.13 1975 2
331.87 1975.21 1975 3
333.18 1975.29 1975 4
333.92 1975.38 1975 5
333.43 1975.46 1975 6
331.85 1975.54 1975 7
330.01 1975.63 1975 8
328.51 1975.71 1975 9
328.41 1975.79 1975 10
329.25 1975.88 1975 11
330.97 1975.96 1975 12

यस डेटासेटमा समयसँगै परिवर्तन हुने चरलाई पहिचान गर्नुहोस्।

समय श्रृंखला डेटाका विशेषताहरू विचार गर्नुहोस्

समय श्रृंखला डेटा हेर्दा, तपाईंले यसमा केही विशेषताहरू देख्न सक्नुहुन्छ, जसलाई तपाईंले ध्यानमा राख्न र यसको ढाँचाहरूलाई राम्रोसँग बुझ्नका लागि कम गर्न आवश्यक पर्छ। यदि तपाईं समय श्रृंखला डेटालाई सम्भावित रूपमा 'सिग्नल' प्रदान गर्ने रूपमा विचार गर्नुहुन्छ, जसलाई तपाईं विश्लेषण गर्न चाहनुहुन्छ, यी विशेषताहरूलाई 'हल्ला' को रूपमा सोच्न सकिन्छ। तपाईंले प्रायः केही सांख्यिकीय प्रविधिहरू प्रयोग गरेर यो 'हल्ला' कम गर्न आवश्यक पर्छ।

यहाँ समय श्रृंखलासँग काम गर्नका लागि तपाईंले जान्नुपर्ने केही अवधारणाहरू छन्:

🎓 प्रवृत्ति (Trends)

प्रवृत्तिहरू समयसँगै मापन गर्न सकिने वृद्धि र घटावटहरू हुन्। थप पढ्नुहोस्। समय श्रृंखलाको सन्दर्भमा, यो प्रवृत्तिहरूलाई कसरी प्रयोग गर्ने र आवश्यक परेमा समय श्रृंखलाबाट हटाउने बारेमा हो।

🎓 मौसमीपन (Seasonality)

मौसमीपन भनेको आवधिक उतारचढाव हो, जस्तै छुट्टीको समयमा बिक्रीमा पर्ने प्रभाव। यहाँ हेर्नुहोस् कसरी विभिन्न प्रकारका प्लटहरूले डेटामा मौसमीपन देखाउँछन्।

🎓 असामान्य मान (Outliers)

असामान्य मानहरू भनेको मानक डेटा भिन्नताबाट धेरै टाढा हुने डेटा हो।

🎓 दीर्घकालीन चक्र (Long-run cycle)

मौसमीपनबाट स्वतन्त्र, डेटाले दीर्घकालीन चक्र देखाउन सक्छ, जस्तै एक वर्षभन्दा लामो समयसम्म चल्ने आर्थिक मन्दी।

🎓 निरन्तर भिन्नता (Constant variance)

समयसँगै, केही डेटाले निरन्तर उतारचढाव देखाउँछ, जस्तै दिन र रातको ऊर्जा प्रयोग।

🎓 अचानक परिवर्तन (Abrupt changes)

डेटाले अचानक परिवर्तन देखाउन सक्छ, जसले थप विश्लेषणको आवश्यकता पर्न सक्छ। उदाहरणका लागि, COVID का कारण व्यवसायहरूको अचानक बन्दले डेटामा परिवर्तन ल्यायो।

यहाँ एक नमूना समय श्रृंखला प्लट छ, जसले केही वर्षहरूमा दैनिक इन-गेम मुद्रा खर्च देखाउँछ। के तपाईं माथि सूचीबद्ध कुनै पनि विशेषताहरू यस डेटामा पहिचान गर्न सक्नुहुन्छ?

इन-गेम मुद्रा खर्च

अभ्यास - बिजुली प्रयोग डेटा सुरु गर्दै

आउनुहोस्, भूतकालीन प्रयोगको आधारमा भविष्यको बिजुली प्रयोगको भविष्यवाणी गर्न समय श्रृंखला मोडेल सिर्जना गर्न सुरु गरौं।

यस उदाहरणमा प्रयोग गरिएको डेटा GEFCom2014 पूर्वानुमान प्रतियोगिताबाट लिइएको हो। यसमा २०१२ देखि २०१४ सम्मको ३ वर्षको घण्टाको आधारमा बिजुली लोड र तापक्रमको मानहरू समावेश छन्।

Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli र Rob J. Hyndman, "Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond", International Journal of Forecasting, vol.32, no.3, pp 896-913, July-September, 2016।

  1. यस पाठको working फोल्डरमा, notebook.ipynb फाइल खोल्नुहोस्। डेटा लोड र दृश्यात्मक बनाउन मद्दत गर्ने पुस्तकालयहरू थपेर सुरु गर्नुहोस्:

    import os
    import matplotlib.pyplot as plt
    from common.utils import load_data
    %matplotlib inline
    

    ध्यान दिनुहोस्, तपाईंले समावेश गरिएको common फोल्डरबाट फाइलहरू प्रयोग गर्दै हुनुहुन्छ, जसले तपाईंको वातावरण सेटअप गर्दछ र डेटालाई डाउनलोड गर्न सम्हाल्छ।

  2. त्यसपछि, load_data()head() कल गरेर डेटालाई डेटा फ्रेमको रूपमा जाँच गर्नुहोस्:

    data_dir = './data'
    energy = load_data(data_dir)[['load']]
    energy.head()
    

    तपाईं देख्न सक्नुहुन्छ कि त्यहाँ मिति र लोड प्रतिनिधित्व गर्ने दुई स्तम्भहरू छन्:

    load
    2012-01-01 00:00:00 2698.0
    2012-01-01 01:00:00 2558.0
    2012-01-01 02:00:00 2444.0
    2012-01-01 03:00:00 2402.0
    2012-01-01 04:00:00 2403.0
  3. अब, plot() कल गरेर डेटालाई प्लट गर्नुहोस्:

    energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)
    plt.xlabel('timestamp', fontsize=12)
    plt.ylabel('load', fontsize=12)
    plt.show()
    

    बिजुली प्लट

  4. अब, २०१४ को जुलाई महिनाको पहिलो हप्ता प्लट गर्नुहोस्, [from date]: [to date] ढाँचामा energy लाई इनपुट प्रदान गरेर:

    energy['2014-07-01':'2014-07-07'].plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)
    plt.xlabel('timestamp', fontsize=12)
    plt.ylabel('load', fontsize=12)
    plt.show()
    

    जुलाई

    एक सुन्दर प्लट! यी प्लटहरू हेर्नुहोस् र माथि सूचीबद्ध कुनै पनि विशेषताहरू निर्धारण गर्न सक्नुहुन्छ कि हेर्नुहोस्। डेटालाई दृश्यात्मक बनाएर हामी के निष्कर्ष निकाल्न सक्छौं?

अर्को पाठमा, तपाईं ARIMA मोडेल सिर्जना गरेर केही पूर्वानुमानहरू बनाउनुहुनेछ।


🚀 चुनौती

तपाईंले सोच्न सक्ने सबै उद्योगहरू र अनुसन्धानका क्षेत्रहरूको सूची बनाउनुहोस्, जसले समय श्रृंखला पूर्वानुमानबाट लाभ उठाउन सक्छ। के तपाईं यी प्रविधिहरूको प्रयोग कलामा, अर्थशास्त्रमा, पारिस्थितिकीमा, खुद्रा व्यापारमा, उद्योगमा, वित्तमा, वा अन्यत्र गर्न सकिने कुनै अनुप्रयोग सोच्न सक्नुहुन्छ?

पाठ पछि क्विज

समीक्षा र आत्म अध्ययन

यद्यपि हामी यहाँ कभर गर्ने छैनौं, न्यूरल नेटवर्कहरू कहिलेकाहीँ समय श्रृंखला पूर्वानुमानका क्लासिक विधिहरूलाई सुधार गर्न प्रयोग गरिन्छ। यस लेखमा तिनीहरूको बारेमा थप पढ्नुहोस्।

असाइनमेन्ट

थप समय श्रृंखला दृश्यात्मक बनाउनुहोस्


अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरी अनुवाद गरिएको हो। हामी यथासम्भव सटीकता सुनिश्चित गर्न प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषामा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्त्वपूर्ण जानकारीका लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याको लागि हामी जिम्मेवार हुने छैनौं।