|
2 weeks ago | |
---|---|---|
.. | ||
solution | 3 weeks ago | |
working | 3 weeks ago | |
README.md | 2 weeks ago | |
assignment.md | 3 weeks ago |
README.md
وقت کے سلسلے کی پیش گوئی کا تعارف
خاکہ نوٹ Tomomi Imura کی طرف سے
اس سبق اور اگلے سبق میں، آپ وقت کے سلسلے کی پیش گوئی کے بارے میں کچھ سیکھیں گے، جو مشین لرننگ سائنسدان کے ہنر کا ایک دلچسپ اور قیمتی حصہ ہے، لیکن دیگر موضوعات کے مقابلے میں کم معروف ہے۔ وقت کے سلسلے کی پیش گوئی ایک قسم کی 'جادوئی گیند' ہے: کسی متغیر جیسے قیمت کی ماضی کی کارکردگی کی بنیاد پر، آپ اس کی مستقبل کی ممکنہ قدر کی پیش گوئی کر سکتے ہیں۔
🎥 وقت کے سلسلے کی پیش گوئی کے بارے میں ویڈیو دیکھنے کے لیے اوپر دی گئی تصویر پر کلک کریں
سبق سے پہلے کا کوئز
یہ ایک مفید اور دلچسپ میدان ہے جس کا کاروبار میں حقیقی قدر ہے، کیونکہ اس کا براہ راست اطلاق قیمتوں، انوینٹری، اور سپلائی چین کے مسائل پر ہوتا ہے۔ حالانکہ گہرے سیکھنے کی تکنیکیں بہتر پیش گوئی کے لیے مزید بصیرت حاصل کرنے کے لیے استعمال کی جا رہی ہیں، وقت کے سلسلے کی پیش گوئی اب بھی کلاسک مشین لرننگ تکنیکوں سے بہت زیادہ متاثر ہے۔
پین اسٹیٹ کا مفید وقت کے سلسلے کا نصاب یہاں پایا جا سکتا ہے
تعارف
فرض کریں کہ آپ سمارٹ پارکنگ میٹرز کی ایک صف کو برقرار رکھتے ہیں جو وقت کے ساتھ ساتھ یہ ڈیٹا فراہم کرتے ہیں کہ وہ کتنی بار اور کتنے عرصے تک استعمال ہوتے ہیں۔
کیا ہوگا اگر آپ میٹر کی ماضی کی کارکردگی کی بنیاد پر، سپلائی اور ڈیمانڈ کے قوانین کے مطابق اس کی مستقبل کی قدر کی پیش گوئی کر سکیں؟
صحیح وقت پر عمل کرنے کی پیش گوئی کرنا تاکہ آپ اپنے مقصد کو حاصل کر سکیں، ایک چیلنج ہے جسے وقت کے سلسلے کی پیش گوئی کے ذریعے حل کیا جا سکتا ہے۔ یہ لوگوں کو خوش نہیں کرے گا کہ مصروف اوقات میں جب وہ پارکنگ کی جگہ تلاش کر رہے ہوں تو ان سے زیادہ چارج کیا جائے، لیکن یہ سڑکوں کی صفائی کے لیے آمدنی پیدا کرنے کا ایک یقینی طریقہ ہوگا!
آئیے وقت کے سلسلے کے کچھ الگورتھمز کی اقسام کو دریافت کریں اور کچھ ڈیٹا صاف کرنے اور تیار کرنے کے لیے ایک نوٹ بک شروع کریں۔ وہ ڈیٹا جو آپ تجزیہ کریں گے، GEFCom2014 پیش گوئی کے مقابلے سے لیا گیا ہے۔ اس میں 2012 سے 2014 کے درمیان 3 سال کے گھنٹہ وار بجلی کے لوڈ اور درجہ حرارت کی قدریں شامل ہیں۔ بجلی کے لوڈ اور درجہ حرارت کے تاریخی نمونوں کو دیکھتے ہوئے، آپ بجلی کے لوڈ کی مستقبل کی قدریں پیش گوئی کر سکتے ہیں۔
اس مثال میں، آپ سیکھیں گے کہ صرف تاریخی لوڈ ڈیٹا کا استعمال کرتے ہوئے ایک وقت کے قدم کی پیش گوئی کیسے کی جائے۔ تاہم، شروع کرنے سے پہلے، یہ سمجھنا مفید ہے کہ پردے کے پیچھے کیا ہو رہا ہے۔
کچھ تعریفیں
جب آپ 'وقت کے سلسلے' کی اصطلاح سے سامنا کرتے ہیں، تو آپ کو اس کے مختلف سیاق و سباق میں استعمال کو سمجھنا ہوگا۔
🎓 وقت کے سلسلے
ریاضی میں، "وقت کے سلسلے ڈیٹا پوائنٹس کی ایک سیریز ہے جو وقت کے ترتیب میں انڈیکس کیے گئے (یا درج یا گراف کیے گئے) ہیں۔ عام طور پر، وقت کے سلسلے ایک ترتیب ہے جو وقت کے برابر وقفوں پر لی گئی ہے۔" وقت کے سلسلے کی ایک مثال Dow Jones Industrial Average کی روزانہ بند ہونے والی قدر ہے۔ وقت کے سلسلے کے پلاٹس اور شماریاتی ماڈلنگ کا استعمال اکثر سگنل پروسیسنگ، موسم کی پیش گوئی، زلزلے کی پیش گوئی، اور دیگر شعبوں میں ہوتا ہے جہاں واقعات ہوتے ہیں اور ڈیٹا پوائنٹس وقت کے ساتھ پلاٹ کیے جا سکتے ہیں۔
🎓 وقت کے سلسلے کا تجزیہ
وقت کے سلسلے کا تجزیہ، اوپر ذکر کردہ وقت کے سلسلے کے ڈیٹا کا تجزیہ ہے۔ وقت کے سلسلے کا ڈیٹا مختلف شکلیں لے سکتا ہے، بشمول 'رکاوٹ شدہ وقت کے سلسلے' جو کسی رکاوٹ ڈالنے والے واقعے سے پہلے اور بعد میں وقت کے سلسلے کے ارتقاء میں نمونوں کا پتہ لگاتا ہے۔ وقت کے سلسلے کے لیے مطلوبہ تجزیہ ڈیٹا کی نوعیت پر منحصر ہے۔ وقت کے سلسلے کا ڈیٹا خود نمبروں یا کرداروں کی سیریز کی شکل لے سکتا ہے۔
تجزیہ کرنے کے لیے مختلف طریقے استعمال کیے جاتے ہیں، جن میں فریکوئنسی ڈومین اور وقت ڈومین، لکیری اور غیر لکیری، اور مزید شامل ہیں۔ مزید جانیں کہ اس قسم کے ڈیٹا کا تجزیہ کرنے کے بہت سے طریقے کیا ہیں۔
🎓 وقت کے سلسلے کی پیش گوئی
وقت کے سلسلے کی پیش گوئی ایک ماڈل کا استعمال ہے جو ماضی میں جمع کیے گئے ڈیٹا کے نمونوں کی بنیاد پر مستقبل کی قدریں پیش گوئی کرتا ہے۔ حالانکہ وقت کے انڈیکس کو x متغیر کے طور پر پلاٹ پر استعمال کرتے ہوئے وقت کے سلسلے کے ڈیٹا کو دریافت کرنے کے لیے رجریشن ماڈلز کا استعمال ممکن ہے، ایسے ڈیٹا کو خاص قسم کے ماڈلز کے ذریعے بہترین تجزیہ کیا جاتا ہے۔
وقت کے سلسلے کا ڈیٹا ترتیب وار مشاہدات کی فہرست ہے، جو لکیری رجریشن کے ذریعے تجزیہ کیے جانے والے ڈیٹا سے مختلف ہے۔ سب سے عام ماڈل ARIMA ہے، جو "Autoregressive Integrated Moving Average" کا مخفف ہے۔
ARIMA ماڈلز "ایک سیریز کی موجودہ قدر کو ماضی کی قدروں اور ماضی کی پیش گوئی کی غلطیوں سے جوڑتے ہیں۔" یہ وقت کے ڈومین ڈیٹا کا تجزیہ کرنے کے لیے سب سے زیادہ موزوں ہیں، جہاں ڈیٹا وقت کے ساتھ ترتیب دیا جاتا ہے۔
ARIMA ماڈلز کی کئی اقسام ہیں، جن کے بارے میں آپ یہاں مزید جان سکتے ہیں اور جن پر آپ اگلے سبق میں بات کریں گے۔
اگلے سبق میں، آپ Univariate Time Series کا استعمال کرتے ہوئے ایک ARIMA ماڈل بنائیں گے، جو ایک متغیر پر مرکوز ہے جو وقت کے ساتھ اپنی قدر کو تبدیل کرتا ہے۔ اس قسم کے ڈیٹا کی ایک مثال یہ ڈیٹاسیٹ ہے جو Mauna Loa Observatory میں ماہانہ CO2 کی مقدار کو ریکارڈ کرتا ہے:
CO2 | YearMonth | Year | Month |
---|---|---|---|
330.62 | 1975.04 | 1975 | 1 |
331.40 | 1975.13 | 1975 | 2 |
331.87 | 1975.21 | 1975 | 3 |
333.18 | 1975.29 | 1975 | 4 |
333.92 | 1975.38 | 1975 | 5 |
333.43 | 1975.46 | 1975 | 6 |
331.85 | 1975.54 | 1975 | 7 |
330.01 | 1975.63 | 1975 | 8 |
328.51 | 1975.71 | 1975 | 9 |
328.41 | 1975.79 | 1975 | 10 |
329.25 | 1975.88 | 1975 | 11 |
330.97 | 1975.96 | 1975 | 12 |
✅ اس ڈیٹاسیٹ میں وہ متغیر شناخت کریں جو وقت کے ساتھ تبدیل ہوتا ہے
وقت کے سلسلے کے ڈیٹا کی خصوصیات پر غور کریں
جب آپ وقت کے سلسلے کے ڈیٹا کو دیکھتے ہیں، تو آپ دیکھ سکتے ہیں کہ اس میں کچھ خصوصیات ہیں جنہیں آپ کو بہتر سمجھنے کے لیے مدنظر رکھنا اور کم کرنا ہوگا۔ اگر آپ وقت کے سلسلے کے ڈیٹا کو ممکنہ طور پر ایک 'سگنل' کے طور پر دیکھتے ہیں جسے آپ تجزیہ کرنا چاہتے ہیں، تو ان خصوصیات کو 'شور' کے طور پر سمجھا جا سکتا ہے۔ آپ اکثر ان خصوصیات کو شماریاتی تکنیکوں کا استعمال کرتے ہوئے کم کرنے کی ضرورت محسوس کریں گے۔
یہاں کچھ تصورات ہیں جنہیں آپ کو وقت کے سلسلے کے ساتھ کام کرنے کے قابل ہونے کے لیے جاننا چاہیے:
🎓 رجحانات
رجحانات وقت کے ساتھ قابل پیمائش اضافے اور کمی کے طور پر بیان کیے جاتے ہیں۔ مزید پڑھیں۔ وقت کے سلسلے کے سیاق و سباق میں، یہ اس بارے میں ہے کہ وقت کے سلسلے سے رجحانات کو کیسے استعمال کیا جائے اور، اگر ضروری ہو، ہٹایا جائے۔
موسمیاتی اثرات کو وقتاً فوقتاً اتار چڑھاؤ کے طور پر بیان کیا جاتا ہے، جیسے کہ تعطیلات کے رش جو فروخت کو متاثر کر سکتے ہیں، مثال کے طور پر۔ دیکھیں کہ مختلف قسم کے پلاٹس ڈیٹا میں موسمیاتی اثرات کو کیسے ظاہر کرتے ہیں۔
🎓 غیر معمولی ڈیٹا پوائنٹس
غیر معمولی ڈیٹا پوائنٹس وہ ہوتے ہیں جو معیاری ڈیٹا کے تغیر سے بہت دور ہوتے ہیں۔
🎓 طویل مدتی چکر
موسمیاتی اثرات سے آزاد، ڈیٹا ایک طویل مدتی چکر ظاہر کر سکتا ہے جیسے کہ ایک اقتصادی زوال جو ایک سال سے زیادہ عرصے تک جاری رہتا ہے۔
🎓 مستقل تغیر
وقت کے ساتھ، کچھ ڈیٹا مستقل اتار چڑھاؤ ظاہر کرتا ہے، جیسے دن اور رات کے دوران توانائی کا استعمال۔
🎓 اچانک تبدیلیاں
ڈیٹا اچانک تبدیلی ظاہر کر سکتا ہے جس کے لیے مزید تجزیہ کی ضرورت ہو سکتی ہے۔ مثال کے طور پر، COVID کی وجہ سے کاروباروں کی اچانک بندش نے ڈیٹا میں تبدیلیاں پیدا کیں۔
✅ یہاں ایک نمونہ وقت کے سلسلے کا پلاٹ ہے جو چند سالوں کے دوران روزانہ ان-گیم کرنسی کے خرچ کو ظاہر کرتا ہے۔ کیا آپ اس ڈیٹا میں اوپر دی گئی خصوصیات میں سے کسی کی شناخت کر سکتے ہیں؟
مشق - بجلی کے استعمال کے ڈیٹا کے ساتھ شروعات کریں
آئیے ایک وقت کے سلسلے کا ماڈل بنانے کی شروعات کریں تاکہ ماضی کے استعمال کو دیکھتے ہوئے مستقبل کے بجلی کے استعمال کی پیش گوئی کی جا سکے۔
اس مثال میں ڈیٹا GEFCom2014 پیش گوئی کے مقابلے سے لیا گیا ہے۔ اس میں 2012 سے 2014 کے درمیان 3 سال کے گھنٹہ وار بجلی کے لوڈ اور درجہ حرارت کی قدریں شامل ہیں۔
Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli اور Rob J. Hyndman، "Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond"، International Journal of Forecasting، vol.32، no.3، pp 896-913، July-September، 2016۔
-
اس سبق کے
working
فولڈر میں، notebook.ipynb فائل کھولیں۔ ان لائبریریوں کو شامل کرنے سے شروع کریں جو آپ کو ڈیٹا لوڈ کرنے اور بصری بنانے میں مدد کریں گی:import os import matplotlib.pyplot as plt from common.utils import load_data %matplotlib inline
نوٹ کریں، آپ شامل کردہ
common
فولڈر سے فائلیں استعمال کر رہے ہیں جو آپ کے ماحول کو ترتیب دیتی ہیں اور ڈیٹا کو ڈاؤن لوڈ کرنے کو سنبھالتی ہیں۔ -
اگلا، ڈیٹا کو ایک ڈیٹا فریم کے طور پر
load_data()
اورhead()
کو کال کرتے ہوئے دیکھیں:data_dir = './data' energy = load_data(data_dir)[['load']] energy.head()
آپ دیکھ سکتے ہیں کہ دو کالم ہیں جو تاریخ اور لوڈ کی نمائندگی کرتے ہیں:
load 2012-01-01 00:00:00 2698.0 2012-01-01 01:00:00 2558.0 2012-01-01 02:00:00 2444.0 2012-01-01 03:00:00 2402.0 2012-01-01 04:00:00 2403.0 -
اب، ڈیٹا کو
plot()
کو کال کرتے ہوئے پلاٹ کریں:energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) plt.xlabel('timestamp', fontsize=12) plt.ylabel('load', fontsize=12) plt.show()
-
اب، جولائی 2014 کے پہلے ہفتے کو پلاٹ کریں، اسے
[from date]: [to date]
پیٹرن میںenergy
کے ان پٹ کے طور پر فراہم کرتے ہوئے:energy['2014-07-01':'2014-07-07'].plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) plt.xlabel('timestamp', fontsize=12) plt.ylabel('load', fontsize=12) plt.show()
ایک خوبصورت پلاٹ! ان پلاٹس کو دیکھیں اور دیکھیں کہ آیا آپ اوپر دی گئی خصوصیات میں سے کسی کی شناخت کر سکتے ہیں۔ ڈیٹا کو بصری بنانے سے ہم کیا نتیجہ اخذ کر سکتے ہیں؟
اگلے سبق میں، آپ ایک ARIMA ماڈل بنائیں گے تاکہ کچھ پیش گوئیاں کی جا سکیں۔
🚀چیلنج
ان تمام صنعتوں اور تحقیق کے شعبوں کی فہرست بنائیں جنہیں آپ وقت کے سلسلے کی پیش گوئی سے فائدہ اٹھا سکتے ہیں۔ کیا آپ ان تکنیکوں کے اطلاق کے بارے میں آرٹس، اقتصادیات، ماحولیاتیات، ریٹیل، صنعت، مالیات میں سوچ سکتے ہیں؟ اور کہاں؟
سبق کے بعد کا کوئز
جائزہ اور خود مطالعہ
حالانکہ ہم انہیں یہاں شامل نہیں کریں گے، نیورل نیٹ ورکس کبھی کبھار وقت کے سلسلے کی پیش گوئی کے کلاسک طریقوں کو بہتر بنانے کے لیے استعمال کیے جاتے ہیں۔ ان کے بارے میں مزید پڑھیں اس مضمون میں
اسائنمنٹ
مزید وقت کے سلسلے کو بصری بنائیں
ڈسکلیمر:
یہ دستاویز AI ترجمہ سروس Co-op Translator کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا غیر درستیاں ہو سکتی ہیں۔ اصل دستاویز کو اس کی اصل زبان میں مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ ہم اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے ذمہ دار نہیں ہیں۔