update-translations
parent
98394876e6
commit
4efb2e21ed
@ -1,80 +1,125 @@
|
||||
# ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਤਕਨੀਕਾਂ
|
||||
# ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀਆਂ ਤਕਨੀਕਾਂ
|
||||
|
||||
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਬਣਾਉਣ, ਵਰਤਣ ਅਤੇ ਰੱਖ-ਰਖਾਵ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਅਤੇ ਉਹ ਡਾਟਾ ਜੋ ਇਹ ਮਾਡਲ ਵਰਤਦੇ ਹਨ, ਕਈ ਹੋਰ ਵਿਕਾਸ ਕਾਰਜਪ੍ਰਣਾਲੀਆਂ ਤੋਂ ਬਹੁਤ ਵੱਖਰੀ ਹੈ। ਇਸ ਪਾਠ ਵਿੱਚ, ਅਸੀਂ ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਪਸ਼ਟ ਕਰਾਂਗੇ ਅਤੇ ਮੁੱਖ ਤਕਨੀਕਾਂ ਦੀ ਰੂਪਰੇਖਾ ਪੇਸ਼ ਕਰਾਂਗੇ ਜੋ ਤੁਹਾਨੂੰ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ। ਤੁਸੀਂ:
|
||||
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਬਣਾਉਣ, ਵਰਤਣ ਅਤੇ ਸੰਭਾਲਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਅਤੇ ਉਹ ਡਾਟਾ ਜੋ ਇਹ ਵਰਤਦੇ ਹਨ, ਬਹੁਤ ਵੱਖਰੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਬਾਕੀ ਕਈ ਦੂਜੇ ਵਿਕਾਸ ਕੌਰਸਾਂ ਤੋਂ। ਇਸ ਪਾਠ ਵਿੱਚ, ਅਸੀਂ ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਧਾਰਣ ਕਰਾਂਗੇ, ਅਤੇ ਮੁੱਖ ਤਕਨੀਕਾਂ ਨੂੰ ਰੂਪਰੇਖਾ ਵਿੱਚ ਪੇਸ਼ ਕਰਾਂਗੇ ਜੋ ਤੁਹਾਨੂੰ ਜਾਣਣੀ ਲਾਜ਼ਮੀ ਹਨ। ਤੁਸੀਂ:
|
||||
|
||||
- ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਅਧਾਰਤ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਉੱਚ ਪੱਧਰ 'ਤੇ ਸਮਝੋਗੇ।
|
||||
- 'ਮਾਡਲ', 'ਪ੍ਰਿਡਿਕਸ਼ਨ', ਅਤੇ 'ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ' ਵਰਗੇ ਬੁਨਿਆਦੀ ਧਾਰਨਾਵਾਂ ਦੀ ਖੋਜ ਕਰੋਗੇ।
|
||||
- ਉੱਚ ਪੱਧਰ 'ਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਅਧਾਰਭੂਤ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਸਮਝੋਗੇ।
|
||||
- 'ਮਾਡਲ', 'ਭਵਿੱਖਬਾਣੀਆਂ', ਅਤੇ 'ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ' ਵਰਗੀਆਂ ਮੂਢ ਤਕਨੀਕਾਂ ਦੀ ਖੋਜ ਕਰੋਂਗੇ।
|
||||
|
||||
## [ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ml/)
|
||||
## [ਪ੍ਰੀ-ਲੇਕਚਰ ਕਿਊਜ਼](https://ff-quizzes.netlify.app/en/ml/)
|
||||
|
||||
[](https://youtu.be/4NGM0U2ZSHU "ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਲਈ ਸ਼ੁਰੂਆਤੀ - ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਤਕਨੀਕਾਂ")
|
||||
[](https://youtu.be/4NGM0U2ZSHU "ML for beginners - Techniques of Machine Learning")
|
||||
|
||||
> 🎥 ਉਪਰ ਦਿੱਤੀ ਤਸਵੀਰ 'ਤੇ ਕਲਿਕ ਕਰੋ ਇਸ ਪਾਠ ਨੂੰ ਸਮਝਣ ਲਈ ਇੱਕ ਛੋਟੀ ਵੀਡੀਓ ਦੇਖਣ ਲਈ।
|
||||
> 🎥 ਇਸ ਪਾਠ ਨੂੰ ਸਮਝਾਉਂਦੇ ਛੋਟੇ ਵੀਡੀਓ ਲਈ ਉਪਰ ਦਿੱਤੀ ਤਸਵੀਰ 'ਤੇ ਕਲਿਕ ਕਰੋ।
|
||||
|
||||
## ਪਰਿਚਯ
|
||||
|
||||
ਉੱਚ ਪੱਧਰ 'ਤੇ, ਮਸ਼ੀਨ ਲਰਨਿੰਗ (ML) ਪ੍ਰਕਿਰਿਆਵਾਂ ਬਣਾਉਣ ਦੀ ਕਲਾ ਕਈ ਕਦਮਾਂ 'ਤੇ ਆਧਾਰਿਤ ਹੈ:
|
||||
ਸਰਵੋচ্চ ਪੱਧਰ 'ਤੇ, ਮਸ਼ੀਨ ਲਰਨਿੰਗ (ML) ਪ੍ਰਕਿਰਿਆਵਾਂ ਬਣਾਉਣ ਦਾ ਹੁਨਰ ਕਈ ਕਦਮਾਂ 'ਤੇ مشتمل ਹੁੰਦਾ ਹੈ:
|
||||
|
||||
1. **ਸਵਾਲ ਤੈਅ ਕਰੋ**। ਜ਼ਿਆਦਾਤਰ ML ਪ੍ਰਕਿਰਿਆਵਾਂ ਇੱਕ ਸਵਾਲ ਪੁੱਛਣ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦੀਆਂ ਹਨ ਜੋ ਸਧਾਰਨ ਸ਼ਰਤਾਂ ਵਾਲੇ ਪ੍ਰੋਗਰਾਮ ਜਾਂ ਨਿਯਮ-ਅਧਾਰਿਤ ਇੰਜਨ ਦੁਆਰਾ ਹੱਲ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ। ਇਹ ਸਵਾਲ ਅਕਸਰ ਡਾਟਾ ਦੇ ਇਕੱਠ 'ਤੇ ਆਧਾਰਿਤ ਅਨੁਮਾਨਾਂ ਦੇ ਆਸ-ਪਾਸ ਹੁੰਦੇ ਹਨ।
|
||||
2. **ਡਾਟਾ ਇਕੱਠਾ ਕਰੋ ਅਤੇ ਤਿਆਰ ਕਰੋ**। ਆਪਣੇ ਸਵਾਲ ਦਾ ਜਵਾਬ ਦੇਣ ਲਈ ਤੁਹਾਨੂੰ ਡਾਟਾ ਦੀ ਲੋੜ ਹੈ। ਤੁਹਾਡੇ ਡਾਟਾ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਕਈ ਵਾਰ ਮਾਤਰਾ ਇਹ ਤੈਅ ਕਰੇਗੀ ਕਿ ਤੁਸੀਂ ਆਪਣੇ ਮੁਢਲੇ ਸਵਾਲ ਦਾ ਜਵਾਬ ਕਿੰਨਾ ਚੰਗਾ ਦੇ ਸਕਦੇ ਹੋ। ਡਾਟਾ ਨੂੰ ਵਿਜ਼ੁਅਲਾਈਜ਼ ਕਰਨਾ ਇਸ ਚਰਨ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪਹਲੂ ਹੈ। ਇਸ ਚਰਨ ਵਿੱਚ ਡਾਟਾ ਨੂੰ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਟੈਸਟਿੰਗ ਸਮੂਹ ਵਿੱਚ ਵੰਡਣਾ ਵੀ ਸ਼ਾਮਲ ਹੈ ਤਾਂ ਜੋ ਮਾਡਲ ਬਣਾਇਆ ਜਾ ਸਕੇ।
|
||||
3. **ਟ੍ਰੇਨਿੰਗ ਵਿਧੀ ਚੁਣੋ**। ਤੁਹਾਡੇ ਸਵਾਲ ਅਤੇ ਡਾਟਾ ਦੀ ਪ੍ਰਕਿਰਤੀ ਦੇ ਆਧਾਰ 'ਤੇ, ਤੁਹਾਨੂੰ ਇਹ ਚੁਣਨਾ ਪਵੇਗਾ ਕਿ ਮਾਡਲ ਨੂੰ ਕਿਵੇਂ ਟ੍ਰੇਨ ਕਰਨਾ ਹੈ ਤਾਂ ਜੋ ਇਹ ਤੁਹਾਡੇ ਡਾਟਾ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਦਰਸਾ ਸਕੇ ਅਤੇ ਇਸ 'ਤੇ ਸਹੀ ਅਨੁਮਾਨ ਲਗਾ ਸਕੇ।
|
||||
4. **ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰੋ**। ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਐਲਗੋਰਿਥਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਨੂੰ ਡਾਟਾ ਵਿੱਚ ਪੈਟਰਨਾਂ ਨੂੰ ਪਛਾਣਨ ਲਈ ਟ੍ਰੇਨ ਕਰਦੇ ਹੋ। ਮਾਡਲ ਅੰਦਰੂਨੀ ਵਜ਼ਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਡਾਟਾ ਦੇ ਕੁਝ ਹਿੱਸਿਆਂ ਨੂੰ ਹੋਰਾਂ ਦੇ ਉੱਤੇ ਤਰਜੀਹ ਦੇਣ ਲਈ ਸਮਰਥਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
|
||||
5. **ਮਾਡਲ ਦਾ ਮੁਲਾਂਕਨ ਕਰੋ**। ਤੁਸੀਂ ਆਪਣੇ ਇਕੱਠੇ ਕੀਤੇ ਸੈਟ ਵਿੱਚੋਂ ਪਹਿਲਾਂ ਕਦੇ ਨਾ ਦੇਖੇ ਡਾਟਾ (ਆਪਣੇ ਟੈਸਟਿੰਗ ਡਾਟਾ) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ ਤਾਂ ਜੋ ਦੇਖਿਆ ਜਾ ਸਕੇ ਕਿ ਮਾਡਲ ਕਿਵੇਂ ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ।
|
||||
6. **ਪੈਰਾਮੀਟਰ ਟਿਊਨਿੰਗ**। ਆਪਣੇ ਮਾਡਲ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਆਧਾਰ 'ਤੇ, ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਪੈਰਾਮੀਟਰ ਜਾਂ ਵੈਰੀਏਬਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੁਬਾਰਾ ਕਰ ਸਕਦੇ ਹੋ ਜੋ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਵਰਤੇ ਗਏ ਐਲਗੋਰਿਥਮ ਦੇ ਵਿਹਾਰ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦੇ ਹਨ।
|
||||
7. **ਪ੍ਰਿਡਿਕਟ ਕਰੋ**। ਨਵੇਂ ਇਨਪੁਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ ਮਾਡਲ ਦੀ ਸਹੀਤਾ ਦੀ ਜਾਂਚ ਕਰੋ।
|
||||
1. **ਸਵਾਲ ਨਿਰਧਾਰਤ ਕਰੋ**। ਜ਼ਿਆਦਾਤਰ ML ਪ੍ਰਕਿਰਿਆਵਾਂ ਕਿਸੇ ਸਵਾਲ ਨੂੰ ਪੁੱਛ ਕੇ ਸ਼ੁਰੂ ਹੁੰਦੀਆਂ ਹਨ ਜੋ ਇੱਕ ਸਧਾਰਨ ਸਸ਼ਰਤੀ ਪ੍ਰੋਗਰਾਮ ਜਾਂ ਨਿਯਮ-ਅਧਾਰਿਤ ਇੰਜਣ ਦੁਆਰਾ ਜਵਾਬ ਨਹੀਂ ਦਿੱਤਾ ਜਾ ਸਕਦਾ। ਇਹ ਸਵਾਲ ਅਕਸਰ ਡਾਟਾ ਦੇ ਸੰਗ੍ਰਹਿ 'ਤੇ ਆਧਾਰਤ ਭਵਿੱਖਬਾਣੀਆਂ ਨਾਲ ਸੰਬੰਧਿਤ ਹੁੰਦੇ ਹਨ।
|
||||
2. **ਡਾਟਾ ਇਕੱਠਾ ਕਰੋ ਅਤੇ ਤਿਆਰ ਕਰੋ**। ਆਪਣੇ ਸਵਾਲ ਦਾ ਜਵਾਬ ਦੇਣ ਲਈ ਤੁਹਾਨੂੰ ਡਾਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਤੁਹਾਡੇ ਡਾਟਾ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਕਈ ਵਾਰੀ ਮਾਤਰਾ ਵੀ ਇਹ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ ਕਿ ਤੁਸੀਂ ਆਪਣੇ ਸ਼ੁਰੂਆਤੀ ਸਵਾਲ ਦਾ ਕਿੰਨਾ ਚੰਗਾ ਜਵਾਬ ਦੇ ਸਕਦੇ ਹੋ। ਡਾਟਾ ਨੂੰ ਵਿਜ਼ੂਅਲਾਈਜ਼ ਕਰਨਾ ਕੇ ਇਸ ਪੜਾਅ ਦਾ ਅਹਿਮ ਹਿੱਸਾ ਹੈ। ਇਹ ਪੜਾਅ ਡਾਟਾ ਨੂੰ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਟੈਸਟਿੰਗ ਗਰੁੱਪ ਵਿੱਚ ਵੰਡਣ ਨੂੰ ਵੀ ਸਮਾਵੇਸ਼ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਮਾਡਲ ਬਣਾਇਆ ਜਾ ਸਕੇ।
|
||||
3. **ਟ੍ਰੇਨਿੰਗ ਮੈਥਡ ਚੁਣੋ**। ਤੁਹਾਡੇ ਸਵਾਲ ਅਤੇ ਡਾਟਾ ਦੀ ਕਿਸਮ dian ਅਧਾਰ 'ਤੇ, ਤੁਹਾਨੂੰ ਇਹ ਚੁਣਨਾ ਪਵੇਗਾ ਕਿ ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਕਿਵੇਂ ਟ੍ਰੇਨ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਜੋ ਇਹ ਤੁਹਾਡੇ ਡਾਟਾ ਨੂੰ ਸਭ ਤੋਂ ਵਧੀਆ ਦਰਸਾਉਂਦੇ ਹੋਏ ਸਹੀ ਭਵਿੱਖਬਾਣੀਆਂ ਕਰ ਸਕੇ। ਇਹ ਉਹ ਹਿੱਸਾ ਹੈ ਜਿੱਥੇ ਤੁਹਾਨੂੰ ਵਿਸ਼ੇਸ਼ਤਾ ਅਤੇ ਅਕਸਰ ਕਾਫੀ ਪ੍ਰਯੋਗ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
|
||||
4. **ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰੋ**। ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਅਲਗੋਰਿਧਮਾਂ ਦੇ ਸਹਾਰੇ ਮਾਡਲ ਨੂੰ ਡਾਟਾ ਵਿੱਚ ਪੈਟਰਨਜ਼ ਪਛਾਣਨ ਲਈ ਟ੍ਰੇਨ ਕਰੋਗੇ। ਮਾਡਲ ਅੰਦਰੂਨੀ ਵਜਨ ਵਰਤ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ताकि ਕੁਝ ਹਿੱਸਿਆਂ ਨੂੰ ਵੱਧ ਪਸੰਦ ਦਿੱਤੀ ਜਾ ਸਕੇ ਅਤੇ ਹੋਰਾਂ ਨਾਲੋਂ ਬਿਹਤਰ ਮਾਡਲ ਬਣ ਸਕੇ।
|
||||
5. **ਮਾਡਲ ਦਾ ਮੁਲਾਂਕਣ ਕਰੋ**। ਤੁਸੀਂ ਕਦੇ ਵੀ ਨਹੀਂ ਵੇਖੇ ਡਾਟਾ (ਆਪਣੇ ਟੈਸਟਿੰਗ ਡਾਟਾ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਦੇਖੋਗੇ ਕਿ ਮਾਡਲ ਕਿਵੇਂ ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ।
|
||||
6. **ਪੈਰਾਮੀਟਰ ਟਿਊਨਿੰਗ**। ਆਪਣੇ ਮਾਡਲ ਦੇ ਪਰਦਰਸ਼ਨ ਦੇ ਆਧਾਰ 'ਤੇ, ਤੁਸੀਂ ਵੱਖਰੇ ਪੈਰਾਮੀਟਰ ਜਾਂ ਵੈਰੀਏਬਲਾਂ ਨੂੰ ਬਦਲ ਕੇ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੁਬਾਰਾ ਕਰ ਸਕਦੇ ਹੋ ਜੋ ਉਸ ਅਲਗੋਰਿਦਮ ਦੀ ਵਰਤੋਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹਨ ਜੋ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਦਾ ਹੈ।
|
||||
7. **ਭਵਿੱਖਬਾਣੀ ਕਰੋ**। ਨਵੇਂ ਇਨਪੁੱਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ ਮਾਡਲ ਦੀ ਸ਼ੁੱਧਤਾ ਦੀ ਜਾਂਚ ਕਰੋ।
|
||||
|
||||
## ਕਿਹੜਾ ਸਵਾਲ ਪੁੱਛਣਾ ਹੈ
|
||||
## ਕਿਹੜਾ ਸਵਾਲ ਪੂਛਣਾ ਹੈ
|
||||
|
||||
ਕੰਪਿਊਟਰ ਡਾਟਾ ਵਿੱਚ ਲੁਕੇ ਹੋਏ ਪੈਟਰਨਾਂ ਦੀ ਖੋਜ ਕਰਨ ਵਿੱਚ ਖਾਸ ਤੌਰ 'ਤੇ ਨਿਪੁਣ ਹੁੰਦੇ ਹਨ। ਇਹ ਯੋਗਤਾ ਖੋਜਕਰਤਿਆਂ ਲਈ ਬਹੁਤ ਮਦਦਗਾਰ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਕਿਸੇ ਦਿੱਤੇ ਖੇਤਰ ਬਾਰੇ ਸਵਾਲ ਹੁੰਦੇ ਹਨ ਜੋ ਸਧਾਰਨ ਨਿਯਮ-ਅਧਾਰਿਤ ਇੰਜਨ ਬਣਾਉਣ ਦੁਆਰਾ ਆਸਾਨੀ ਨਾਲ ਹੱਲ ਨਹੀਂ ਕੀਤੇ ਜਾ ਸਕਦੇ। ਉਦਾਹਰਣ ਲਈ, ਇੱਕ ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਸਿਗਰਟ ਪੀਣ ਵਾਲਿਆਂ ਅਤੇ ਨਾ ਪੀਣ ਵਾਲਿਆਂ ਦੀ ਮੌਤ ਦਰ ਦੇ ਆਧਾਰ 'ਤੇ ਹੱਥੋਂ ਬਣਾਏ ਨਿਯਮਾਂ ਬਣਾਉਣ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹਨ।
|
||||
ਕੰਪਿਊਟਰ ਡਾਟਾ ਵਿੱਚ ਛੁਪੇ ਹੋਏ ਪੈਟਰਨ ਖੋਜਣ ਵਿੱਚ ਕਾਬਿਲ ਹੁੰਦੇ ਹਨ। ਇਹ ਉਪਯੋਗਤਾ ਉਨ੍ਹਾਂ ਵਿਗਿਆਨੀਆਂ ਲਈ ਬਹੁਤ ਲਾਹੇਵੰਦ ਹੈ ਜਿਨ੍ਹਾਂ ਕੋਲ ਕਿਸੇ ਖੇਤਰ ਬਾਰੇ ਅਜਿਹੇ ਸਵਾਲ ਹੁੰਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਦਾ ਜਵਾਬ ਅਸਾਨੀ ਨਾਲ ਕਿਸੇ ਨਿਯਮ-ਅਧਾਰਿਤ ਇੰਜਣ ਨਾਲ ਨਹੀਂ ਮਿਲ ਸਕਦਾ। ਉਦਾਹਰਨ ਵਜੋਂ, ਇੱਕ ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਧੂമ੍ਰਪਾਨ ਕਰਨ ਵਾਲਿਆਂ ਵਿਰੁੱਧ ਅਧਧੂਮ੍ਰਪਾਨ ਕਰਨ ਵਾਲਿਆਂ ਦੀ ਮੌਤ ਦਰ ਬਾਰੇ ਹੱਥ-ਨਿਰਮਿਤ ਨਿਯਮ ਬਣਾਉਣ ਦੇ ਯੋਗ ਹੋ ਸਕਦਾ ਹੈ।
|
||||
|
||||
ਜਦੋਂ ਕਈ ਹੋਰ ਵੈਰੀਏਬਲਾਂ ਨੂੰ ਸਮੀਕਰਨ ਵਿੱਚ ਲਿਆਂਦਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇੱਕ ML ਮਾਡਲ ਪਿਛਲੇ ਸਿਹਤ ਇਤਿਹਾਸ ਦੇ ਆਧਾਰ 'ਤੇ ਭਵਿੱਖ ਦੀ ਮੌਤ ਦਰਾਂ ਦੀ ਪੇਸ਼ਗੋਈ ਕਰਨ ਲਈ ਹੋਰ ਕੁਸ਼ਲ ਸਾਬਤ ਹੋ ਸਕਦਾ ਹੈ। ਇੱਕ ਹੋਰ ਖੁਸ਼ੀਦਾਇਕ ਉਦਾਹਰਣ ਅਪ੍ਰੈਲ ਮਹੀਨੇ ਵਿੱਚ ਕਿਸੇ ਦਿੱਤੇ ਸਥਾਨ ਲਈ ਮੌਸਮ ਦੀ ਪੇਸ਼ਗੋਈ ਕਰਨਾ ਹੋ ਸਕਦਾ ਹੈ, ਜੋ ਡਾਟਾ ਵਿੱਚ ਲੈਟੀਟਿਊਡ, ਲੌਂਗਿਟਿਊਡ, ਜਲਵਾਯੂ ਬਦਲਾਅ, ਸਮੁੰਦਰ ਦੇ ਨੇੜੇਪਨ, ਜੈਟ ਸਟ੍ਰੀਮ ਦੇ ਪੈਟਰਨ, ਅਤੇ ਹੋਰ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ।
|
||||
ਜਦੋਂ ਅਨੇਕ ਹੋਰ ਚਲਕ ਵਰਗੀਆਂ ਘਟਕਾਂ ਵਿਰੋਧੀ ਪ੍ਰਸ਼ਨ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ ਤਾਂ, ਇੱਕ ML ਮਾਡਲ ਪਿਛਲੇ ਸਿਹਤ ਇਤਿਹਾਸ ਆਧਾਰਿਤ ਭਵਿੱਖ ਦੀਆਂ ਮੌਤਾਂ ਦੀ ਦਰ ਨੂੰ ਬੇਹਤਰ ਅੰਦਾਜਾ ਕਰਨ ਵਿੱਚ ਹੋਰ ਲਾਭਕਾਰੀ ਸਾਬਤ ਹੋ ਸਕਦਾ ਹੈ। ਇੱਕ ਹੋਰ ਖੁਸ਼ਕਿਸਮਤ ਉਦਾਹਰਨ, ਕਿਸੇ ਇਸਥਾਨ ਲਈ ਅਪਰੈਲ ਮਹੀਨੇ ਦਾ ਮੌਸਮ ਅੰਦਾਜਾ ਕਰਨਾ ਹੈ, ਜਿੱਥੇ ਡਾਟਾ ਵਿੱਚ ਕੂਹ-ਰੇਖਾ, ਲੰਬਾਈ, ਜਲਵਾਯੂ ਪਰਿਵਰਤਨ, ਸਮੁੰਦਰ ਦੇ ਨੇੜੇਪਣ, ਜੈਟ ਸਟ੍ਰੀਮ ਦੇ ਪੈਟਰਨ ਆਦਿ ਸ਼ਾਮਲ ਹਨ।
|
||||
|
||||
✅ ਇਹ [ਸਲਾਈਡ ਡੈਕ](https://www2.cisl.ucar.edu/sites/default/files/2021-10/0900%20June%2024%20Haupt_0.pdf) ਮੌਸਮ ਮਾਡਲਾਂ 'ਤੇ ML ਦੀ ਵਰਤੋਂ ਲਈ ਇੱਕ ਇਤਿਹਾਸਕ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
|
||||
✅ ਮੌਸਮ ਮਾਡਲਾਂ 'ਤੇ ਇਹ [ਸਲਾਈਡ ਡੈੱਕ](https://www2.cisl.ucar.edu/sites/default/files/2021-10/0900%20June%2024%20Haupt_0.pdf) ਮੌਸਮ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ML ਦੀ ਵਰਤੋਂ ਲਈ ਇਤਿਹਾਸਕ ਨਜ਼ਰੀਆ ਦਿੰਦੀ ਹੈ।
|
||||
|
||||
## ਮਾਡਲ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਦੇ ਕੰਮ
|
||||
## ਮਾਡਲ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਵਾਲੇ ਕੰਮ
|
||||
|
||||
ਮਾਡਲ ਬਣਾਉਣ ਸ਼ੁਰੂ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਤੁਹਾਨੂੰ ਕਈ ਕੰਮ ਪੂਰੇ ਕਰਨੇ ਪੈਂਦੇ ਹਨ। ਆਪਣੇ ਸਵਾਲ ਦੀ ਜਾਂਚ ਕਰਨ ਅਤੇ ਮਾਡਲ ਦੀ ਪੇਸ਼ਗੋਈਆਂ ਦੇ ਆਧਾਰ 'ਤੇ ਇੱਕ ਅਨੁਮਾਨ ਬਣਾਉਣ ਲਈ, ਤੁਹਾਨੂੰ ਕਈ ਤੱਤਾਂ ਦੀ ਪਛਾਣ ਅਤੇ ਸੰਰਚਨਾ ਕਰਨ ਦੀ ਲੋੜ ਹੈ।
|
||||
ਆਪਣਾ ਮਾਡਲ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ, ਤੁਹਾਨੂੰ ਕਈ ਕੰਮ ਸਪੂਰਤ ਕਰਨ ਲੋੜੀਂਦੇ ਹਨ। ਆਪਣੇ ਸਵਾਲ ਦੀ ਜਾਂਚ ਕਰਨ ਅਤੇ ਮਾਡਲ ਦੀਆਂ ਭਵਿੱਖਬਾਣੀਆਂ 'ਤੇ ਅਧਾਰਿਤ ਇੱਕ ਹਿਪੋਥੇਸਿਸ ਬਣਾਉਣ ਲਈ, ਤੁਹਾਨੂੰ ਕਈ ਤੱਤਾਂ ਦੀ ਪਹਚਾਣ ਤੇ ਸੰਰਚਨਾ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
|
||||
|
||||
### ਡਾਟਾ
|
||||
|
||||
ਤੁਹਾਡੇ ਸਵਾਲ ਦਾ ਜਵਾਬ ਕਿਸੇ ਵੀ ਕਿਸਮ ਦੀ ਯਕੀਨ ਨਾਲ ਦੇਣ ਲਈ, ਤੁਹਾਨੂੰ ਸਹੀ ਕਿਸਮ ਦੇ ਡਾਟਾ ਦੀ ਚੰਗੀ ਮਾਤਰਾ ਦੀ ਲੋੜ ਹੈ। ਇਸ ਸਮੇਂ ਤੁਹਾਨੂੰ ਦੋ ਕੰਮ ਕਰਨੇ ਪੈਂਦੇ ਹਨ:
|
||||
ਤੁਹਾਡੇ ਸਵਾਲ ਦਾ ਕਿਸੇ ਵੀ ਪੱਕੇ ਜਵਾਬ ਲਈ, ਤੁਹਾਨੂੰ ਢੇਰ ਸਾਰਾ ਸਹੀ ਕਿਸਮ ਦਾ ਡਾਟਾ ਚਾਹੀਦਾ ਹੈ। ਇਸ ਸਮੇਂ ਤੁਹਾਨੂੰ ਦੋ ਚੀਜ਼ਾਂ ਕਰਨੀ ਹੁੰਦੀ ਹਨ:
|
||||
|
||||
- **ਡਾਟਾ ਇਕੱਠਾ ਕਰੋ**। ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਨਿਰਪੱਖਤਾ ਦੇ ਪਿਛਲੇ ਪਾਠ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ, ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਸਾਵਧਾਨੀ ਨਾਲ ਇਕੱਠਾ ਕਰੋ। ਇਸ ਡਾਟਾ ਦੇ ਸਰੋਤਾਂ, ਇਸ ਵਿੱਚ ਮੌਜੂਦ ਕਿਸੇ ਵੀ ਅੰਦਰੂਨੀ ਪੱਖਪਾਤ, ਅਤੇ ਇਸ ਦੇ ਮੂਲ ਨੂੰ ਦਸਤਾਵੇਜ਼ਬੱਧ ਕਰੋ।
|
||||
- **ਡਾਟਾ ਤਿਆਰ ਕਰੋ**। ਡਾਟਾ ਤਿਆਰੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਕਈ ਕਦਮ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ। ਜੇਕਰ ਡਾਟਾ ਵੱਖ-ਵੱਖ ਸਰੋਤਾਂ ਤੋਂ ਆਉਂਦਾ ਹੈ, ਤਾਂ ਤੁਹਾਨੂੰ ਇਸ ਨੂੰ ਇਕੱਠਾ ਅਤੇ ਸਧਾਰਨ ਕਰਨ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ। ਤੁਸੀਂ ਸਤਰਾਂ ਨੂੰ ਨੰਬਰਾਂ ਵਿੱਚ ਬਦਲ ਕੇ (ਜਿਵੇਂ ਅਸੀਂ [ਕਲਸਟਰਿੰਗ](../../5-Clustering/1-Visualize/README.md) ਵਿੱਚ ਕਰਦੇ ਹਾਂ) ਡਾਟਾ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਮਾਤਰਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰ ਸਕਦੇ ਹੋ। ਤੁਸੀਂ ਮੂਲ ਡਾਟਾ ਦੇ ਆਧਾਰ 'ਤੇ ਨਵਾਂ ਡਾਟਾ ਜਨਰੇਟ ਕਰ ਸਕਦੇ ਹੋ (ਜਿਵੇਂ ਅਸੀਂ [ਕਲਾਸੀਫਿਕੇਸ਼ਨ](../../4-Classification/1-Introduction/README.md) ਵਿੱਚ ਕਰਦੇ ਹਾਂ)। ਤੁਸੀਂ ਡਾਟਾ ਨੂੰ ਸਾਫ ਅਤੇ ਸੋਧ ਸਕਦੇ ਹੋ (ਜਿਵੇਂ ਅਸੀਂ [ਵੈਬ ਐਪ](../../3-Web-App/README.md) ਪਾਠ ਤੋਂ ਪਹਿਲਾਂ ਕਰਾਂਗੇ)। ਆਖਰਕਾਰ, ਤੁਸੀਂ ਇਸ ਨੂੰ ਰੈਂਡਮਾਈਜ਼ ਅਤੇ ਸ਼ਫਲ ਕਰਨ ਦੀ ਲੋੜ ਕਰ ਸਕਦੇ ਹੋ, ਤੁਹਾਡੇ ਟ੍ਰੇਨਿੰਗ ਤਕਨੀਕਾਂ ਦੇ ਆਧਾਰ 'ਤੇ।
|
||||
- **ਡਾਟਾ ਇਕੱਠਾ ਕਰੋ**। ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਨਿਆਂ ਦੀ ਵਿਚਾਰਧਾਰਾ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ, ਆਪਣਾ ਡਾਟਾ ਧਿਆਨ ਨਾਲ ਇਕੱਠਾ ਕਰੋ। ਇਸ ਡਾਟਾ ਦੇ ਸਰੋਤਾਂ ਨੂੰ ਜਾਣੋ, ਇਸ ਵਿੱਚ ਹੋ ਸਕਦੇ ਪੱਖਪਾਤਾਂ ਬਾਰੇ ਸਮਝੋ ਅਤੇ ਇਸਦਾ ਮੂਲ ਦਰਜ ਕਰੋ।
|
||||
- **ਡਾਟਾ ਤਿਆਰ ਕਰੋ**। ਡਾਟਾ ਤਿਆਰ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਕਈ ਕਦਮ ਹਨ। ਤੁਸੀਂ ਵੱਖਰੇ ਸਰੋਤਾਂ ਤੋਂ ਆਉਣ ਵਾਲੇ ਡਾਟੇ ਨੂੰ ਇਕੱਠਾ ਕਰਕੇ ਸਮਾਨ ਰੂਪ ਵਿੱਚ ਲਿਆ ਸਕਦੇ ਹੋ। ਤੁਸੀਂ ਡਾਟੇ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਮਾਤਰਾ ਨੂੰ ਸੂਤਰਾਂ ਨੂੰ ਨੰਬਰਾਂ ਵਿੱਚ ਬਦਲ ਕੇ ਸੁਧਾਰ ਸਕਦੇ ਹੋ (ਜਿਵੇਂ ਕਿ ਅਸੀਂ [ਕਲੱਸਟਰਿੰਗ](../../5-Clustering/1-Visualize/README.md) ਵਿੱਚ ਕਰਦੇ ਹਾਂ)। ਤੁਸੀਂ ਮੂਲ ਡਾਟਾ ਦੇ ਆਧਾਰ ਤੇ ਨਵਾਂ ਡਾਟਾ ਵੀ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹੋ (ਜਿਵੇਂ ਕਿ ਅਸੀਂ [ਕਲਾਸੀਫਿਕੇਸ਼ਨ](../../4-Classification/1-Introduction/README.md) ਵਿੱਚ ਕਰਦੇ ਹਾਂ)। ਤੁਸੀਂ ਡਾਟਾ ਨੂੰ ਸਾਫ-ਸੁਥਰਾ ਅਤੇ ਸੰਪਾਦਿਤ ਕਰ ਸਕਦੇ ਹੋ (ਜਿਵੇਂ ਕਿ ਅਸੀਂ [ਵੈੱਬ ਐਪ](../../3-Web-App/README.md) ਸਬਕ ਤੋਂ ਪਹਿਲਾਂ ਕਰਾਂਗੇ)। ਆਖਿਰਕਾਰ, ਤੁਸੀਂ ਇਸਨੂੰ ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਤਕਨੀਕਾਂ ਅਨੁਸਾਰ ਰੈੰਡੀਮ ਕਰਨਾ ਅਤੇ ਸ਼ਫ਼ਲ ਕਰਨਾ ਵੀ ਚਾਹੁੰਦੇ ਹੋ ਸਕਦੇ ਹੋ।
|
||||
|
||||
✅ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਅਤੇ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਇੱਕ ਪਲ ਲਓ ਅਤੇ ਦੇਖੋ ਕਿ ਕੀ ਇਸ ਦਾ ਆਕਾਰ ਤੁਹਾਡੇ ਇਰਾਦੇ ਸਵਾਲ ਨੂੰ ਹੱਲ ਕਰਨ ਦੀ ਆਗਿਆ ਦੇਵੇਗਾ। ਇਹ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਡਾਟਾ ਤੁਹਾਡੇ ਦਿੱਤੇ ਕੰਮ ਵਿੱਚ ਚੰਗਾ ਪ੍ਰਦਰਸ਼ਨ ਨਾ ਕਰੇ, ਜਿਵੇਂ ਅਸੀਂ ਆਪਣੇ [ਕਲਸਟਰਿੰਗ](../../5-Clustering/1-Visualize/README.md) ਪਾਠਾਂ ਵਿੱਚ ਪਤਾ ਲਗਾਉਂਦੇ ਹਾਂ!
|
||||
✅ ਆਪਣਾ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਅਤੇ ਸੰਪਾਦਿਤ ਕਰਨ ਮਗਰੋਂ, ਕਿਰਪਾ ਕਰਕੇ ਦੇਖੋ ਕਿ ਇਸ ਦਾ ਸਰੂਪ ਤੁਹਾਡੇ ਇਰਾਦੇ ਬਨਾਏ ਸਵਾਲ ਦੀ ਪੂਰੀ ਜਾਂਚ ਕਰਨ ਯੋਗ ਹੈ ਜਾਂ ਨਹੀਂ। ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਡਾਟਾ ਤੁਹਾਡੇ ਨਿਰਧਾਰਤ ਕੰਮ ਵਿੱਚ ਚੰਗਾ ਪ੍ਰਦਰਸ਼ਨ ਨਾ ਕਰੇ, ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਆਪਣੇ [ਕਲੱਸਟਰਿੰਗ](../../5-Clustering/1-Visualize/README.md) ਪਾਠਾਂ ਵਿੱਚ ਵੇਖਦੇ ਹਾਂ!
|
||||
|
||||
### ਫੀਚਰ ਅਤੇ ਟਾਰਗਟ
|
||||
### ਫੀਚਰ ਅਤੇ ਟਾਰਗੇਟ
|
||||
|
||||
[ਫੀਚਰ](https://www.datasciencecentral.com/profiles/blogs/an-introduction-to-variable-and-feature-selection) ਤੁਹਾਡੇ ਡਾਟਾ ਦੀ ਇੱਕ ਮਾਪਣਯੋਗ ਵਿਸ਼ੇਸ਼ਤਾ ਹੈ। ਕਈ ਡਾਟਾਸੈਟ ਵਿੱਚ ਇਹ 'date', 'size', ਜਾਂ 'color' ਵਰਗੇ ਕਾਲਮ ਹੈਡਿੰਗ ਦੇ ਰੂਪ ਵਿੱਚ ਪ੍ਰਗਟ ਹੁੰਦੀ ਹੈ। ਤੁਹਾਡਾ ਫੀਚਰ ਵੈਰੀਏਬਲ, ਆਮ ਤੌਰ 'ਤੇ ਕੋਡ ਵਿੱਚ `X` ਦੇ ਰੂਪ ਵਿੱਚ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ, ਉਹ ਇਨਪੁਟ ਵੈਰੀਏਬਲ ਹੈ ਜੋ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾਵੇਗਾ।
|
||||
[ਫੀਚਰ](https://www.datasciencecentral.com/profiles/blogs/an-introduction-to-variable-and-feature-selection) ਤੁਹਾਡੇ ਡਾਟੇ ਦੀ ਇੱਕ ਮਾਪੀ ਜਾ ਸਕਣ ਵਾਲੀ ਖਾਸੀਅਤ ਹੁੰਦੀ ਹੈ। ਕਈ ਡਾਟਾ ਸੈੱਟਾਂ ਵਿੱਚ ਇਹ ਕਾਲਮ ਦੀ ਸਿਰਲੇਖ ਵਜੋਂ ਦਰਸਾਈ ਜਾਂਦੀ ਹੈ, ਜਿਵੇਂ 'ਤਾਰੀਖ', 'ਆਕਾਰ' ਜਾਂ 'ਰੰਗ'। ਤੁਹਾਡੀ ਫੀਚਰ ਵੈਰੀਏਬਲ, ਜੋ ਆਮਤੌਰ 'ਤੇ ਕੋਡ ਵਿੱਚ `X` ਰੂਪ ਵਿੱਚ ਦਰਸਾਈ ਜਾਂਦੀ ਹੈ, ਉਹ ਇਨਪੁੱਟ ਵੈਰੀਏਬਲ ਹੁੰਦੀ ਹੈ ਜੋ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਵਰਤੀ ਜਾਂਦੀ ਹੈ।
|
||||
|
||||
ਟਾਰਗਟ ਉਹ ਚੀਜ਼ ਹੈ ਜਿਸ ਦੀ ਤੁਸੀਂ ਪੇਸ਼ਗੋਈ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ। ਟਾਰਗਟ ਆਮ ਤੌਰ 'ਤੇ ਕੋਡ ਵਿੱਚ `y` ਦੇ ਰੂਪ ਵਿੱਚ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ, ਜੋ ਤੁਹਾਡੇ ਡਾਟਾ ਤੋਂ ਪੁੱਛੇ ਜਾ ਰਹੇ ਸਵਾਲ ਦਾ ਜਵਾਬ ਦਰਸਾਉਂਦਾ ਹੈ: ਦਸੰਬਰ ਵਿੱਚ ਕਿਹੜੇ **ਰੰਗ** ਦੇ ਕੱਦੂ ਸਭ ਤੋਂ ਸਸਤੇ ਹੋਣਗੇ? ਸੈਨ ਫਰਾਂਸਿਸਕੋ ਵਿੱਚ ਕਿਹੜੇ ਪੜੋਸਾਂ ਵਿੱਚ ਰਿਅਲ ਐਸਟੇਟ ਦੀ **ਕੀਮਤ** ਸਭ ਤੋਂ ਵਧੀਆ ਹੋਵੇਗੀ? ਕਈ ਵਾਰ ਟਾਰਗਟ ਨੂੰ ਲੇਬਲ ਐਟ੍ਰਿਬਿਊਟ ਵੀ ਕਿਹਾ ਜਾਂਦਾ ਹੈ।
|
||||
ਟਾਰਗੇਟ ਉਹ ਚੀਜ਼ ਹੈ ਜਿਸ ਦੀ ਤੁਸੀਂ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ। ਟਾਰਗੇਟ, ਜੋ ਆਮਤੌਰ 'ਤੇ ਕੋਡ ਵਿੱਚ `y` ਵਜੋਂ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ, ਉਸ ਸਵਾਲ ਦਾ ਜਵਾਬ ਹੁੰਦਾ ਹੈ ਜੋ ਤੁਸੀਂ ਆਪਣੇ ਡਾਟੇ ਨੂੰ ਪੁੱਛ ਰਹੇ ਹੋ: ਦਸੰਬਰ ਵਿੱਚ, ਕੇਹੜਾ **ਰੰਗ** ਦੇ ਕੁੱਰਬੂਤ ਸਸਤੇ ਹੋਣਗੇ? ਸੈਨ ਫਰਾਂਸਿਸਕੋ ਵਿੱਚ, ਦਿੱਤੇ ਮੋਹੱਲਿਆਂ ਦੀ ਜਾਇਦਾਦ ਦੀਆਂ ਵਧੀਆ **ਕੀਮਤਾਂ** ਕਿਹੜੀਆਂ ਹੋਣਗੀਆਂ? ਕਈ ਵਾਰ ਟਾਰਗੇਟ ਨੂੰ ਲੇਬਲ ਅਟ੍ਰਿਬਿਊਟ ਵਜੋਂ ਵੀ ਸੈਜ਼ਾ ਦਿੰਦੇ ਹਨ।
|
||||
|
||||
### ਫੀਚਰ ਵੈਰੀਏਬਲ ਚੁਣਨਾ
|
||||
### ਆਪਣੀ ਫੀਚਰ ਵੈਰੀਏਬਲ ਚੁਣੋ
|
||||
|
||||
🎓 **ਫੀਚਰ ਚੋਣ ਅਤੇ ਫੀਚਰ ਨਿਕਾਸ**। ਮਾਡਲ ਬਣਾਉਣ ਸਮੇਂ ਤੁਹਾਨੂੰ ਕਿਹੜਾ ਵੈਰੀਏਬਲ ਚੁਣਨਾ ਚਾਹੀਦਾ ਹੈ? ਤੁਸੀਂ ਸ਼ਾਇਦ ਫੀਚਰ ਚੋਣ ਜਾਂ ਫੀਚਰ ਨਿਕਾਸ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚੋਂ ਗੁਜ਼ਰੋਗੇ ਤਾਂ ਜੋ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਲਈ ਸਹੀ ਵੈਰੀਏਬਲ ਚੁਣ ਸਕੋ। ਹਾਲਾਂਕਿ ਇਹ ਦੋਵੇਂ ਇੱਕੋ ਜਿਹੇ ਨਹੀਂ ਹਨ: "ਫੀਚਰ ਨਿਕਾਸ ਮੂਲ ਫੀਚਰਾਂ ਦੇ ਫੰਕਸ਼ਨਾਂ ਤੋਂ ਨਵੇਂ ਫੀਚਰ ਬਣਾਉਂਦਾ ਹੈ, ਜਦਕਿ ਫੀਚਰ ਚੋਣ ਫੀਚਰਾਂ ਦੇ ਇੱਕ ਉਪਸੈਟ ਨੂੰ ਵਾਪਸ ਕਰਦਾ ਹੈ।" ([ਸਰੋਤ](https://wikipedia.org/wiki/Feature_selection))
|
||||
🎓 **ਫੀਚਰ ਸਿਲੈਕਸ਼ਨ ਅਤੇ ਫੀਚਰ ਐਕਸਟ੍ਰੈਕਸ਼ਨ** ਮਾਡਲ ਬਣਾਉਂਦੇ ਸਮੇਂ ਤੁਸੀਂ ਕਿਸ ਵੈਰੀਏਬਲ ਨੂੰ ਚੁਣੋਗੇ, ਇਸ ਦਾ ਕੀਮਤੀ ਪ੍ਰਕਿਰਿਆ ਹੈ। ਤੁਹਾਡੇ ਲਈ ਫੀਚਰ ਸਿਲੈਕਸ਼ਨ ਜਾਂ ਫੀਚਰ ਐਕਸਟ੍ਰੈਕਸ਼ਨ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜੋ ਸਭ ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਵਾਲਾ ਮਾਡਲ ਚੁਣਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਪਰ ਇਹ ਦੋਵੇਂ ਇਕੋ ਨਹੀਂ ਹਨ: "ਫੀਚਰ ਐਕਸਟ੍ਰੈਕਸ਼ਨ ਮੂਲ ਫੀਚਰਾਂ ਦੇ ਫੰਕਸ਼ਨਾਂ ਤੋਂ ਨਵੇਂ ਫੀਚਰ ਬਣਾਉਂਦੀ ਹੈ, ਜਦਕਿ ਫੀਚਰ ਸਿਲੈਕਸ਼ਨ ਫੀਚਰਾਂ ਦਾ ਇੱਕ ਉੱਪਸੈੱਟ ਵਾਪਸ ਕਰਦਾ ਹੈ।" ([ਸਰੋਤ](https://wikipedia.org/wiki/Feature_selection))
|
||||
|
||||
### ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਵਿਜ਼ੁਅਲਾਈਜ਼ ਕਰੋ
|
||||
### ਡਾਟਾ ਨੂੰ ਵਿਜੂਅਲਾਈਜ਼ ਕਰੋ
|
||||
|
||||
ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਦੇ ਟੂਲਕਿਟ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪਹਲੂ ਹੈ ਕਈ ਸ਼ਾਨਦਾਰ ਲਾਇਬ੍ਰੇਰੀਆਂ ਜਿਵੇਂ Seaborn ਜਾਂ MatPlotLib ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾ ਨੂੰ ਵਿਜ਼ੁਅਲਾਈਜ਼ ਕਰਨ ਦੀ ਸ਼ਕਤੀ। ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਵਿਜ਼ੁਅਲ ਰੂਪ ਵਿੱਚ ਦਰਸਾਉਣਾ ਤੁਹਾਨੂੰ ਲੁਕੇ ਹੋਏ ਸੰਬੰਧਾਂ ਦੀ ਖੋਜ ਕਰਨ ਦੀ ਆਗਿਆ ਦੇ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੁਸੀਂ ਲਾਭਦਾਇਕ ਬਣਾ ਸਕਦੇ ਹੋ। ਤੁਹਾਡੇ ਵਿਜ਼ੁਅਲਾਈਜ਼ੇਸ਼ਨ ਤੁਹਾਨੂੰ ਪੱਖਪਾਤ ਜਾਂ ਅਸੰਤੁਲਿਤ ਡਾਟਾ ਦੀ ਖੋਜ ਕਰਨ ਵਿੱਚ ਵੀ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ (ਜਿਵੇਂ ਅਸੀਂ [ਕਲਾਸੀਫਿਕੇਸ਼ਨ](../../4-Classification/2-Classifiers-1/README.md) ਵਿੱਚ ਪਤਾ ਲਗਾਉਂਦੇ ਹਾਂ)।
|
||||
ਡਾਟਾ ਵਿਗਿਆਨੀ ਦੇ ਟੂਲਕਿਟ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਗੁਣ ਡਾਟਾ ਨੂੰ ਕਈ ਸ਼ਾਨਦਾਰ ਲਾਇਬ੍ਰੇਰੀਆਂ ਵਰਗੇ ਸੇਬੌਰਨ ਜਾਂ ਮੈਟਪਲਾਟਲਿਬ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਿਜ਼ੂਅਲਾਈਜ਼ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਹੈ। ਆਪਣਾ ਡਾਟਾ ਵਿਜ਼ੂਅਲ ਰੂਪ ਵਿੱਚ ਦਰਸਾਉਣਾ ਤੁਹਾਨੂੰ ਲੁਕਵੇਂ ਸੰਬੰਧਾਂ ਦੀ ਸੂਝ ਦੇ ਸਕਦਾ ਹੈ ਜੋ ਤੁਸੀਂ ਵਰਤ ਸਕਦੇ ਹੋ। ਤੁਹਾਡੇ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਪੱਖਪਾਤ ਜਾਂ ਅਸਮਤੁਲਿਤ ਡਾਟਾ ਨੂੰ ਵੀ ਖੋਜਣ ਵਿੱਚ ਸਹਾਇਕ ਹੋ ਸਕਦੇ ਹਨ (ਜਿਵੇਂ ਕਿ ਅਸੀਂ [ਕਲਾਸੀਫਿਕੇਸ਼ਨ](../../4-Classification/2-Classifiers-1/README.md) ਵਿੱਚ ਪਤਾ ਲਗਾਉਂਦੇ ਹਾਂ)।
|
||||
|
||||
### ਆਪਣੇ ਡਾਟਾਸੈਟ ਨੂੰ ਵੰਡੋ
|
||||
### ਆਪਣਾ ਡਾਟਾਸੈੱਟ ਵੰਡੋ
|
||||
|
||||
ਟ੍ਰੇਨਿੰਗ ਤੋਂ ਪਹਿਲਾਂ, ਤੁਹਾਨੂੰ ਆਪਣੇ ਡਾਟਾਸੈਟ ਨੂੰ ਦੋ ਜਾਂ ਵੱਧ ਅਸਮਾਨ ਆਕਾਰ ਦੇ ਹਿੱਸਿਆਂ ਵਿੱਚ ਵੰਡਣਾ ਪੈਂਦਾ ਹੈ ਜੋ ਫਿਰ ਵੀ ਡਾਟਾ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਦਰਸਾਉਂਦੇ ਹਨ।
|
||||
ਟ੍ਰੇਨਿੰਗ ਤੋਂ ਪਹਿਲਾਂ, ਤੁਹਾਨੂੰ ਆਪਣੇ ਡਾਟਾਸੈੱਟ ਨੂੰ ਦੋ ਜਾਂ ਵੱਧ ਹਿੱਸਿਆਂ ਵਿੱਚ ਵੰਡਣਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਅਸਮਾਨ ਆਕਾਰ ਦੇ ਹੋਣ ਦੇ ਬਾਵਜੂਦ ਡਾਟੇ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਦਰਸਾਉਂਦੇ ਹੋਣ।
|
||||
|
||||
- **ਟ੍ਰੇਨਿੰਗ**। ਡਾਟਾਸੈਟ ਦਾ ਇਹ ਹਿੱਸਾ ਤੁਹਾਡੇ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਫਿੱਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਸੈੱਟ ਮੂਲ ਡਾਟਾਸੈਟ ਦਾ ਜ਼ਿਆਦਾਤਰ ਹਿੱਸਾ ਹੁੰਦਾ ਹੈ।
|
||||
- **ਟੈਸਟਿੰਗ**। ਇੱਕ ਟੈਸਟ ਡਾਟਾਸੈਟ ਇੱਕ ਸਵਤੰਤਰ ਗਰੁੱਪ ਹੈ, ਅਕਸਰ ਮੂਲ ਡਾਟਾ ਤੋਂ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜਿਸਦੀ ਵਰਤੋਂ ਤੁਸੀਂ ਬਣਾਏ ਮਾਡਲ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਕਰਦੇ ਹੋ।
|
||||
- **ਵੈਲੀਡੇਟਿੰਗ**। ਇੱਕ ਵੈਲੀਡੇਸ਼ਨ ਸੈੱਟ ਇੱਕ ਛੋਟਾ ਸਵਤੰਤਰ ਗਰੁੱਪ ਹੈ ਜਿਸਦੀ ਵਰਤੋਂ ਤੁਸੀਂ ਮਾਡਲ ਦੇ ਹਾਈਪਰਪੈਰਾਮੀਟਰਾਂ ਜਾਂ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਸੁਧਾਰਨ ਲਈ ਕਰਦੇ ਹੋ। ਤੁਹਾਡੇ ਡਾਟਾ ਦੇ ਆਕਾਰ ਅਤੇ ਤੁਹਾਡੇ ਸਵਾਲ ਦੇ ਆਧਾਰ 'ਤੇ, ਤੁਹਾਨੂੰ ਇਹ ਤੀਜਾ ਸੈੱਟ ਬਣਾਉਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੋ ਸਕਦੀ (ਜਿਵੇਂ ਅਸੀਂ [ਟਾਈਮ ਸੀਰੀਜ਼ ਫੋਰਕਾਸਟਿੰਗ](../../7-TimeSeries/1-Introduction/README.md) ਵਿੱਚ ਨੋਟ ਕਰਦੇ ਹਾਂ)।
|
||||
- **ਟ੍ਰੇਨਿੰਗ**। ਡਾਟਾਸੈੱਟ ਦਾ ਇਹ ਹਿੱਸਾ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਫਿਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਸੈੱਟ ਮੂਲ ਡਾਟਾਸੈੱਟ ਦਾ ਵੱਡਾ ਹਿੱਸਾ ਹੁੰਦਾ ਹੈ।
|
||||
- **ਟੈਸਟਿੰਗ**। ਟੈਸਟ ਡਾਟਾਸੈੱਟ ਇੱਕ ਸੁਤੰਤਰ ਸਮੂਹ ਹੁੰਦਾ ਹੈ ਜੋ ਜ਼ਿਆਦਾਤਰ ਮੂਲ ਡਾਟੇ ਤੋਂ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ এবং ਜਿਸਦੀ ਵਰਤੋਂ ਮਾਡਲ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
|
||||
- **ਵੈਲਿਡੇਟਿੰਗ**। ਵੈਲਿਚੇਕਸ਼ਨ ਸੈੱਟ ਛੋਟਾ ਸੁਤੰਤਰ ਉਦਾਹਰਨਾਂ ਦਾ ਸਮੂਹ ਹੁੰਦਾ ਹੈ ਜੋ ਤੁਸੀਂ ਮਾਡਲ ਦੇ ਹਾਈਪਰਪੈਰਾਮੀਟਰ ਜਾਂ ਬਣਤਰ ਨੂੰ ਟਿਊਨ ਕਰਨ ਲਈ ਵਰਤਦੇ ਹੋ। ਤੁਹਾਡੇ ਡਾਟਾ ਦੇ ਆਕਾਰ ਅਤੇ ਸਵਾਲ ਦੇ ਅਨੁਸਾਰ ਤੁਸੀਂ ਇਸ ਤੀਜੇ ਸੈੱਟ ਦੀ ਲੋੜ ਨਹੀਂ ਮਹਿਸੂਸ ਕਰ ਸਕਦੇ (ਜਿਵੇਂ ਕਿ ਅਸੀਂ [ਟਾਈਮ ਸੀਰੀਜ਼ ਫੋਰਕਾਸਟਿੰਗ](../../7-TimeSeries/1-Introduction/README.md) ਵਿੱਚ ਨੋਟ ਕਰਦੇ ਹਾਂ)।
|
||||
|
||||
## ਮਾਡਲ ਬਣਾਉਣਾ
|
||||
|
||||
ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਤੁਹਾਡਾ ਉਦੇਸ਼ ਇੱਕ ਮਾਡਲ ਬਣਾਉਣਾ ਹੈ, ਜਾਂ ਤੁਹਾਡੇ ਡਾਟਾ ਦਾ ਇੱਕ ਸਾਂਖਿਕ ਪ੍ਰਤੀਨਿਧੀ, ਵੱਖ-ਵੱਖ ਐਲਗੋਰਿਥਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਸ ਨੂੰ **ਟ੍ਰੇਨ** ਕਰਨਾ। ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨਾ ਇਸ ਨੂੰ ਡਾਟਾ ਦੇ ਸਾਹਮਣੇ ਰੱਖਦਾ ਹੈ ਅਤੇ ਇਸ ਨੂੰ ਖੋਜੇ ਗਏ ਪੈਟਰਨਾਂ ਬਾਰੇ ਧਾਰਨਾ ਬਣਾਉਣ, ਵੈਲੀਡੇਟ ਕਰਨ, ਅਤੇ ਸਵੀਕਾਰ ਜਾਂ ਅਸਵੀਕਾਰ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।
|
||||
ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਡਾਟੇ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, ਤੁਹਾਡਾ ਲਕੜ ਹੈ ਕਿ ਇੱਕ ਮਾਡਲ ਬਣਾਉ, ਜਾਂ ਤੁਹਾਡੇ ਡਾਟੇ ਦੀ ਸਾਂਖਿਆਕੀ ਪ੍ਰਤੀਨਿਧੀ ਬਣਾਉ, ਜੋ ਵੱਖਰੇ ਅਲਗੋਰਿਦਮ ਵਰਤ ਕੇ ਇਸਨੂੰ ਟ੍ਰੇਨ ਕਰੇ। ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨਾ ਇਸਨੂੰ ਡਾਟਾ ਨਾਲ ਸਾਹਮਣਾ ਕਰਵਾਉਂਦਾ ਹੈ ਅਤੇ ਇਸਨੂੰ ਪੈਟਰਨਾਂ ਬਾਰੇ ਅਸੁਮptions ਬਣਾਉਣ ਦਿੰਦਾ ਹੈ ਜੋ ਇਹ ਖੋਜਦਾ, ਸੱਚ ਜਾਂ ਝੂਠ ਨੂੰ ਜਾਂਚਦਾ, ਤੇ ਕਬੂਲ ਜਾਂ ਠੁਕਰਾਉਂਦਾ ਹੈ।
|
||||
|
||||
### ਟ੍ਰੇਨਿੰਗ ਵਿਧੀ ਤੈਅ ਕਰੋ
|
||||
### ਟ੍ਰੇਨਿੰਗ ਮੈਥਡ ਦਾ ਫੈਸਲਾ ਕਰੋ
|
||||
|
||||
ਤੁਹਾਡੇ ਸਵਾਲ ਅਤੇ ਤੁਹਾਡੇ ਡਾਟਾ ਦੀ ਪ੍ਰਕਿਰਤੀ ਦੇ ਆਧਾਰ 'ਤੇ, ਤੁਸੀਂ ਇਸ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਇੱਕ ਵਿਧੀ ਚੁਣੋਗੇ। [Scikit-learn ਦੀ ਦਸਤਾਵੇਜ਼](https://scikit-learn.org/stable/user_guide.html) ਵਿੱਚੋਂ ਗੁਜ਼ਰਦੇ ਹੋਏ - ਜਿਸਦੀ ਵਰਤੋਂ ਅਸੀਂ ਇਸ ਕੋਰਸ ਵਿੱਚ ਕਰਦੇ ਹਾਂ - ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਦੇ ਕਈ ਤਰੀਕੇ ਖੋਜ ਸਕਦੇ ਹੋ। ਤੁਹਾਡੇ ਅਨੁਭਵ ਦੇ ਆਧਾਰ 'ਤੇ, ਤੁਹਾਨੂੰ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਬਣਾਉਣ ਲਈ ਕਈ ਵੱਖ-ਵੱਖ ਵਿਧੀਆਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨੀ ਪਵੇਗੀ। ਤੁਸੀਂ ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚੋਂ ਗੁਜ਼ਰਦੇ ਹੋ ਜਿੱਥੇ ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਮਾਡਲ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਮੁਲਾਂਕਨ ਕਰਦੇ ਹਨ, ਇਸ ਨੂੰ ਨਾ ਦੇਖੇ ਡਾਟਾ ਦੇਣ, ਸਹੀਤਾ, ਪੱਖਪਾਤ, ਅਤੇ ਹੋਰ ਗੁਣਵੱਤਾ-ਘਟਾਉਣ ਵਾਲੇ ਮੁੱਦਿਆਂ ਦੀ ਜਾਂਚ ਕਰਦੇ ਹਨ,
|
||||
ਤੁਹਾਡੇ ਸਵਾਲ ਅਤੇ ਡਾਟਾ ਦੀ ਕਿਸਮ dian ਅਧਾਰ, ਤੁਸੀਂ ਟ੍ਰੇਨ ਕਰਨ ਦਾ ਇੱਕ ਮੈਥਡ ਚੁਣੋਗੇ। [ਸਕੀਟ-ਲਰਨ ਦੀ ਦਸਤਾਵੇਜ਼ੀ](https://scikit-learn.org/stable/user_guide.html) ਦੇ ਰਾਹੀਂ ਚੱਲਦੇ ਹੋਏ - ਜੋ ਅਸੀਂ ਇਸ ਕੋਰਸ ਵਿੱਚ ਵਰਤਦੇ ਹਾਂ - ਤੁਸੀਂ ਕਈ ਢੰਗਾਂ ਨਾਲ ਮਾਡਲ ਟ੍ਰੇਨ ਕਰਨ ਦਾ ਪਤਾ ਲਾ ਸਕਦੇ ਹੋ। ਤੁਹਾਡੇ ਅਨੁਭਵ ਦੇ ਮੁਤਾਬਕ, ਤੁਸੀਂ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਬਣਾਉਣ ਲਈ ਕਈ ਵੱਖਰਾ ਤਰੀਕਿਆਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਹੋ। ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਵੱਡੇ ਅਕਸਰ ਇਸ ਪ੍ਰਕਿਰਿਆ ਵਿਚੋਂ ਲੰਘਦੇ ਹਨ ਜਿੱਥੇ ਉਨ੍ਹਾਂ ਅਣਦੇਖੇ ਡਾਟੇ ਨੂੰ ਮਾਡਲ ਵਿੱਚ ਫੀਡ ਕਰਕੇ ਇਸ ਦੀ ਸ਼ੁੱਧਤਾ, ਪੱਖਪਾਤ, ਅਤੇ ਹੋਰ ਕੁਆਲਿਟੀ ਥੀਮਾਂ ਦੀ ਜਾਂਚ ਕਰਦੇ ਹਨ ਅਤੇ ਕੰਮ ਲਈ ਸਭ ਤੋਂ ਢੁਕਵਾਂ ਟ੍ਰੇਨਿੰਗ ਮੈਥਡ ਚੁਣਦੇ ਹਨ।
|
||||
|
||||
### ਮਾਡਲ ਟ੍ਰੇਨ ਕਰੋ
|
||||
|
||||
ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਡਾਟੇ ਦੇ ਨਾਲ, ਤੁਸੀਂ ਇਸਨੂੰ ਮਾਡਲ ਬਣਾਉਣ ਲਈ 'ਫਿਟ' ਕਰਨ ਲਈ ਤਿਆਰ ਹੋ। ਤੁਹਾਨੂੰ ਵਿਭਿੰਨ ML ਲਾਇਬ੍ਰੇਰੀਆਂ ਵਿੱਚ 'model.fit' ਕੋਡ ਅਕਸਰ ਮਿਲੇਗਾ—ਸਿਰਫ ਇਸ ਸਮੇਂ ਹੀ ਤੁਸੀਂ ਆਪਣੀ ਫੀਚਰ ਵੈਰੀਏਬਲ (ਸਧਾਰਣ: 'X') ਅਤੇ ਟਾਰਗੇਟ ਵੈਰੀਏਬਲ ('y' ਆਮ ਤੌਰ) ਦੇ ਤੌਰ ਤੇ ਇੱਕ ਐਰੇ ਭੇਜਦੇ ਹੋ।
|
||||
|
||||
### ਮਾਡਲ ਦਾ ਮੁਲਾਂਕਣ ਕਰੋ
|
||||
|
||||
ਜਦੋਂ ਟ੍ਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਮੁਕੰਮਲ ਹੁੰਦੀ ਹੈ (ਇਹ ਵੱਡੇ ਮਾਡਲ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਕਈ ਦੌਰ ਜਾਂ 'ਏਪੌਕ' ਲੈ ਸਕਦਾ ਹੈ), ਤੁਸੀਂ ਟੈਸਟ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਦੀ ਕੋਟੀ ਨੂੰ ਅੰਕਿਤ ਕਰ ਸਕਦੇ ਹੋ। ਇਹ ਡਾਟਾ ਮੂਲ ਡਾਟੇ ਦਾ ਇੱਕ ਉਪਸੈੱਟ ਹੁੰਦਾ ਹੈ ਜਿਸ ਨੂੰ ਮਾਡਲ ਪਹਿਲਾਂ ਜਾਂਚਿਆ ਨਹੀਂ ਹੁੰਦਾ। ਤੁਸੀਂ ਮਾਡਲ ਦੀ ਗੁਣਵੱਤਾ ਬਾਰੇ ਮੈਟ੍ਰਿਕਸ ਦਾ ਟੇਬਲ ਛਾਪ ਸਕਦੇ ਹੋ।
|
||||
|
||||
🎓 **ਮਾਡਲ ਫਿਟਿੰਗ**
|
||||
|
||||
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਸੰਦਰਭ ਵਿੱਚ, ਮਾਡਲ ਫਿਟਿੰਗ ਮਾਡਲ ਦੇ ਅਧਾਰਭੂਤ ਫੰਕਸ਼ਨ ਦੀ ਸ਼ੁੱਧਤਾ ਨੂੰ ਕਹਿੰਦਾ ਹੈ ਜੋ ਉਹਨਾਂ ਡਾਟਿਆਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਉਹ ਪਹਿਲਾਂ ਨਹੀਂ ਦੇਖਿਆ।
|
||||
|
||||
🎓 **ਅੰਡਰਫਿਟਿੰਗ** ਅਤੇ **ਓਵਰਫਿਟਿੰਗ** ਆਮ ਸਮੱਸਿਆਵਾਂ ਹਨ ਜੋ ਮਾਡਲ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਖਰਾਬ ਕਰਦੀਆਂ ਹਨ, ਜਦੋਂ ਮਾਡਲ ਜਾਂ ਤਾਂ ਕਾਫ਼ੀ ਚੰਗਾ ਫਿਟ ਨਹੀਂ ਹੁੰਦਾ ਜਾਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਚੰਗਾ। ਇਹ ਮਾਡਲ ਨੂੰ ਆਪਣੀ ਟ੍ਰੇਨਿੰਗ ਡਾਟੇ ਨਾਲ ਬਹੁਤ ਜ਼ਿਆਦਾ ਜਾਂ ਬਹੁਤ ਘੱਟ ਮਿਲਦੇ-ਜੁਲਦੇ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦਾ ਕਾਰਨ ਬਣਦਾ ਹੈ। ਇੱਕ ਓਵਰਫਿਟ ਮਾਡਲ ਟ੍ਰੇਨਿੰਗ ਡਾਟੇ ਨੂੰ ਬਹੁਤ ਵਧੀਆ ਪ੍ਰਿਜਣ ਕਰਦਾ ਹੈ ਕਿਉਂਕਿ ਇਸ ਨੇ ਡਾਟੇ ਦੇ ਵੇਰਵੇ ਅਤੇ ਸ਼ੋਰ ਬਹੁਤ ਵਧੀਆ ਸਿੱਖ ਲਿਆ ਹੈ। ਇੱਕ ਅੰਡਰਫਿਟ ਮਾਡਲ ਸਹੀ ਨਹੀਂ ਹੁੰਦਾ ਕਿਉਂਕਿ ਇਹ ਨਾ ਤੂੰ ਆਪਣੀ ਟ੍ਰੇਨਿੰਗ ਡਾਟੇ ਨੂੰ ਸਹੀ ਤਰ੍ਹਾਂ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਪਾਉਂਦਾ ਹੈ ਨਾ ਹੀ ਉਹ ਡਾਟਾ ਜੋ ਇਸਨੇ ਪਹਿਲਾਂ ਨਹੀਂ ਦੇਖਿਆ।
|
||||
|
||||

|
||||
> ਇੰਫੋ ਗ੍ਰਾਫਿਕ ਵੱਲੋਂ [ਜੈਨ ਲੂਪਰ](https://twitter.com/jenlooper)
|
||||
|
||||
## ਪੈਰਾਮੀਟਰ ਟਿਊਨਿੰਗ
|
||||
|
||||
ਜਦੋਂ ਤੁਹਾਡੀ ਸ਼ੁਰੂਆਤੀ ਟ੍ਰੇਨਿੰਗ ਮੁਕੰਮਲ ਹੋ ਜਾਵੇ, ਤਾਂ ਮਾਡਲ ਦੀ ਗੁਣਵੱਤਾ ਦਾ ਅਵਲੋਕਨ ਕਰੋ ਅਤੇ ਇਸਦੇ 'ਹਾਈਪਰਪੈਰਾਮੀਟਰ' ਵਿੱਚ ਤਬਦੀਲੀ ਕਰਕੇ ਇਸਨੂੰ ਸੁਧਾਰਨ ਬਾਰੇ ਸੋਚੋ। ਇਸ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਹੋਰ ਪੜ੍ਹੋ [ਦਸਤਾਵੇਜ਼ੀ ਵਿੱਚ](https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters?WT.mc_id=academic-77952-leestott).
|
||||
|
||||
## ਭਵਿੱਖਬਾਣੀ
|
||||
|
||||
ਇਹ ਉਹ ਸਮਾਂ ਹੈ ਜਿੱਥੇ ਤੁਸੀਂ ਬਿਲਕੁਲ ਨਵਾਂ ਡਾਟਾ ਲੈ ਕੇ ਆਪਣੇ ਮਾਡਲ ਦੀ ਸ਼ੁੱਧਤਾ ਦੀ ਜਾਂਚ ਕਰ ਸਕਦੇ ਹੋ। ਇੱਕ 'ਪ੍ਰਯੋਗਿਕ' ML ਸੈਟਿੰਗ ਵਿੱਚ, ਜਿੱਥੇ ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਉਤਪਾਦਨ ਵਿੱਚ ਵਰਤਣ ਲਈ ਵੈੱਬ ਐਸੈੱਟਸ ਬਣਾ ਰਹੇ ਹੋ, ਇਹ ਪ੍ਰਕਿਰਿਆ ਯੂਜ਼ਰ ਇਨਪੁੱਟ (ਉਦਾਹਰਨ ਵਜੋਂ, ਬੱਟਨ ਦਬਾਉਣਾ) ਇਕੱਠਾ ਕਰਕੇ ਇੱਕ ਵੈਰੀਏਬਲ ਸੈੱਟ ਕਰਨ ਅਤੇ ਮਾਡਲ ਨੂੰ ਪ੍ਰਕਿਰਿਆ ਜਾਂ ਮੁਲਾਂਕਣ ਲਈ ਭੇਜਣ ਦੀ ਸ਼ਾਮਲ ਕਰ ਸਕਦੀ ਹੈ।
|
||||
|
||||
ਇਨ੍ਹਾਂ ਪਾਠਾਂ ਵਿੱਚ, ਤੁਸੀਂ ਇਹ ਜਾਣੋਗੇ ਕਿ ਇਹ ਕਦਮ ਕਿਵੇਂ ਤਿਆਰ, ਬਣਾਉਣ, ਟੈਸਟ, ਮੁਲਾਂਕਣ ਅਤੇ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਵਰਤੇ ਜਾਣਗੇ - ਇਹ ਸਾਰੇ ਡਾਟਾ ਵਿਗਿਆਨੀ ਦੀਆਂ ਹਰਕਤਾਂ ਹਨ ਅਤੇ ਵੱਧ-ਵੱਧ, ਜਿਵੇਂ ਕਿ ਤੁਸੀਂ 'ਫੁੱਲ ਸਟੈਕ' ML ਇੰਜੀਨੀਅਰ ਬਣਨ ਦੇ ਸਫ਼ਰ ਵਿੱਚ ਅੱਗੇ ਵਧਦੇ ਹੋ।
|
||||
|
||||
---
|
||||
|
||||
## 🚀ਚੈਲੇੰਜ
|
||||
|
||||
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਭਿਆਸਕ ਦੀ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਇੱਕ ਫਲੋ ਚਾਰਟ ਬਣਾਓ। ਤੁਸੀਂ ਇਸ ਸਮੇਂ ਪ੍ਰਕਿਰਿਆ ਦੇ ਕਿਹੜੇ ਹਿੱਸੇ ਵਿੱਚ ਹੋ? ਤੁਹਾਨੂੰ ਕਿਹੜੀਆਂ ਮੁਸ਼ਕਲਾਂ ਦਾ ਸਾਹਮਣਾ ਹੋ ਸਕਦਾ ਹੈ? ਤੁਹਾਨੂੰ ਕੀ ਚੀਜ਼ ਸੌਖੀ ਲੱਗਦੀ ਹੈ?
|
||||
|
||||
## [ਪੋਸਟ-ਲੇਕਚਰ ਕਿਊਜ਼](https://ff-quizzes.netlify.app/en/ml/)
|
||||
|
||||
## ਸਮੀਖਿਆ ਅਤੇ ਸਵਯੰ ਅਧਿਐਨ
|
||||
|
||||
ਡਾਟਾ ਸਾਇੰਟਿਸਟਾਂ ਨਾਲ ਇੰਟਰਵਿਊਜ਼ ਖੋਜੋ ਜੋ ਆਪਣੇ ਰੋਜ਼ਾਨਾ ਕੰਮ ਬਾਰੇ ਗੱਲ ਕਰਦੇ ਹਨ। ਇੱਥੇ [ਇੱਕ](https://www.youtube.com/watch?v=Z3IjgbbCEfs) ਹੈ।
|
||||
|
||||
## ਅਸਾਈਨਮੈਂਟ
|
||||
|
||||
[ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਦਾ ਇੰਟਰਵਿਊ ਕਰੋ](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
**ਅਸਵੀਕਾਰਨਾ**:
|
||||
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀਤਾ ਲਈ ਯਤਨਸ਼ੀਲ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚਨਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**ਅਸਵੀਕਾਰੋਪਤਰ**:
|
||||
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀਤਾ ਲਈ ਯਤਨ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਵਿੱਚ ਰੱਖੋ ਕਿ ਆਟੋਮੈਟਿਕ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸਹੀਤੀਆਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਆਪਣੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਿਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਅਸੀਂ ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹੋਏ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
Loading…
Reference in new issue