You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
119 lines
25 KiB
119 lines
25 KiB
<!--
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
{
|
|
"original_hash": "0f67a4139454816631526779a456b734",
|
|
"translation_date": "2025-09-06T18:25:15+00:00",
|
|
"source_file": "6-Data-Science-In-Wild/20-Real-World-Examples/README.md",
|
|
"language_code": "pa"
|
|
}
|
|
-->
|
|
# ਹਕੀਕਤੀ ਦੁਨੀਆ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ
|
|
|
|
|  ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਸਕੈਚਨੋਟ ](../../sketchnotes/20-DataScience-RealWorld.png) |
|
|
| :--------------------------------------------------------------------------------------------------------------: |
|
|
| ਹਕੀਕਤੀ ਦੁਨੀਆ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ - _[@nitya](https://twitter.com/nitya) ਦੁਆਰਾ ਸਕੈਚਨੋਟ_ |
|
|
|
|
ਅਸੀਂ ਇਸ ਸਿੱਖਣ ਯਾਤਰਾ ਦੇ ਅੰਤ ਦੇ ਨੇੜੇ ਪਹੁੰਚ ਰਹੇ ਹਾਂ!
|
|
|
|
ਅਸੀਂ ਡਾਟਾ ਸਾਇੰਸ ਅਤੇ ਨੈਤਿਕਤਾ ਦੀਆਂ ਪਰਿਭਾਸ਼ਾਵਾਂ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕੀਤੀ, ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਲਈ ਵੱਖ-ਵੱਖ ਟੂਲ ਅਤੇ ਤਕਨੀਕਾਂ ਦੀ ਪੜਚੋਲ ਕੀਤੀ, ਡਾਟਾ ਸਾਇੰਸ ਲਾਈਫਸਾਈਕਲ ਦੀ ਸਮੀਖਿਆ ਕੀਤੀ, ਅਤੇ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਸੇਵਾਵਾਂ ਨਾਲ ਡਾਟਾ ਸਾਇੰਸ ਵਰਕਫਲੋਜ਼ ਨੂੰ ਸਕੇਲ ਅਤੇ ਆਟੋਮੇਟ ਕਰਨ ਦੇ ਤਰੀਕੇ ਵੇਖੇ। ਤਾਂ, ਤੁਸੀਂ ਸ਼ਾਇਦ ਸੋਚ ਰਹੇ ਹੋ: _"ਇਹ ਸਾਰੀਆਂ ਸਿੱਖਿਆਵਾਂ ਨੂੰ ਹਕੀਕਤੀ ਸੰਦਰਭਾਂ ਨਾਲ ਕਿਵੇਂ ਜੋੜਿਆ ਜਾਵੇ?"_
|
|
|
|
ਇਸ ਪਾਠ ਵਿੱਚ, ਅਸੀਂ ਉਦਯੋਗ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਦੇ ਹਕੀਕਤੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਪੜਚੋਲ ਕਰਾਂਗੇ ਅਤੇ ਖੋਜ, ਡਿਜ਼ੀਟਲ ਹਿਊਮੈਨਿਟੀਜ਼ ਅਤੇ ਸਸਤੇ ਵਿਕਾਸ ਦੇ ਸੰਦਰਭਾਂ ਵਿੱਚ ਖਾਸ ਉਦਾਹਰਣਾਂ ਵਿੱਚ ਡੁੱਬਾਂਗੇ। ਅਸੀਂ ਵਿਦਿਆਰਥੀ ਪ੍ਰੋਜੈਕਟ ਦੇ ਮੌਕਿਆਂ ਨੂੰ ਵੇਖਾਂਗੇ ਅਤੇ ਤੁਹਾਡੀ ਸਿੱਖਣ ਯਾਤਰਾ ਨੂੰ ਜਾਰੀ ਰੱਖਣ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਲਾਭਦਾਇਕ ਸਰੋਤਾਂ ਨਾਲ ਸਮਾਪਤ ਕਰਾਂਗੇ!
|
|
|
|
## ਪਾਠ-ਪਹਿਲਾਂ ਪ੍ਰਸ਼ਨਾਵਲੀ
|
|
|
|
## [ਪਾਠ-ਪਹਿਲਾਂ ਪ੍ਰਸ਼ਨਾਵਲੀ](https://ff-quizzes.netlify.app/en/ds/quiz/38)
|
|
|
|
## ਡਾਟਾ ਸਾਇੰਸ + ਉਦਯੋਗ
|
|
|
|
AI ਦੇ ਲੋਕਤੰਤਰਿਕਰਨ ਦੇ ਕਾਰਨ, ਵਿਕਾਸਕਾਰਾਂ ਲਈ ਹੁਣ AI-ਚਲਿਤ ਫੈਸਲਾ-ਲੈਣ ਅਤੇ ਡਾਟਾ-ਚਲਿਤ ਅੰਦਰੂਨੀ ਜਾਣਕਾਰੀ ਨੂੰ ਯੂਜ਼ਰ ਅਨੁਭਵਾਂ ਅਤੇ ਵਿਕਾਸ ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਡਿਜ਼ਾਈਨ ਅਤੇ ਸ਼ਾਮਲ ਕਰਨਾ ਆਸਾਨ ਹੋ ਗਿਆ ਹੈ। ਇੱਥੇ ਕੁਝ ਉਦਾਹਰਣ ਹਨ ਕਿ ਕਿਵੇਂ ਡਾਟਾ ਸਾਇੰਸ ਨੂੰ ਉਦਯੋਗ ਵਿੱਚ "ਲਾਗੂ" ਕੀਤਾ ਜਾਂਦਾ ਹੈ:
|
|
|
|
* [ਗੂਗਲ ਫਲੂ ਟ੍ਰੈਂਡਸ](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) ਨੇ ਖੋਜ ਸ਼ਬਦਾਂ ਨੂੰ ਫਲੂ ਟ੍ਰੈਂਡਸ ਨਾਲ ਜੋੜਨ ਲਈ ਡਾਟਾ ਸਾਇੰਸ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਹਾਲਾਂਕਿ ਇਸ ਤਰੀਕੇ ਵਿੱਚ ਖਾਮੀਆਂ ਸਨ, ਇਸ ਨੇ ਡਾਟਾ-ਚਲਿਤ ਸਿਹਤ ਸੰਭਾਵਨਾਵਾਂ (ਅਤੇ ਚੁਣੌਤੀਆਂ) ਬਾਰੇ ਜਾਗਰੂਕਤਾ ਵਧਾਈ।
|
|
|
|
* [UPS ਰੂਟਿੰਗ ਪੇਸ਼ਗੂਈ](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - ਇਹ ਦੱਸਦਾ ਹੈ ਕਿ UPS ਕਿਵੇਂ ਮੌਸਮ ਦੀ ਸਥਿਤੀ, ਟ੍ਰੈਫਿਕ ਪੈਟਰਨ, ਡਿਲਿਵਰੀ ਦੀਆਂ ਮਿਆਦਾਂ ਅਤੇ ਹੋਰ ਗੱਲਾਂ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ ਡਿਲਿਵਰੀ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਰਸਤੇ ਦੀ ਪੇਸ਼ਗੂਈ ਕਰਨ ਲਈ ਡਾਟਾ ਸਾਇੰਸ ਅਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।
|
|
|
|
* [NYC ਟੈਕਸੀ ਰੂਟ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ](http://chriswhong.github.io/nyctaxi/) - [ਸੂਚਨਾ ਦੀ ਆਜ਼ਾਦੀ ਦੇ ਕਾਨੂੰਨਾਂ](https://chriswhong.com/open-data/foil_nyc_taxi/) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਡਾਟਾ ਨੇ NYC ਟੈਕਸੀਆਂ ਦੇ ਦਿਨ ਦੀ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ, ਜਿਸ ਨਾਲ ਸਾਨੂੰ ਸਮਝ ਆਉਂਦੀ ਹੈ ਕਿ ਉਹ ਕਿਵੇਂ ਵਿਆਸਤ ਸ਼ਹਿਰ ਵਿੱਚ ਚਲਦੇ ਹਨ, ਉਹ ਕਿੰਨਾ ਪੈਸਾ ਕਮਾਉਂਦੇ ਹਨ, ਅਤੇ ਹਰ 24-ਘੰਟੇ ਦੇ ਅਰਸੇ ਦੌਰਾਨ ਯਾਤਰਾਵਾਂ ਦੀ ਮਿਆਦ ਕੀ ਹੁੰਦੀ ਹੈ।
|
|
|
|
* [ਉਬਰ ਡਾਟਾ ਸਾਇੰਸ ਵਰਕਬੈਂਚ](https://eng.uber.com/dsw/) - ਹਰ ਰੋਜ਼ ਲੱਖਾਂ ਉਬਰ ਯਾਤਰਾਵਾਂ ਤੋਂ ਇਕੱਠੇ ਕੀਤੇ ਡਾਟਾ (ਜਿਵੇਂ ਕਿ ਪਿਕਅੱਪ ਅਤੇ ਡ੍ਰੌਪਅੱਪ ਸਥਾਨ, ਯਾਤਰਾ ਦੀ ਮਿਆਦ, ਪਸੰਦੀਦਾ ਰਸਤੇ ਆਦਿ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਮਤ ਨਿਰਧਾਰਨ, ਸੁਰੱਖਿਆ, ਧੋਖਾਧੜੀ ਦੀ ਪਛਾਣ ਅਤੇ ਨੈਵੀਗੇਸ਼ਨ ਫੈਸਲਿਆਂ ਵਿੱਚ ਮਦਦ ਲਈ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲ ਬਣਾਉਣਾ।
|
|
|
|
* [ਖੇਡ ਵਿਸ਼ਲੇਸ਼ਣ](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - _ਪੇਸ਼ਗੂਈ ਵਿਸ਼ਲੇਸ਼ਣ_ (ਟੀਮ ਅਤੇ ਖਿਡਾਰੀ ਵਿਸ਼ਲੇਸ਼ਣ - ਜਿਵੇਂ [ਮਨੀਬਾਲ](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - ਅਤੇ ਪ੍ਰਸ਼ੰਸਕ ਪ੍ਰਬੰਧਨ) ਅਤੇ _ਡਾਟਾ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ_ (ਟੀਮ ਅਤੇ ਪ੍ਰਸ਼ੰਸਕ ਡੈਸ਼ਬੋਰਡ, ਖੇਡਾਂ ਆਦਿ) 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਪ੍ਰਤਿਭਾ ਖੋਜ, ਖੇਡ ਜੂਆ ਅਤੇ ਸਟੇਡੀਅਮ ਪ੍ਰਬੰਧਨ ਵਰਗੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਸ਼ਾਮਲ ਹਨ।
|
|
|
|
* [ਬੈਂਕਿੰਗ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ](https://data-flair.training/blogs/data-science-in-banking/) - ਵਿੱਤੀ ਉਦਯੋਗ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਦੇ ਮੁੱਲ ਨੂੰ ਰਿਸਕ ਮਾਡਲਿੰਗ ਅਤੇ ਧੋਖਾਧੜੀ ਦੀ ਪਛਾਣ ਤੋਂ ਲੈ ਕੇ ਗਾਹਕ ਸੈਗਮੈਂਟੇਸ਼ਨ, ਰੀਅਲ-ਟਾਈਮ ਪੇਸ਼ਗੂਈ ਅਤੇ ਰਿਕਮੈਂਡਰ ਸਿਸਟਮ ਤੱਕ ਦੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨਾਲ ਹਾਈਲਾਈਟ ਕਰਦਾ ਹੈ। ਪੇਸ਼ਗੂਈ ਵਿਸ਼ਲੇਸ਼ਣ ਮਹੱਤਵਪੂਰਨ ਮਾਪਦੰਡਾਂ ਨੂੰ ਵੀ ਚਲਾਉਂਦਾ ਹੈ ਜਿਵੇਂ ਕਿ [ਕ੍ਰੈਡਿਟ ਸਕੋਰ](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit)।
|
|
|
|
* [ਸਿਹਤ ਸੇਵਾਵਾਂ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ](https://data-flair.training/blogs/data-science-in-healthcare/) - ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਹਾਈਲਾਈਟ ਕਰਦਾ ਹੈ ਜਿਵੇਂ ਕਿ ਮੈਡੀਕਲ ਇਮੇਜਿੰਗ (ਜਿਵੇਂ ਕਿ MRI, X-Ray, CT-Scan), ਜਿਨੋਮਿਕਸ (DNA ਸਿਕਵੈਂਸਿੰਗ), ਦਵਾਈ ਵਿਕਾਸ (ਖਤਰੇ ਦਾ ਮੁਲਾਂਕਣ, ਸਫਲਤਾ ਦੀ ਪੇਸ਼ਗੂਈ), ਪੇਸ਼ਗੂਈ ਵਿਸ਼ਲੇਸ਼ਣ (ਮਰੀਜ਼ ਦੀ ਦੇਖਭਾਲ ਅਤੇ ਸਪਲਾਈ ਲੌਜਿਸਟਿਕਸ), ਬਿਮਾਰੀ ਟ੍ਰੈਕਿੰਗ ਅਤੇ ਰੋਕਥਾਮ ਆਦਿ।
|
|
|
|
 ਚਿੱਤਰ ਸ੍ਰੋਤ: [ਡਾਟਾ ਫਲੇਅਰ: ਡਾਟਾ ਸਾਇੰਸ ਦੇ 6 ਸ਼ਾਨਦਾਰ ਐਪਲੀਕੇਸ਼ਨ](https://data-flair.training/blogs/data-science-applications/)
|
|
|
|
ਇਸ ਚਿੱਤਰ ਵਿੱਚ ਹੋਰ ਖੇਤਰ ਅਤੇ ਡਾਟਾ ਸਾਇੰਸ ਤਕਨੀਕਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਦੇ ਉਦਾਹਰਣ ਦਿਖਾਏ ਗਏ ਹਨ। ਹੋਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਪੜਚੋਲ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ? ਹੇਠਾਂ ਦਿੱਤੇ [ਸਮੀਖਿਆ ਅਤੇ ਸਵੈ ਅਧਿਐਨ](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) ਭਾਗ ਨੂੰ ਵੇਖੋ।
|
|
|
|
## ਡਾਟਾ ਸਾਇੰਸ + ਖੋਜ
|
|
|
|
|  ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਸਕੈਚਨੋਟ ](../../sketchnotes/20-DataScience-Research.png) |
|
|
| :---------------------------------------------------------------------------------------------------------------: |
|
|
| ਡਾਟਾ ਸਾਇੰਸ ਅਤੇ ਖੋਜ - _[@nitya](https://twitter.com/nitya) ਦੁਆਰਾ ਸਕੈਚਨੋਟ_ |
|
|
|
|
ਜਦੋਂ ਕਿ ਹਕੀਕਤੀ ਦੁਨੀਆ ਦੇ ਐਪਲੀਕੇਸ਼ਨ ਅਕਸਰ ਉਦਯੋਗ ਦੇ ਵੱਡੇ ਪੱਧਰ ਦੇ ਕੇਸਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦੇ ਹਨ, _ਖੋਜ_ ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਪ੍ਰੋਜੈਕਟ ਦੋ ਦ੍ਰਿਸ਼ਟੀਕੋਣਾਂ ਤੋਂ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦੇ ਹਨ:
|
|
|
|
* _ਨਵਾਚਾਰ ਦੇ ਮੌਕੇ_ - ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਉੱਨਤ ਧਾਰਨਾਵਾਂ ਦੇ ਤੇਜ਼ ਪ੍ਰੋਟੋਟਾਈਪਿੰਗ ਅਤੇ ਯੂਜ਼ਰ ਅਨੁਭਵਾਂ ਦੀ ਜਾਂਚ ਕਰੋ।
|
|
* _ਤੈਨਾਤੀ ਚੁਣੌਤੀਆਂ_ - ਹਕੀਕਤੀ ਸੰਦਰਭਾਂ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਤਕਨੀਕਾਂ ਦੇ ਸੰਭਾਵਿਤ ਨੁਕਸਾਨ ਜਾਂ ਅਣਜਾਣੇ ਨਤੀਜਿਆਂ ਦੀ ਜਾਂਚ ਕਰੋ।
|
|
|
|
ਵਿਦਿਆਰਥੀਆਂ ਲਈ, ਇਹ ਖੋਜ ਪ੍ਰੋਜੈਕਟ ਸਿੱਖਣ ਅਤੇ ਸਹਿਯੋਗ ਦੇ ਮੌਕੇ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਤੁਹਾਡੀ ਵਿਸ਼ੇ ਦੀ ਸਮਝ ਨੂੰ ਸੁਧਾਰ ਸਕਦੇ ਹਨ, ਅਤੇ ਰੁਚੀ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਕੰਮ ਕਰ ਰਹੇ ਸਬੰਧਤ ਲੋਕਾਂ ਜਾਂ ਟੀਮਾਂ ਨਾਲ ਤੁਹਾਡੀ ਜਾਗਰੂਕਤਾ ਅਤੇ ਸਹਿਭਾਗਤਾ ਨੂੰ ਵਧਾ ਸਕਦੇ ਹਨ। ਤਾਂ ਖੋਜ ਪ੍ਰੋਜੈਕਟ ਕਿਵੇਂ ਦਿਖਦੇ ਹਨ ਅਤੇ ਉਹ ਕਿਵੇਂ ਪ੍ਰਭਾਵ ਪਾ ਸਕਦੇ ਹਨ?
|
|
|
|
ਆਓ ਇੱਕ ਉਦਾਹਰਣ ਵੇਖੀਏ - [MIT ਜੈਂਡਰ ਸ਼ੇਡਸ ਅਧਿਐਨ](http://gendershades.org/overview.html) ਜੋਏ ਬੁਓਲਾਮਵਿਨੀ (MIT ਮੀਡੀਆ ਲੈਬਜ਼) ਦੁਆਰਾ ਇੱਕ [ਦਸਤਖਤ ਖੋਜ ਪੇਪਰ](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) ਦੇ ਨਾਲ, ਜੋ ਟਿਮਨਿਟ ਗੇਬਰੂ (ਤਦ ਮਾਈਕਰੋਸਾਫਟ ਰਿਸਰਚ ਵਿੱਚ) ਨਾਲ ਸਹਿ-ਲਿਖਿਆ ਗਿਆ ਸੀ, ਜਿਸ ਨੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕੀਤਾ:
|
|
|
|
* **ਕੀ:** ਖੋਜ ਪ੍ਰੋਜੈਕਟ ਦਾ ਉਦੇਸ਼ ਸੀ _ਲਿੰਗ ਅਤੇ ਚਮੜੀ ਦੇ ਰੰਗ ਦੇ ਆਧਾਰ 'ਤੇ ਆਟੋਮੈਟਿਕ ਚਿਹਰਾ ਵਿਸ਼ਲੇਸ਼ਣ ਐਲਗੋਰਿਥਮ ਅਤੇ ਡਾਟਾਸੈਟ ਵਿੱਚ ਮੌਜੂਦ ਪੱਖਪਾਤ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ।_
|
|
* **ਕਿਉਂ:** ਚਿਹਰਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਾਨੂੰਨ ਲਾਗੂ ਕਰਨ, ਹਵਾਈ ਅੱਡੇ ਦੀ ਸੁਰੱਖਿਆ, ਭਰਤੀ ਪ੍ਰਣਾਲੀਆਂ ਅਤੇ ਹੋਰ ਖੇਤਰਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ - ਜਿੱਥੇ ਗਲਤ ਵਰਗੀਕਰਨ (ਜਿਵੇਂ ਕਿ ਪੱਖਪਾਤ ਦੇ ਕਾਰਨ) ਪ੍ਰਭਾਵਿਤ ਵਿਅਕਤੀਆਂ ਜਾਂ ਸਮੂਹਾਂ ਲਈ ਸੰਭਾਵਿਤ ਆਰਥਿਕ ਅਤੇ ਸਮਾਜਿਕ ਨੁਕਸਾਨ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ। ਵਰਤੋਂ ਵਿੱਚ ਨਿਰਪੱਖਤਾ ਲਈ ਪੱਖਪਾਤ ਨੂੰ ਸਮਝਣਾ (ਅਤੇ ਖਤਮ ਕਰਨਾ ਜਾਂ ਘਟਾਉਣਾ) ਮਹੱਤਵਪੂਰਨ ਹੈ।
|
|
* **ਕਿਵੇਂ:** ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਮਾਨਤਾ ਦਿੱਤੀ ਕਿ ਮੌਜੂਦਾ ਬੈਂਚਮਾਰਕ ਮੁੱਖ ਤੌਰ 'ਤੇ ਹਲਕੇ ਚਮੜੀ ਵਾਲੇ ਵਿਸ਼ਿਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਅਤੇ ਇੱਕ ਨਵਾਂ ਡਾਟਾਸੈਟ (1000+ ਚਿੱਤਰ) ਤਿਆਰ ਕੀਤਾ ਜੋ ਲਿੰਗ ਅਤੇ ਚਮੜੀ ਦੇ ਰੰਗ ਦੁਆਰਾ _ਵਧੇਰੇ ਸੰਤੁਲਿਤ_ ਸੀ। ਇਸ ਡਾਟਾਸੈਟ ਦੀ ਵਰਤੋਂ ਤਿੰਨ ਲਿੰਗ ਵਰਗੀਕਰਨ ਉਤਪਾਦਾਂ (ਮਾਈਕਰੋਸਾਫਟ, IBM ਅਤੇ ਫੇਸ++) ਦੀ ਸ਼ੁੱਧਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਕੀਤੀ ਗਈ।
|
|
|
|
ਨਤੀਜਿਆਂ ਨੇ ਦਿਖਾਇਆ ਕਿ ਹਾਲਾਂਕਿ ਕੁੱਲ ਵਰਗੀਕਰਨ ਸ਼ੁੱਧਤਾ ਚੰਗੀ ਸੀ, ਵੱਖ-ਵੱਖ ਉਪਸਮੂਹਾਂ ਵਿੱਚ ਗਲਤੀ ਦੀਆਂ ਦਰਾਂ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਅੰਤਰ ਸੀ - ਜਿਸ ਨਾਲ **ਗਲਤ ਲਿੰਗ ਨਿਰਧਾਰਨ** ਮਹਿਲਾਵਾਂ ਜਾਂ ਗੂੜ੍ਹੇ ਚਮੜੀ ਵਾਲੇ ਵਿਅਕਤੀਆਂ ਲਈ ਵੱਧ ਸੀ, ਜੋ ਪੱਖਪਾਤ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ।
|
|
|
|
**ਮੁੱਖ ਨਤੀਜੇ:** ਇਹ ਜਾਗਰੂਕਤਾ ਵਧਾਈ ਕਿ ਡਾਟਾ ਸਾਇੰਸ ਨੂੰ ਵਧੇਰੇ _ਪ੍ਰਤੀਨਿਧੀ ਡਾਟਾਸੈਟ_ (ਸੰਤੁਲਿਤ ਉਪਸਮੂਹ) ਅਤੇ ਵਧੇਰੇ _ਸਮਾਵੇਸ਼ੀ ਟੀਮਾਂ_ (ਵਿਭਿੰਨ ਪਿਛੋਕੜ) ਦੀ ਲੋੜ ਹੈ ਤਾਂ ਜੋ AI ਹੱਲਾਂ ਵਿੱਚ ਅਜਿਹੇ ਪੱਖਪਾਤਾਂ ਨੂੰ ਜਲਦੀ ਪਛਾਣਿਆ ਜਾ ਸਕੇ ਅਤੇ ਖਤਮ ਕੀਤਾ ਜਾ ਸਕੇ। ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਖੋਜ ਯਤਨ ਬਹੁਤ ਸਾਰੀਆਂ ਸੰਸਥਾਵਾਂ ਵਿੱਚ _ਜਿੰਮੇਵਾਰ AI_ ਲਈ ਸਿਧਾਂਤਾਂ ਅਤੇ ਅਭਿਆਸਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਵਿੱਚ ਵੀ ਸਹਾਇਕ ਹਨ, ਤਾਂ ਜੋ ਉਹਨਾਂ ਦੇ AI ਉਤਪਾਦਾਂ ਅਤੇ ਪ੍ਰਕਿਰਿਆਵਾਂ ਵਿੱਚ ਨਿਰਪੱਖਤਾ ਨੂੰ ਸੁਧਾਰਿਆ ਜਾ ਸਕੇ।
|
|
|
|
**ਮਾਈਕਰੋਸਾਫਟ ਵਿੱਚ ਸਬੰਧਤ ਖੋਜ ਯਤਨਾਂ ਬਾਰੇ ਜਾਣਨਾ ਚਾਹੁੰਦੇ ਹੋ?**
|
|
|
|
* [ਮਾਈਕਰੋਸਾਫਟ ਰਿਸਰਚ ਪ੍ਰੋਜੈਕਟ](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) 'ਤੇ Artificial Intelligence ਦੇ ਖੇਤਰ ਦੀ ਪੜਚੋਲ ਕਰੋ।
|
|
* [ਮਾਈਕਰੋਸਾਫਟ ਰਿਸਰਚ ਡਾਟਾ ਸਾਇੰਸ ਸਮਰ ਸਕੂਲ](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/) ਤੋਂ ਵਿਦਿਆਰਥੀ ਪ੍ਰੋਜੈਕਟਾਂ ਦੀ ਪੜਚੋਲ ਕਰੋ।
|
|
* [Fairlearn](https://fairlearn.org/) ਪ੍ਰੋਜੈਕਟ ਅਤੇ [ਜਿੰਮੇਵਾਰ AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) ਪਹਲਾਂ ਦੀ ਜਾਂਚ ਕਰੋ।
|
|
**ਪਲੇਨਟਰੀ ਕੰਪਿਊਟਰ ਪ੍ਰੋਜੈਕਟ ਇਸ ਸਮੇਂ ਪ੍ਰੀਵਿਊ ਵਿੱਚ ਹੈ (ਸਤੰਬਰ 2021 ਤੱਕ)** - ਇੱਥੇ ਦਿਖਾਇਆ ਗਿਆ ਹੈ ਕਿ ਤੁਸੀਂ ਡਾਟਾ ਸਾਇੰਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਥਿਰਤਾ ਦੇ ਹੱਲਾਂ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਣ ਦੀ ਸ਼ੁਰੂਆਤ ਕਿਵੇਂ ਕਰ ਸਕਦੇ ਹੋ।
|
|
|
|
* [ਪਹੁੰਚ ਦੀ ਬੇਨਤੀ ਕਰੋ](https://planetarycomputer.microsoft.com/account/request) ਤਾਕਿ ਖੋਜ ਸ਼ੁਰੂ ਕੀਤੀ ਜਾ ਸਕੇ ਅਤੇ ਸਾਥੀਆਂ ਨਾਲ ਜੁੜਿਆ ਜਾ ਸਕੇ।
|
|
* [ਡਾਕੂਮੈਂਟੇਸ਼ਨ ਦੀ ਖੋਜ ਕਰੋ](https://planetarycomputer.microsoft.com/docs/overview/about) ਤਾਕਿ ਸਮਝਿਆ ਜਾ ਸਕੇ ਕਿ ਕਿਹੜੇ ਡਾਟਾਸੈਟ ਅਤੇ APIs ਸਹਾਇਕ ਹਨ।
|
|
* [ਇਕੋਸਿਸਟਮ ਮਾਨੀਟਰਿੰਗ](https://analytics-lab.org/ecosystemmonitoring/) ਵਰਗੇ ਐਪਲੀਕੇਸ਼ਨ ਦੀ ਖੋਜ ਕਰੋ ਜੋ ਐਪਲੀਕੇਸ਼ਨ ਵਿਚਾਰਾਂ ਲਈ ਪ੍ਰੇਰਨਾ ਦੇ ਸਕਦੇ ਹਨ।
|
|
|
|
ਸੋਚੋ ਕਿ ਤੁਸੀਂ ਕਿਵੇਂ ਡਾਟਾ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਜ਼ਰੂਰੀ ਜਾਣਕਾਰੀ ਨੂੰ ਉਜਾਗਰ ਕਰ ਸਕਦੇ ਹੋ ਜਾਂ ਜੰਗਲਾਂ ਦੀ ਕਟਾਈ ਅਤੇ ਮੌਸਮ ਬਦਲਾਅ ਵਰਗੇ ਖੇਤਰਾਂ ਵਿੱਚ ਜਾਣਕਾਰੀ ਨੂੰ ਵਧਾ ਸਕਦੇ ਹੋ। ਜਾਂ ਸੋਚੋ ਕਿ ਇਹ ਜਾਣਕਾਰੀ ਕਿਵੇਂ ਨਵੇਂ ਯੂਜ਼ਰ ਅਨੁਭਵ ਬਣਾਉਣ ਲਈ ਵਰਤੀ ਜਾ ਸਕਦੀ ਹੈ ਜੋ ਜ਼ਿੰਮੇਵਾਰ ਜੀਵਨ ਸ਼ੈਲੀ ਲਈ ਵਿਹਾਰਕ ਬਦਲਾਅ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰ ਸਕਦੀ ਹੈ।
|
|
|
|
## ਡਾਟਾ ਸਾਇੰਸ + ਵਿਦਿਆਰਥੀ
|
|
|
|
ਅਸੀਂ ਉਦਯੋਗ ਅਤੇ ਖੋਜ ਵਿੱਚ ਅਸਲ-ਜਗਤ ਦੇ ਐਪਲੀਕੇਸ਼ਨ ਬਾਰੇ ਗੱਲ ਕੀਤੀ ਹੈ ਅਤੇ ਡਿਜੀਟਲ ਹਿਊਮੈਨਿਟੀਜ਼ ਅਤੇ ਸਥਿਰਤਾ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਐਪਲੀਕੇਸ਼ਨ ਦੇ ਉਦਾਹਰਨਾਂ ਦੀ ਖੋਜ ਕੀਤੀ ਹੈ। ਤਾਂ ਤੁਸੀਂ ਡਾਟਾ ਸਾਇੰਸ ਸ਼ੁਰੂਆਤੀ ਹੋਣ ਦੇ ਨਾਤੇ ਆਪਣੀਆਂ ਕੌਸ਼ਲਾਂ ਕਿਵੇਂ ਵਿਕਸਿਤ ਕਰ ਸਕਦੇ ਹੋ ਅਤੇ ਆਪਣੀ ਮਹਾਰਤ ਸਾਂਝੀ ਕਰ ਸਕਦੇ ਹੋ?
|
|
|
|
ਇੱਥੇ ਕੁਝ ਡਾਟਾ ਸਾਇੰਸ ਵਿਦਿਆਰਥੀ ਪ੍ਰੋਜੈਕਟਾਂ ਦੇ ਉਦਾਹਰਨ ਹਨ ਜੋ ਤੁਹਾਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰ ਸਕਦੇ ਹਨ।
|
|
|
|
* [MSR ਡਾਟਾ ਸਾਇੰਸ ਸਮਰ ਸਕੂਲ](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) GitHub [ਪ੍ਰੋਜੈਕਟਾਂ](https://github.com/msr-ds3) ਨਾਲ ਜੋ ਹੇਠਾਂ ਦਿੱਤੇ ਵਿਸ਼ਿਆਂ ਦੀ ਖੋਜ ਕਰਦੇ ਹਨ:
|
|
- [ਪੁਲਿਸ ਦੇ ਬਲ ਦੇ ਵਰਤੋਂ ਵਿੱਚ ਨਸਲੀ ਪੱਖਪਾਤ](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk)
|
|
- [NYC ਸਬਵੇ ਸਿਸਟਮ ਦੀ ਭਰੋਸੇਯੋਗਤਾ](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit)
|
|
* [ਮੈਟਰੀਅਲ ਕਲਚਰ ਨੂੰ ਡਿਜੀਟਲ ਬਣਾਉਣਾ: ਸਿਰਕਾਪ ਵਿੱਚ ਸਮਾਜਿਕ-ਆਰਥਿਕ ਵੰਡਾਂ ਦੀ ਖੋਜ](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - [Ornella Altunyan](https://twitter.com/ornelladotcom) ਅਤੇ ਕਲੇਰਮੌਂਟ ਦੀ ਟੀਮ ਦੁਆਰਾ, [ArcGIS StoryMaps](https://storymaps.arcgis.com/) ਦੀ ਵਰਤੋਂ ਕਰਕੇ।
|
|
|
|
## 🚀 ਚੁਣੌਤੀ
|
|
|
|
ਉਹ ਲੇਖ ਖੋਜੋ ਜੋ ਸ਼ੁਰੂਆਤੀ ਲਈ ਡਾਟਾ ਸਾਇੰਸ ਪ੍ਰੋਜੈਕਟਾਂ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਨ - ਜਿਵੇਂ [ਇਹ 50 ਵਿਸ਼ਿਆਂ](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) ਜਾਂ [ਇਹ 21 ਪ੍ਰੋਜੈਕਟ ਵਿਚਾਰ](https://www.intellspot.com/data-science-project-ideas) ਜਾਂ [ਇਹ 16 ਪ੍ਰੋਜੈਕਟ ਸੋਰਸ ਕੋਡ ਨਾਲ](https://data-flair.training/blogs/data-science-project-ideas/) ਜੋ ਤੁਸੀਂ ਵਿਖੰਡਨ ਅਤੇ ਰੀਮਿਕਸ ਕਰ ਸਕਦੇ ਹੋ। ਅਤੇ ਆਪਣੀਆਂ ਸਿੱਖਣ ਦੀਆਂ ਯਾਤਰਾਵਾਂ ਬਾਰੇ ਬਲੌਗ ਕਰਨਾ ਨਾ ਭੁੱਲੋ ਅਤੇ ਸਾਰਿਆਂ ਨਾਲ ਆਪਣੀਆਂ ਜਾਣਕਾਰੀਆਂ ਸਾਂਝੀਆਂ ਕਰੋ।
|
|
|
|
## ਪੋਸਟ-ਲੈਕਚਰ ਕਵਿਜ਼
|
|
|
|
## [ਪੋਸਟ-ਲੈਕਚਰ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ds/quiz/39)
|
|
|
|
## ਸਮੀਖਿਆ ਅਤੇ ਸਵੈ-ਅਧਿਐਨ
|
|
|
|
ਹੋਰ ਵਰਤੋਂ ਦੇ ਕੇਸਾਂ ਦੀ ਖੋਜ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ? ਇੱਥੇ ਕੁਝ ਸਬੰਧਤ ਲੇਖ ਹਨ:
|
|
* [17 ਡਾਟਾ ਸਾਇੰਸ ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਉਦਾਹਰਨ](https://builtin.com/data-science/data-science-applications-examples) - ਜੁਲਾਈ 2021
|
|
* [ਅਸਲ ਜਗਤ ਵਿੱਚ 11 ਸ਼ਾਨਦਾਰ ਡਾਟਾ ਸਾਇੰਸ ਐਪਲੀਕੇਸ਼ਨ](https://myblindbird.com/data-science-applications-real-world/) - ਮਈ 2021
|
|
* [ਅਸਲ ਜਗਤ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ](https://towardsdatascience.com/data-science-in-the-real-world/home) - ਲੇਖ ਸੰਗ੍ਰਹਿ
|
|
* [12 ਅਸਲ ਜਗਤ ਡਾਟਾ ਸਾਇੰਸ ਐਪਲੀਕੇਸ਼ਨ ਉਦਾਹਰਨਾਂ ਨਾਲ](https://www.scaler.com/blog/data-science-applications/) - ਮਈ 2024
|
|
* ਡਾਟਾ ਸਾਇੰਸ ਵਿੱਚ: [ਸ਼ਿਕਸ਼ਾ](https://data-flair.training/blogs/data-science-in-education/), [ਖੇਤੀਬਾੜੀ](https://data-flair.training/blogs/data-science-in-agriculture/), [ਵਿੱਤ](https://data-flair.training/blogs/data-science-in-finance/), [ਫਿਲਮਾਂ](https://data-flair.training/blogs/data-science-at-movies/), [ਹੈਲਥ ਕੇਅਰ](https://onlinedegrees.sandiego.edu/data-science-health-care/) ਅਤੇ ਹੋਰ।
|
|
|
|
## ਅਸਾਈਨਮੈਂਟ
|
|
|
|
[ਪਲੇਨਟਰੀ ਕੰਪਿਊਟਰ ਡਾਟਾਸੈਟ ਦੀ ਖੋਜ ਕਰੋ](assignment.md)
|
|
|
|
---
|
|
|
|
**ਅਸਵੀਕਰਤੀ**:
|
|
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦਾ ਯਤਨ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁੱਚਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਇਸ ਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਮੌਜੂਦ ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਪ੍ਰਮਾਣਿਕ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ। |