# ਕਲਾਉਡ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਦਾ ਪਰਿਚਯ |![ [(@sketchthedocs)] ਦੁਆਰਾ ਸਕੈਚਨੋਟ](https://sketchthedocs.dev) ](../../sketchnotes/17-DataScience-Cloud.png)| |:---:| | ਕਲਾਉਡ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ: ਪਰਿਚਯ - _[@nitya](https://twitter.com/nitya) ਦੁਆਰਾ ਸਕੈਚਨੋਟ_ | ਇਸ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਕਲਾਉਡ ਦੇ ਮੁੱਢਲੇ ਸਿਧਾਂਤਾਂ ਬਾਰੇ ਸਿੱਖੋਗੇ, ਫਿਰ ਤੁਸੀਂ ਦੇਖੋਗੇ ਕਿ ਕਿਉਂ ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਨੂੰ ਆਪਣੇ ਡਾਟਾ ਸਾਇੰਸ ਪ੍ਰੋਜੈਕਟਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਵਰਤਣਾ ਤੁਹਾਡੇ ਲਈ ਦਿਲਚਸਪ ਹੋ ਸਕਦਾ ਹੈ ਅਤੇ ਅਸੀਂ ਕਲਾਉਡ ਵਿੱਚ ਚਲਾਏ ਗਏ ਕੁਝ ਡਾਟਾ ਸਾਇੰਸ ਪ੍ਰੋਜੈਕਟਾਂ ਦੇ ਉਦਾਹਰਣਾਂ ਨੂੰ ਵੇਖਾਂਗੇ। ## [ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ds/quiz/32) ## ਕਲਾਉਡ ਕੀ ਹੈ? ਕਲਾਉਡ, ਜਾਂ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ, ਇੰਟਰਨੈਟ 'ਤੇ ਹੋਸਟ ਕੀਤੀ ਗਈ ਢਾਂਚੇ 'ਤੇ ਪੇ-ਅਜ਼-ਯੂ-ਗੋ ਮਾਡਲ ਦੇ ਤਹਿਤ ਵੱਖ-ਵੱਖ ਕੰਪਿਊਟਿੰਗ ਸੇਵਾਵਾਂ ਦੀ ਡਿਲਿਵਰੀ ਹੈ। ਸੇਵਾਵਾਂ ਵਿੱਚ ਸਟੋਰੇਜ, ਡਾਟਾਬੇਸ, ਨੈਟਵਰਕਿੰਗ, ਸੌਫਟਵੇਅਰ, ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਬੁੱਧੀਮਾਨ ਸੇਵਾਵਾਂ ਸ਼ਾਮਲ ਹਨ। ਅਸੀਂ ਆਮ ਤੌਰ 'ਤੇ ਜਨਤਕ, ਨਿੱਜੀ ਅਤੇ ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡਾਂ ਵਿੱਚ ਅੰਤਰ ਕਰਦੇ ਹਾਂ: * ਜਨਤਕ ਕਲਾਉਡ: ਜਨਤਕ ਕਲਾਉਡ ਕਿਸੇ ਤੀਜੇ ਪੱਖ ਦੇ ਕਲਾਉਡ ਸੇਵਾ ਪ੍ਰਦਾਤਾ ਦੁਆਰਾ ਮਾਲਕ ਅਤੇ ਚਲਾਇਆ ਜਾਂਦਾ ਹੈ ਜੋ ਆਪਣੀਆਂ ਕੰਪਿਊਟਿੰਗ ਸੰਸਾਧਨਾਂ ਨੂੰ ਇੰਟਰਨੈਟ ਰਾਹੀਂ ਜਨਤਕ ਤੱਕ ਪਹੁੰਚਾਉਂਦਾ ਹੈ। * ਨਿੱਜੀ ਕਲਾਉਡ: ਨਿੱਜੀ ਕਲਾਉਡ ਉਹ ਹੈ ਜੋ ਸਿਰਫ ਇੱਕ ਕਾਰੋਬਾਰ ਜਾਂ ਸੰਗਠਨ ਦੁਆਰਾ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸੇਵਾਵਾਂ ਅਤੇ ਢਾਂਚਾ ਨਿੱਜੀ ਨੈਟਵਰਕ 'ਤੇ ਰੱਖਿਆ ਜਾਂਦਾ ਹੈ। * ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡ: ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡ ਇੱਕ ਪ੍ਰਣਾਲੀ ਹੈ ਜੋ ਜਨਤਕ ਅਤੇ ਨਿੱਜੀ ਕਲਾਉਡਾਂ ਨੂੰ ਜੋੜਦੀ ਹੈ। ਉਪਭੋਗਤਾ ਇੱਕ ਓਨ-ਪ੍ਰੇਮਿਸ ਡਾਟਾਸੈਂਟਰ ਚੁਣਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਡਾਟਾ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਇੱਕ ਜਾਂ ਵੱਧ ਜਨਤਕ ਕਲਾਉਡਾਂ 'ਤੇ ਚਲਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਅਧਿਕਤਰ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਸੇਵਾਵਾਂ ਤਿੰਨ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਆਉਂਦੀਆਂ ਹਨ: ਇੰਫਰਾਸਟ੍ਰਕਚਰ ਐਜ਼ ਏ ਸਰਵਿਸ (IaaS), ਪਲੇਟਫਾਰਮ ਐਜ਼ ਏ ਸਰਵਿਸ (PaaS) ਅਤੇ ਸੌਫਟਵੇਅਰ ਐਜ਼ ਏ ਸਰਵਿਸ (SaaS)। * ਇੰਫਰਾਸਟ੍ਰਕਚਰ ਐਜ਼ ਏ ਸਰਵਿਸ (IaaS): ਉਪਭੋਗਤਾ ਸਰਵਰਾਂ ਅਤੇ ਵਰਚੁਅਲ ਮਸ਼ੀਨਾਂ (VMs), ਸਟੋਰੇਜ, ਨੈਟਵਰਕ, ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਵਰਗੇ IT ਢਾਂਚੇ ਨੂੰ ਕਿਰਾਏ 'ਤੇ ਲੈਂਦੇ ਹਨ। * ਪਲੇਟਫਾਰਮ ਐਜ਼ ਏ ਸਰਵਿਸ (PaaS): ਉਪਭੋਗਤਾ ਸੌਫਟਵੇਅਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਵਿਕਸਿਤ, ਟੈਸਟ, ਡਿਲਿਵਰ ਅਤੇ ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਲਈ ਇੱਕ ਵਾਤਾਵਰਣ ਕਿਰਾਏ 'ਤੇ ਲੈਂਦੇ ਹਨ। ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਵਿਕਾਸ ਲਈ ਲੋੜੀਂਦੇ ਸਰਵਰਾਂ, ਸਟੋਰੇਜ, ਨੈਟਵਰਕ ਅਤੇ ਡਾਟਾਬੇਸ ਦੇ ਮੂਲ ਢਾਂਚੇ ਨੂੰ ਸੈਟਅੱਪ ਜਾਂ ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਦੀ ਚਿੰਤਾ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ। * ਸੌਫਟਵੇਅਰ ਐਜ਼ ਏ ਸਰਵਿਸ (SaaS): ਉਪਭੋਗਤਾ ਇੰਟਰਨੈਟ ਰਾਹੀਂ ਸੌਫਟਵੇਅਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ, ਆਮ ਤੌਰ 'ਤੇ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਆਧਾਰ 'ਤੇ। ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸੌਫਟਵੇਅਰ ਐਪਲੀਕੇਸ਼ਨ ਦੀ ਹੋਸਟਿੰਗ ਅਤੇ ਪ੍ਰਬੰਧਨ, ਮੂਲ ਢਾਂਚੇ ਜਾਂ ਰੱਖ-ਰਖਾਅ, ਜਿਵੇਂ ਕਿ ਸੌਫਟਵੇਅਰ ਅੱਪਗ੍ਰੇਡ ਅਤੇ ਸੁਰੱਖਿਆ ਪੈਚਿੰਗ ਦੀ ਚਿੰਤਾ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ। ਕੁਝ ਵੱਡੇ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ ਹਨ Amazon Web Services, Google Cloud Platform ਅਤੇ Microsoft Azure। ## ਡਾਟਾ ਸਾਇੰਸ ਲਈ ਕਲਾਉਡ ਕਿਉਂ ਚੁਣਨਾ? ਡਿਵੈਲਪਰ ਅਤੇ IT ਪੇਸ਼ੇਵਰ ਕਲਾਉਡ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਕਈ ਕਾਰਨਾਂ ਕਰਕੇ ਚੁਣਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ: * ਨਵੋਨਮੇਸ਼: ਤੁਸੀਂ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾਵਾਂ ਦੁਆਰਾ ਬਣਾਈਆਂ ਗਈਆਂ ਨਵੋਨਮੇਸ਼ ਸੇਵਾਵਾਂ ਨੂੰ ਸਿੱਧੇ ਆਪਣੇ ਐਪਸ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਕੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਣਾ ਸਕਦੇ ਹੋ। * ਲਚੀਲਾਪਨ: ਤੁਸੀਂ ਸਿਰਫ ਉਹ ਸੇਵਾਵਾਂ ਲਈ ਭੁਗਤਾਨ ਕਰਦੇ ਹੋ ਜੋ ਤੁਹਾਨੂੰ ਲੋੜੀਂਦੀਆਂ ਹਨ ਅਤੇ ਸੇਵਾਵਾਂ ਦੀ ਇੱਕ ਵੱਡੀ ਰੇਂਜ ਵਿੱਚੋਂ ਚੁਣ ਸਕਦੇ ਹੋ। ਤੁਸੀਂ ਆਮ ਤੌਰ 'ਤੇ ਜਿਵੇਂ ਤੁਸੀਂ ਜਾਓਗੇ ਭੁਗਤਾਨ ਕਰਦੇ ਹੋ ਅਤੇ ਆਪਣੀਆਂ ਬਦਲਦੀਆਂ ਲੋੜਾਂ ਦੇ ਅਨੁਸਾਰ ਸੇਵਾਵਾਂ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰ ਸਕਦੇ ਹੋ। * ਬਜਟ: ਤੁਹਾਨੂੰ ਹਾਰਡਵੇਅਰ ਅਤੇ ਸੌਫਟਵੇਅਰ ਖਰੀਦਣ, ਸੈਟਅੱਪ ਕਰਨ ਅਤੇ ਓਨ-ਸਾਈਟ ਡਾਟਾਸੈਂਟਰ ਚਲਾਉਣ ਲਈ ਸ਼ੁਰੂਆਤੀ ਨਿਵੇਸ਼ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਤੁਸੀਂ ਸਿਰਫ ਉਹਨਾਂ ਚੀਜ਼ਾਂ ਲਈ ਭੁਗਤਾਨ ਕਰਦੇ ਹੋ ਜੋ ਤੁਸੀਂ ਵਰਤਦੇ ਹੋ। * ਸਕੇਲਬਿਲਟੀ: ਤੁਹਾਡੇ ਪ੍ਰੋਜੈਕਟ ਦੀਆਂ ਲੋੜਾਂ ਦੇ ਅਨੁਸਾਰ ਤੁਹਾਡੇ ਸੰਸਾਧਨ ਵਧ ਸਕਦੇ ਹਨ, ਜਿਸਦਾ ਅਰਥ ਹੈ ਕਿ ਤੁਹਾਡੇ ਐਪਸ ਵਧੇਰੇ ਜਾਂ ਘੱਟ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ, ਸਟੋਰੇਜ ਅਤੇ ਬੈਂਡਵਿਡਥ ਵਰਤ ਸਕਦੇ ਹਨ। * ਉਤਪਾਦਕਤਾ: ਤੁਸੀਂ ਆਪਣੇ ਕਾਰੋਬਾਰ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰ ਸਕਦੇ ਹੋ ਬਜਾਏ ਉਹ ਕੰਮ ਕਰਨ ਦੇ ਜੋ ਕਿਸੇ ਹੋਰ ਦੁਆਰਾ ਪ੍ਰਬੰਧਿਤ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਡਾਟਾਸੈਂਟਰ ਪ੍ਰਬੰਧਨ। * ਭਰੋਸੇਯੋਗਤਾ: ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਕਈ ਤਰੀਕੇ ਪੇਸ਼ ਕਰਦੀ ਹੈ ਜਿਨ੍ਹਾਂ ਨਾਲ ਤੁਸੀਂ ਆਪਣੇ ਡਾਟਾ ਦਾ ਲਗਾਤਾਰ ਬੈਕਅੱਪ ਲੈ ਸਕਦੇ ਹੋ ਅਤੇ ਡਿਜਾਸਟਰ ਰਿਕਵਰੀ ਯੋਜਨਾਵਾਂ ਸੈਟਅੱਪ ਕਰ ਸਕਦੇ ਹੋ। * ਸੁਰੱਖਿਆ: ਤੁਸੀਂ ਨੀਤੀਆਂ, ਤਕਨੀਕਾਂ ਅਤੇ ਨਿਯੰਤਰਣਾਂ ਦਾ ਲਾਭ ਲੈ ਸਕਦੇ ਹੋ ਜੋ ਤੁਹਾਡੇ ਪ੍ਰੋਜੈਕਟ ਦੀ ਸੁਰੱਖਿਆ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਦੇ ਹਨ। ਇਹ ਕੁਝ ਆਮ ਕਾਰਨ ਹਨ ਜਿਨ੍ਹਾਂ ਕਰਕੇ ਲੋਕ ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਹੁਣ ਜਦੋਂ ਸਾਨੂੰ ਇਹ ਸਮਝ ਆ ਗਈ ਹੈ ਕਿ ਕਲਾਉਡ ਕੀ ਹੈ ਅਤੇ ਇਸਦੇ ਮੁੱਖ ਫਾਇਦੇ ਕੀ ਹਨ, ਆਓ ਡਾਟਾ ਸਾਇੰਸਦਾਨਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਦੇ ਕੰਮਾਂ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਵੇਖੀਏ ਜੋ ਡਾਟਾ ਨਾਲ ਕੰਮ ਕਰਦੇ ਹਨ, ਅਤੇ ਕਲਾਉਡ ਕਿਵੇਂ ਉਨ੍ਹਾਂ ਦੀਆਂ ਕਈ ਚੁਣੌਤੀਆਂ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ: * ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਡਾਟਾ ਸਟੋਰ ਕਰਨਾ: ਵੱਡੇ ਸਰਵਰਾਂ ਨੂੰ ਖਰੀਦਣ, ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਅਤੇ ਸੁਰੱਖਿਅਤ ਕਰਨ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ ਆਪਣਾ ਡਾਟਾ ਸਿੱਧੇ ਕਲਾਉਡ ਵਿੱਚ ਸਟੋਰ ਕਰ ਸਕਦੇ ਹੋ, ਜਿਵੇਂ ਕਿ Azure Cosmos DB, Azure SQL Database ਅਤੇ Azure Data Lake Storage ਵਰਗੇ ਹੱਲਾਂ ਨਾਲ। * ਡਾਟਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਕਰਨਾ: ਡਾਟਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਡਾਟਾ ਸਾਇੰਸ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਹੈ, ਜੋ ਤੁਹਾਨੂੰ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਕਾਰਵਾਈ ਕਰਨ ਤੱਕ ਦੀ ਯਾਤਰਾ ਕਰਨ ਦਿੰਦਾ ਹੈ। ਕਲਾਉਡ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀਆਂ ਡਾਟਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਸੇਵਾਵਾਂ ਨਾਲ, ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਸਰੋਤਾਂ ਤੋਂ ਡਾਟਾ ਇਕੱਠਾ, ਰੂਪਾਂਤਰਿਤ ਅਤੇ ਇੱਕ ਸਿੰਗਲ ਡਾਟਾ ਵੇਅਰਹਾਊਸ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹੋ, ਜਿਵੇਂ ਕਿ Data Factory। * ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ: ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਬਹੁਤ ਸਾਰੀ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਅਤੇ ਹਰ ਕੋਈ ਇਸ ਲਈ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਸ਼ੀਨਾਂ ਤੱਕ ਪਹੁੰਚ ਨਹੀਂ ਰੱਖਦਾ। ਇਸ ਲਈ ਕਈ ਲੋਕ ਸਿੱਧੇ ਕਲਾਉਡ ਦੀ ਵੱਡੀ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਨੂੰ ਵਰਤਣ ਲਈ ਚੁਣਦੇ ਹਨ। * ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ: ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਜਿਵੇਂ ਕਿ Azure Synapse Analytics, Azure Stream Analytics ਅਤੇ Azure Databricks ਤੁਹਾਡੇ ਡਾਟਾ ਨੂੰ ਕਾਰਵਾਈਯੋਗ ਅੰਦਰੂਨੀ ਜਾਣਕਾਰੀ ਵਿੱਚ ਬਦਲਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ। * ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ ਡਾਟਾ ਇੰਟੈਲੀਜੈਂਸ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ: ਸ਼ੁਰੂ ਤੋਂ ਸ਼ੁਰੂ ਕਰਨ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ ਦੁਆਰਾ ਪੇਸ਼ ਕੀਤੇ ਗਏ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਐਲਗੋਰਿਥਮ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ, ਜਿਵੇਂ ਕਿ AzureML ਸੇਵਾਵਾਂ ਨਾਲ। ਤੁਸੀਂ ਸਪੀਚ-ਟੂ-ਟੈਕਸਟ, ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ, ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਅਤੇ ਹੋਰ ਵਰਗੀਆਂ ਕੌਗਨਿਟਿਵ ਸੇਵਾਵਾਂ ਦੀ ਵੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ। ## ਕਲਾਉਡ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਦੇ ਉਦਾਹਰਣ ਆਓ ਕੁਝ ਸਥਿਤੀਆਂ ਨੂੰ ਵੇਖ ਕੇ ਇਸਨੂੰ ਹੋਰ ਵਾਸਤਵਿਕ ਬਣਾਈਏ। ### ਰੀਅਲ-ਟਾਈਮ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ ਆਓ ਇੱਕ ਸਥਿਤੀ ਨਾਲ ਸ਼ੁਰੂ ਕਰੀਏ ਜੋ ਆਮ ਤੌਰ 'ਤੇ ਉਹ ਲੋਕ ਪੜ੍ਹਦੇ ਹਨ ਜੋ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨਾਲ ਸ਼ੁਰੂ ਕਰਦੇ ਹਨ: ਰੀਅਲ-ਟਾਈਮ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ। ਮੰਨ ਲਓ ਕਿ ਤੁਸੀਂ ਇੱਕ ਨਿਊਜ਼ ਮੀਡੀਆ ਵੈਬਸਾਈਟ ਚਲਾਉਂਦੇ ਹੋ ਅਤੇ ਤੁਸੀਂ ਲਾਈਵ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਹ ਸਮਝਣਾ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਤੁਹਾਡੇ ਪਾਠਕ ਕਿਸ ਸਮੱਗਰੀ ਵਿੱਚ ਦਿਲਚਸਪੀ ਲੈ ਸਕਦੇ ਹਨ। ਇਸ ਬਾਰੇ ਹੋਰ ਜਾਣਨ ਲਈ, ਤੁਸੀਂ ਇੱਕ ਪ੍ਰੋਗਰਾਮ ਬਣਾ ਸਕਦੇ ਹੋ ਜੋ ਟਵਿੱਟਰ ਪ੍ਰਕਾਸ਼ਨਾਂ ਦੇ ਡਾਟਾ ਦਾ ਰੀਅਲ-ਟਾਈਮ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ, ਉਹਨਾਂ ਵਿਸ਼ਿਆਂ 'ਤੇ ਜੋ ਤੁਹਾਡੇ ਪਾਠਕਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹਨ। ਤੁਹਾਡੇ ਦੇਖਣ ਵਾਲੇ ਮੁੱਖ ਸੂਚਕ ਹਨ ਖਾਸ ਵਿਸ਼ਿਆਂ (ਹੈਸ਼ਟੈਗ) 'ਤੇ ਟਵੀਟਾਂ ਦੀ ਮਾਤਰਾ ਅਤੇ ਸੈਂਟੀਮੈਂਟ, ਜੋ ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਥਾਪਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਜੋ ਨਿਰਧਾਰਤ ਵਿਸ਼ਿਆਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦੇ ਹਨ। ਇਸ ਪ੍ਰੋਜੈਕਟ ਨੂੰ ਬਣਾਉਣ ਲਈ ਲੋੜੀਂਦੇ ਕਦਮ ਇਹ ਹਨ: * ਇਨਪੁਟ ਸਟ੍ਰੀਮਿੰਗ ਲਈ ਇੱਕ ਇਵੈਂਟ ਹੱਬ ਬਣਾਓ, ਜੋ ਟਵਿੱਟਰ ਤੋਂ ਡਾਟਾ ਇਕੱਠਾ ਕਰੇਗਾ। * ਟਵਿੱਟਰ ਕਲਾਇੰਟ ਐਪਲੀਕੇਸ਼ਨ ਨੂੰ ਸੰਰਚਿਤ ਅਤੇ ਸ਼ੁਰੂ ਕਰੋ, ਜੋ ਟਵਿੱਟਰ ਸਟ੍ਰੀਮਿੰਗ APIs ਨੂੰ ਕਾਲ ਕਰੇਗਾ। * ਇੱਕ ਸਟ੍ਰੀਮ ਐਨਾਲਿਟਿਕਸ ਜੌਬ ਬਣਾਓ। * ਜੌਬ ਇਨਪੁਟ ਅਤੇ ਕਵੈਰੀ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰੋ। * ਇੱਕ ਆਉਟਪੁੱਟ ਸਿੰਕ ਬਣਾਓ ਅਤੇ ਜੌਬ ਆਉਟਪੁੱਟ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰੋ। * ਜੌਬ ਸ਼ੁਰੂ ਕਰੋ। ਪੂਰੇ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੇਖਣ ਲਈ, [ਡਾਕੂਮੈਂਟੇਸ਼ਨ](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099) ਵੇਖੋ। ### ਵਿਗਿਆਨਕ ਪੇਪਰਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਆਓ ਇਸ ਕੋਰਸ ਦੇ ਲੇਖਕਾਂ ਵਿੱਚੋਂ ਇੱਕ [ਦਿਮਿਤਰੀ ਸੋਸ਼ਨਿਕੋਵ](http://soshnikov.com) ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਪ੍ਰੋਜੈਕਟ ਦਾ ਇੱਕ ਹੋਰ ਉਦਾਹਰਣ ਲਵਾਂ। ਦਿਮਿਤਰੀ ਨੇ ਇੱਕ ਟੂਲ ਬਣਾਇਆ ਜੋ COVID ਪੇਪਰਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ। ਇਸ ਪ੍ਰੋਜੈਕਟ ਦੀ ਸਮੀਖਿਆ ਕਰਕੇ, ਤੁਸੀਂ ਦੇਖੋਗੇ ਕਿ ਤੁਸੀਂ ਇੱਕ ਟੂਲ ਕਿਵੇਂ ਬਣਾਉਂਦੇ ਹੋ ਜੋ ਵਿਗਿਆਨਕ ਪੇਪਰਾਂ ਤੋਂ ਗਿਆਨ ਕੱਢਦਾ ਹੈ, ਅੰਦਰੂਨੀ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਖੋਜਕਰਤਿਆਂ ਨੂੰ ਵੱਡੇ ਪੇਪਰਾਂ ਦੇ ਸੰਗ੍ਰਹਿ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਤਰੀਕੇ ਨਾਲ ਨੈਵੀਗੇਟ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਆਓ ਇਸ ਲਈ ਵਰਤੇ ਗਏ ਵੱਖ-ਵੱਖ ਕਦਮਾਂ ਨੂੰ ਵੇਖੀਏ: * [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ਨਾਲ ਜਾਣਕਾਰੀ ਕੱਢਣਾ ਅਤੇ ਪ੍ਰੀ-ਪ੍ਰੋਸੈਸ ਕਰਨਾ। * ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਪੈਰਾਲਲਾਈਜ਼ ਕਰਨ ਲਈ [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ਦੀ ਵਰਤੋਂ। * ਜਾਣਕਾਰੀ ਨੂੰ ਸਟੋਰ ਅਤੇ ਕਵੈਰੀ ਕਰਨ ਲਈ [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) ਦੀ ਵਰਤੋਂ। * ਡਾਟਾ ਐਕਸਪਲੋਰੇਸ਼ਨ ਅਤੇ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਲਈ ਇੱਕ ਇੰਟਰੈਕਟਿਵ ਡੈਸ਼ਬੋਰਡ ਬਣਾਉਣਾ, Power BI ਦੀ ਵਰਤੋਂ ਕਰਕੇ। ਪੂਰੀ ਪ੍ਰਕਿਰਿਆ ਦੇਖਣ ਲਈ, [ਦਿਮਿਤਰੀ ਦੇ ਬਲੌਗ](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/) 'ਤੇ ਜਾਓ। ਜਿਵੇਂ ਤੁਸੀਂ ਦੇਖ ਸਕਦੇ ਹੋ, ਅਸੀਂ ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕਈ ਤਰੀਕਿਆਂ ਨਾਲ ਡਾਟਾ ਸਾਇੰਸ ਕਰ ਸਕਦੇ ਹਾਂ। ## ਫੁਟਨੋਟ ਸਰੋਤ: * https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109 * https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment --- **ਅਸਵੀਕਤੀ**: ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।