You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/pa/5-Data-Science-In-Cloud/17-Introduction
leestott 5391b4bc5f
🌐 Update translations via Co-op Translator
3 weeks ago
..
README.md 🌐 Update translations via Co-op Translator 3 weeks ago
assignment.md 🌐 Update translations via Co-op Translator 3 weeks ago

README.md

ਕਲਾਉਡ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਦਾ ਪਰਚੇ

 [(@sketchthedocs)] ਦੁਆਰਾ ਸਕੈਚਨੋਟ ](../../sketchnotes/17-DataScience-Cloud.png)
ਕਲਾਉਡ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ: ਪਰਚੇ - @nitya ਦੁਆਰਾ ਸਕੈਚਨੋਟ

ਇਸ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਕਲਾਉਡ ਦੇ ਮੁੱਢਲੀ ਸਿਧਾਂਤਾਂ ਬਾਰੇ ਸਿੱਖੋਗੇ, ਫਿਰ ਤੁਸੀਂ ਦੇਖੋਗੇ ਕਿ ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਨੂੰ ਆਪਣੇ ਡਾਟਾ ਸਾਇੰਸ ਪ੍ਰੋਜੈਕਟਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਵਰਤਣਾ ਤੁਹਾਡੇ ਲਈ ਕਿਉਂ ਦਿਲਚਸਪ ਹੋ ਸਕਦਾ ਹੈ ਅਤੇ ਅਸੀਂ ਕਲਾਉਡ ਵਿੱਚ ਚਲਾਏ ਗਏ ਕੁਝ ਡਾਟਾ ਸਾਇੰਸ ਪ੍ਰੋਜੈਕਟਾਂ ਦੇ ਉਦਾਹਰਨਾਂ ਨੂੰ ਵੇਖਾਂਗੇ।

ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼

ਕਲਾਉਡ ਕੀ ਹੈ?

ਕਲਾਉਡ, ਜਾਂ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ, ਇੰਟਰਨੈਟ 'ਤੇ ਹੋਸਟ ਕੀਤੇ ਗਏ ਢਾਂਚੇ 'ਤੇ ਪੇ-ਅਜ਼-ਯੂ-ਗੋ ਕੰਪਿਊਟਿੰਗ ਸੇਵਾਵਾਂ ਦੀ ਇੱਕ ਵਿਆਪਕ ਰੇਂਜ ਦੀ ਡਿਲਿਵਰੀ ਹੈ। ਸੇਵਾਵਾਂ ਵਿੱਚ ਸਟੋਰੇਜ, ਡਾਟਾਬੇਸ, ਨੈਟਵਰਕਿੰਗ, ਸਾਫਟਵੇਅਰ, ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਬੁੱਧੀਮਾਨ ਸੇਵਾਵਾਂ ਵਰਗੇ ਹੱਲ ਸ਼ਾਮਲ ਹਨ।

ਅਸੀਂ ਆਮ ਤੌਰ 'ਤੇ ਜਨਤਕ, ਨਿੱਜੀ ਅਤੇ ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡਾਂ ਨੂੰ ਹੇਠਾਂ ਦਿੱਤੇ ਤਰੀਕੇ ਨਾਲ ਵੱਖ ਕਰਦੇ ਹਾਂ:

  • ਜਨਤਕ ਕਲਾਉਡ: ਜਨਤਕ ਕਲਾਉਡ ਕਿਸੇ ਤੀਜੀ ਪੱਖੀ ਕਲਾਉਡ ਸੇਵਾ ਪ੍ਰਦਾਤਾ ਦੁਆਰਾ ਮਾਲਕ ਅਤੇ ਚਲਾਇਆ ਜਾਂਦਾ ਹੈ ਜੋ ਆਪਣੀਆਂ ਕੰਪਿਊਟਿੰਗ ਸਰੋਤਾਂ ਨੂੰ ਇੰਟਰਨੈਟ ਰਾਹੀਂ ਜਨਤਕ ਨੂੰ ਡਿਲਿਵਰ ਕਰਦਾ ਹੈ।
  • ਨਿੱਜੀ ਕਲਾਉਡ: ਨਿੱਜੀ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਸਰੋਤਾਂ ਨੂੰ ਸਿਰਫ ਇੱਕ ਵਿਅਕਤੀਗਤ ਕਾਰੋਬਾਰ ਜਾਂ ਸੰਗਠਨ ਦੁਆਰਾ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸੇਵਾਵਾਂ ਅਤੇ ਢਾਂਚਾ ਨਿੱਜੀ ਨੈਟਵਰਕ 'ਤੇ ਰੱਖਿਆ ਜਾਂਦਾ ਹੈ।
  • ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡ: ਹਾਈਬ੍ਰਿਡ ਕਲਾਉਡ ਇੱਕ ਪ੍ਰਣਾਲੀ ਹੈ ਜੋ ਜਨਤਕ ਅਤੇ ਨਿੱਜੀ ਕਲਾਉਡਾਂ ਨੂੰ ਜੋੜਦੀ ਹੈ। ਉਪਭੋਗਤਾ ਇੱਕ ਓਨ-ਪ੍ਰੇਮਿਸ ਡਾਟਾਸੈਂਟਰ ਦੀ ਚੋਣ ਕਰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਡਾਟਾ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਇੱਕ ਜਾਂ ਵੱਧ ਜਨਤਕ ਕਲਾਉਡਾਂ 'ਤੇ ਚਲਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ।

ਅਧਿਕਤਮ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਸੇਵਾਵਾਂ ਤਿੰਨ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਆਉਂਦੀਆਂ ਹਨ: ਢਾਂਚਾ-ਜਿਵੇਂ-ਸੇਵਾ (IaaS), ਪਲੇਟਫਾਰਮ-ਜਿਵੇਂ-ਸੇਵਾ (PaaS) ਅਤੇ ਸਾਫਟਵੇਅਰ-ਜਿਵੇਂ-ਸੇਵਾ (SaaS)।

  • ਢਾਂਚਾ-ਜਿਵੇਂ-ਸੇਵਾ (IaaS): ਉਪਭੋਗਤਾ ਸਰਵਰਾਂ ਅਤੇ ਵਰਚੁਅਲ ਮਸ਼ੀਨਾਂ (VMs), ਸਟੋਰੇਜ, ਨੈਟਵਰਕ, ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਵਰਗੇ IT ਢਾਂਚੇ ਨੂੰ ਕਿਰਾਏ 'ਤੇ ਲੈਂਦੇ ਹਨ।
  • ਪਲੇਟਫਾਰਮ-ਜਿਵੇਂ-ਸੇਵਾ (PaaS): ਉਪਭੋਗਤਾ ਸਾਫਟਵੇਅਰ ਐਪਲੀਕੇਸ਼ਨ ਨੂੰ ਵਿਕਸਿਤ, ਟੈਸਟ, ਡਿਲਿਵਰ ਅਤੇ ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਲਈ ਇੱਕ ਵਾਤਾਵਰਣ ਕਿਰਾਏ 'ਤੇ ਲੈਂਦੇ ਹਨ। ਉਪਭੋਗਤਾ ਨੂੰ ਵਿਕਾਸ ਲਈ ਲੋੜੀਂਦੇ ਸਰਵਰਾਂ, ਸਟੋਰੇਜ, ਨੈਟਵਰਕ ਅਤੇ ਡਾਟਾਬੇਸ ਦੇ ਅਧਾਰਭੂਤ ਢਾਂਚੇ ਨੂੰ ਸੈਟ ਅੱਪ ਜਾਂ ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਦੀ ਚਿੰਤਾ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ।
  • ਸਾਫਟਵੇਅਰ-ਜਿਵੇਂ-ਸੇਵਾ (SaaS): ਉਪਭੋਗਤਾ ਇੰਟਰਨੈਟ ਰਾਹੀਂ ਸਾਫਟਵੇਅਰ ਐਪਲੀਕੇਸ਼ਨ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ, ਮੰਗ 'ਤੇ ਅਤੇ ਆਮ ਤੌਰ 'ਤੇ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਅਧਾਰ 'ਤੇ। ਉਪਭੋਗਤਾ ਨੂੰ ਸਾਫਟਵੇਅਰ ਐਪਲੀਕੇਸ਼ਨ ਦੀ ਹੋਸਟਿੰਗ ਅਤੇ ਪ੍ਰਬੰਧਨ, ਅਧਾਰਭੂਤ ਢਾਂਚਾ ਜਾਂ ਰੱਖ-ਰਖਾਅ, ਜਿਵੇਂ ਕਿ ਸਾਫਟਵੇਅਰ ਅਪਗਰੇਡ ਅਤੇ ਸੁਰੱਖਿਆ ਪੈਚਿੰਗ ਦੀ ਚਿੰਤਾ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ।

ਕੁਝ ਵੱਡੇ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ ਹਨ Amazon Web Services, Google Cloud Platform ਅਤੇ Microsoft Azure।

ਡਾਟਾ ਸਾਇੰਸ ਲਈ ਕਲਾਉਡ ਕਿਉਂ ਚੁਣੋ?

ਡਿਵੈਲਪਰ ਅਤੇ IT ਪੇਸ਼ੇਵਰ ਕਈ ਕਾਰਨਾਂ ਕਰਕੇ ਕਲਾਉਡ ਨਾਲ ਕੰਮ ਕਰਨ ਦੀ ਚੋਣ ਕਰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ:

  • ਨਵੀਨਤਾ: ਤੁਸੀਂ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ ਦੁਆਰਾ ਬਣਾਈਆਂ ਨਵੀਨਤਮ ਸੇਵਾਵਾਂ ਨੂੰ ਸਿੱਧੇ ਆਪਣੇ ਐਪਸ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਕੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਣਾ ਸਕਦੇ ਹੋ।
  • ਲਚਕਤਾ: ਤੁਸੀਂ ਸਿਰਫ ਉਹ ਸੇਵਾਵਾਂ ਲਈ ਭੁਗਤਾਨ ਕਰਦੇ ਹੋ ਜੋ ਤੁਹਾਨੂੰ ਲੋੜੀਂਦੀਆਂ ਹਨ ਅਤੇ ਸੇਵਾਵਾਂ ਦੀ ਇੱਕ ਵਿਆਪਕ ਰੇਂਜ ਵਿੱਚੋਂ ਚੋਣ ਕਰ ਸਕਦੇ ਹੋ। ਤੁਸੀਂ ਆਮ ਤੌਰ 'ਤੇ ਪੇ-ਅਜ਼-ਯੂ-ਗੋ ਅਧਾਰ 'ਤੇ ਭੁਗਤਾਨ ਕਰਦੇ ਹੋ ਅਤੇ ਆਪਣੀਆਂ ਲੋੜਾਂ ਦੇ ਅਨੁਸਾਰ ਆਪਣੀਆਂ ਸੇਵਾਵਾਂ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰਦੇ ਹੋ।
  • ਬਜਟ: ਤੁਹਾਨੂੰ ਹਾਰਡਵੇਅਰ ਅਤੇ ਸਾਫਟਵੇਅਰ ਖਰੀਦਣ, ਸੈਟ ਅੱਪ ਕਰਨ ਅਤੇ ਓਨ-ਸਾਈਟ ਡਾਟਾਸੈਂਟਰ ਚਲਾਉਣ ਲਈ ਸ਼ੁਰੂਆਤੀ ਨਿਵੇਸ਼ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ। ਤੁਸੀਂ ਸਿਰਫ ਉਹ ਭੁਗਤਾਨ ਕਰਦੇ ਹੋ ਜੋ ਤੁਸੀਂ ਵਰਤਦੇ ਹੋ।
  • ਸਕੇਲਬਿਲਟੀ: ਤੁਹਾਡੇ ਸਰੋਤਾਂ ਪ੍ਰੋਜੈਕਟ ਦੀਆਂ ਲੋੜਾਂ ਦੇ ਅਨੁਸਾਰ ਸਕੇਲ ਕਰ ਸਕਦੇ ਹਨ, ਜਿਸਦਾ ਅਰਥ ਹੈ ਕਿ ਤੁਹਾਡੇ ਐਪਸ ਵਧੇਰੇ ਜਾਂ ਘੱਟ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ, ਸਟੋਰੇਜ ਅਤੇ ਬੈਂਡਵਿਡਥ ਵਰਤ ਸਕਦੇ ਹਨ, ਕਿਸੇ ਵੀ ਸਮੇਂ ਬਾਹਰੀ ਕਾਰਕਾਂ ਦੇ ਅਨੁਕੂਲ।
  • ਉਤਪਾਦਕਤਾ: ਤੁਸੀਂ ਆਪਣੇ ਕਾਰੋਬਾਰ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰ ਸਕਦੇ ਹੋ ਬਜਾਏ ਉਹ ਕੰਮ ਕਰਨ ਦੇ ਜੋ ਕਿਸੇ ਹੋਰ ਦੁਆਰਾ ਪ੍ਰਬੰਧਿਤ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਡਾਟਾਸੈਂਟਰ ਪ੍ਰਬੰਧਨ।
  • ਭਰੋਸੇਯੋਗਤਾ: ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਤੁਹਾਡੇ ਡਾਟਾ ਨੂੰ ਲਗਾਤਾਰ ਬੈਕਅੱਪ ਕਰਨ ਦੇ ਕਈ ਤਰੀਕੇ ਪੇਸ਼ ਕਰਦੀ ਹੈ ਅਤੇ ਤੁਸੀਂ ਆਪਣਾ ਕਾਰੋਬਾਰ ਅਤੇ ਸੇਵਾਵਾਂ ਚਲਾਉਣ ਲਈ ਆਫਤ ਪੂਰਨ ਯੋਜਨਾਵਾਂ ਸੈਟ ਅੱਪ ਕਰ ਸਕਦੇ ਹੋ, ਭਾਵੇਂ ਸੰਕਟ ਦੇ ਸਮੇਂ।
  • ਸੁਰੱਖਿਆ: ਤੁਸੀਂ ਨੀਤੀਆਂ, ਤਕਨਾਲੋਜੀਆਂ ਅਤੇ ਨਿਯੰਤਰਣਾਂ ਤੋਂ ਲਾਭ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹੋ ਜੋ ਤੁਹਾਡੇ ਪ੍ਰੋਜੈਕਟ ਦੀ ਸੁਰੱਖਿਆ ਨੂੰ ਮਜ਼ਬੂਤ ​​ਕਰਦੇ ਹਨ।

ਇਹ ਕੁਝ ਆਮ ਕਾਰਨ ਹਨ ਕਿ ਲੋਕ ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਚੋਣ ਕਿਉਂ ਕਰਦੇ ਹਨ। ਹੁਣ ਜਦੋਂ ਕਿ ਸਾਨੂੰ ਇਹ ਸਮਝ ਆ ਗਈ ਹੈ ਕਿ ਕਲਾਉਡ ਕੀ ਹੈ ਅਤੇ ਇਸਦੇ ਮੁੱਖ ਫਾਇਦੇ ਕੀ ਹਨ, ਆਓ ਡਾਟਾ ਸਾਇੰਸਟਿਸ ਅਤੇ ਡਾਟਾ ਨਾਲ ਕੰਮ ਕਰਨ ਵਾਲੇ ਡਿਵੈਲਪਰਾਂ ਦੇ ਕੰਮਾਂ ਵਿੱਚ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਦੇਖੀਏ, ਅਤੇ ਕਲਾਉਡ ਕਿਵੇਂ ਉਨ੍ਹਾਂ ਦੀਆਂ ਕਈ ਚੁਣੌਤੀਆਂ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ:

  • ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਡਾਟਾ ਸਟੋਰ ਕਰਨਾ: ਵੱਡੇ ਸਰਵਰਾਂ ਨੂੰ ਖਰੀਦਣ, ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਅਤੇ ਸੁਰੱਖਿਅਤ ਕਰਨ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ ਆਪਣਾ ਡਾਟਾ ਸਿੱਧੇ ਕਲਾਉਡ ਵਿੱਚ ਸਟੋਰ ਕਰ ਸਕਦੇ ਹੋ, ਜਿਵੇਂ ਕਿ Azure Cosmos DB, Azure SQL Database ਅਤੇ Azure Data Lake Storage।
  • ਡਾਟਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਕਰਨਾ: ਡਾਟਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਡਾਟਾ ਸਾਇੰਸ ਦਾ ਇੱਕ ਅਹਿਮ ਹਿੱਸਾ ਹੈ, ਜੋ ਤੁਹਾਨੂੰ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਕਾਰਵਾਈ ਕਰਨ ਤੱਕ ਦਾ ਸੰਕਰਮਣ ਕਰਨ ਦਿੰਦਾ ਹੈ। ਕਲਾਉਡ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀਆਂ ਡਾਟਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਸੇਵਾਵਾਂ ਨਾਲ, ਤੁਸੀਂ ਵੱਖ-ਵੱਖ ਸਰੋਤਾਂ ਤੋਂ ਡਾਟਾ ਇਕੱਠਾ, ਰੂਪਾਂਤਰਿਤ ਅਤੇ ਇੱਕ ਸਿੰਗਲ ਡਾਟਾ ਵੇਅਰਹਾਊਸ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹੋ, Data Factory ਦੀ ਵਰਤੋਂ ਕਰਕੇ।
  • ਡਾਟਾ ਪ੍ਰੋਸੈਸ ਕਰਨਾ: ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਡਾਟਾ ਪ੍ਰੋਸੈਸ ਕਰਨਾ ਬਹੁਤ ਸਾਰੀ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਦੀ ਲੋੜ ਕਰਦਾ ਹੈ, ਅਤੇ ਹਰ ਕੋਈ ਇਸ ਲਈ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਸ਼ੀਨਾਂ ਤੱਕ ਪਹੁੰਚ ਨਹੀਂ ਰੱਖਦਾ। ਇਸ ਲਈ ਕਈ ਲੋਕ ਆਪਣੀਆਂ ਹੱਲਾਂ ਨੂੰ ਚਲਾਉਣ ਅਤੇ ਤੈਨਾਤ ਕਰਨ ਲਈ ਸਿੱਧੇ ਕਲਾਉਡ ਦੀ ਵੱਡੀ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਚੋਣ ਕਰਦੇ ਹਨ।
  • ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ: ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਜਿਵੇਂ ਕਿ Azure Synapse Analytics, Azure Stream Analytics ਅਤੇ Azure Databricks ਤੁਹਾਨੂੰ ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਕਾਰਵਾਈਯੋਗ ਅੰਤਰਦ੍ਰਿਸ਼ਟੀ ਵਿੱਚ ਬਦਲਣ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ।
  • ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ ਡਾਟਾ ਇੰਟੈਲੀਜੈਂਸ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ: ਸ਼ੁਰੂ ਤੋਂ ਸ਼ੁਰੂ ਕਰਨ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ ਦੁਆਰਾ ਪੇਸ਼ ਕੀਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਐਲਗੋਰਿਦਮ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ, ਜਿਵੇਂ ਕਿ AzureML। ਤੁਸੀਂ cognitive ਸੇਵਾਵਾਂ ਦੀ ਵੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ ਜਿਵੇਂ ਕਿ speech-to-text, text-to-speech, computer vision ਅਤੇ ਹੋਰ।

ਕਲਾਉਡ ਵਿੱਚ ਡਾਟਾ ਸਾਇੰਸ ਦੇ ਉਦਾਹਰਨ

ਆਓ ਕੁਝ ਦ੍ਰਿਸ਼ਾਂ ਦੇਖ ਕੇ ਇਸਨੂੰ ਹੋਰ ਵਾਸਤਵਿਕ ਬਣਾਈਏ।

ਰੀਅਲ-ਟਾਈਮ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ

ਆਓ ਇੱਕ ਦ੍ਰਿਸ਼ ਨਾਲ ਸ਼ੁਰੂ ਕਰੀਏ ਜੋ ਆਮ ਤੌਰ 'ਤੇ ਉਹ ਲੋਕ ਪੜ੍ਹਦੇ ਹਨ ਜੋ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨਾਲ ਸ਼ੁਰੂ ਕਰਦੇ ਹਨ: ਰੀਅਲ-ਟਾਈਮ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ।

ਮੰਨ ਲਓ ਕਿ ਤੁਸੀਂ ਇੱਕ ਨਿਊਜ਼ ਮੀਡੀਆ ਵੈਬਸਾਈਟ ਚਲਾਉਂਦੇ ਹੋ ਅਤੇ ਤੁਸੀਂ ਲਾਈਵ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਹ ਸਮਝਣਾ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਤੁਹਾਡੇ ਪਾਠਕ ਕਿਸ ਸਮੱਗਰੀ ਵਿੱਚ ਦਿਲਚਸਪੀ ਰੱਖਦੇ ਹਨ। ਇਸ ਬਾਰੇ ਹੋਰ ਜਾਣਨ ਲਈ, ਤੁਸੀਂ ਇੱਕ ਪ੍ਰੋਗਰਾਮ ਬਣਾਉਣ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਸਕਦੇ ਹੋ ਜੋ ਟਵਿੱਟਰ ਪਬਲਿਕੇਸ਼ਨਾਂ ਦੇ ਡਾਟਾ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ, ਉਹਨਾਂ ਵਿਸ਼ਿਆਂ 'ਤੇ ਜੋ ਤੁਹਾਡੇ ਪਾਠਕਾਂ ਲਈ ਸਬੰਧਤ ਹਨ।

ਤੁਹਾਨੂੰ ਦੇਖਣ ਵਾਲੇ ਮੁੱਖ ਸੂਚਕ ਹਨ ਵਿਸ਼ੇਸ਼ ਵਿਸ਼ਿਆਂ (ਹੈਸ਼ਟੈਗ) 'ਤੇ ਟਵੀਟਾਂ ਦੀ ਮਾਤਰਾ ਅਤੇ ਸੈਂਟੀਮੈਂਟ, ਜੋ ਵਿਸ਼ੇਸ਼ ਵਿਸ਼ਿਆਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਸੈਂਟੀਮੈਂਟ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਾਲੇ ਟੂਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਥਾਪਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਇਸ ਪ੍ਰੋਜੈਕਟ ਨੂੰ ਬਣਾਉਣ ਲਈ ਲੋੜੀਂਦੇ ਕਦਮ ਹੇਠਾਂ ਦਿੱਤੇ ਗਏ ਹਨ:

  • ਇਨਪੁਟ ਸਟ੍ਰੀਮਿੰਗ ਲਈ ਇੱਕ ਇਵੈਂਟ ਹੱਬ ਬਣਾਓ, ਜੋ ਟਵਿੱਟਰ ਤੋਂ ਡਾਟਾ ਇਕੱਠਾ ਕਰੇਗਾ।
  • ਟਵਿੱਟਰ ਸਟ੍ਰੀਮਿੰਗ APIs ਨੂੰ ਕਾਲ ਕਰਨ ਵਾਲੀ ਇੱਕ ਟਵਿੱਟਰ ਕਲਾਇੰਟ ਐਪਲੀਕੇਸ਼ਨ ਕਨਫਿਗਰ ਅਤੇ ਸ਼ੁਰੂ ਕਰੋ।
  • ਇੱਕ Stream Analytics ਜੌਬ ਬਣਾਓ।
  • ਜੌਬ ਇਨਪੁਟ ਅਤੇ ਕਵੈਰੀ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰੋ।
  • ਇੱਕ ਆਉਟਪੁੱਟ ਸਿੰਕ ਬਣਾਓ ਅਤੇ ਜੌਬ ਆਉਟਪੁੱਟ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰੋ।
  • ਜੌਬ ਸ਼ੁਰੂ ਕਰੋ।

ਪੂਰੇ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੇਖਣ ਲਈ, ਡਾਕੂਮੈਂਟੇਸ਼ਨ ਨੂੰ ਵੇਖੋ।

ਵਿਗਿਆਨਕ ਪੇਪਰਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ

ਆਓ ਇਸ ਕੋਰਸ ਦੇ ਇੱਕ ਲੇਖਕ ਦਿਮਿਤਰੀ ਸੋਸ਼ਨਿਕੋਵ ਦੁਆਰਾ ਬਣਾਏ ਪ੍ਰੋਜੈਕਟ ਦਾ ਇੱਕ ਹੋਰ ਉਦਾਹਰਨ ਲਵਾਂ।

ਦਿਮਿਤਰੀ ਨੇ ਇੱਕ ਟੂਲ ਬਣਾਇਆ ਜੋ COVID ਪੇਪਰਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ। ਇਸ ਪ੍ਰੋਜੈਕਟ ਦੀ ਸਮੀਖਿਆ ਕਰਕੇ, ਤੁਸੀਂ ਦੇਖੋਗੇ ਕਿ ਤੁਸੀਂ ਇੱਕ ਟੂਲ ਕਿਵੇਂ ਬਣਾਉਣਗੇ ਜੋ ਵਿਗਿਆਨਕ ਪੇਪਰਾਂ ਤੋਂ ਗਿਆਨ ਕੱਢਦਾ ਹੈ, ਅੰਤਰਦ੍ਰਿਸ਼ਟੀ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਖੋਜਕਰਤਿਆਂ ਨੂੰ ਪੇਪਰਾਂ ਦੇ ਵੱਡੇ ਸੰਗ੍ਰਹਿ ਵਿੱਚ ਕੁਸ਼ਲਤਾਪੂਰਵਕ ਨੈਵੀਗੇਟ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।

ਆਓ ਇਸ ਲਈ ਵਰਤੇ ਗਏ ਵੱਖ-ਵੱਖ ਕਦਮਾਂ ਨੂੰ ਵੇਖੀਏ:

  • Text Analytics for Health ਨਾਲ ਜਾਣਕਾਰੀ ਕੱਢਣਾ ਅਤੇ ਪ੍ਰੀ-ਪ੍ਰੋਸੈਸ ਕਰਨਾ।
  • Azure ML ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਪੈਰਾਲਲਾਈਜ਼ ਕਰਨਾ।
  • Cosmos DB ਨਾਲ ਜਾਣਕਾਰੀ ਸਟੋਰ ਕਰਨਾ ਅਤੇ ਕਵੈਰੀ ਕਰਨਾ।
  • Power BI ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਾਟਾ ਐਕਸਪਲੋਰੇਸ਼ਨ ਅਤੇ ਵਿਜ਼ੁਅਲਾਈਜ਼ੇਸ਼ਨ ਲਈ ਇੱਕ ਇੰਟਰੈਕਟਿਵ ਡੈਸ਼ਬੋਰਡ ਬਣਾਉਣਾ।

ਪੂਰੇ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੇਖਣ ਲਈ, ਦਿਮਿਤਰੀ ਦਾ ਬਲੌਗ ਵੇਖੋ।

ਜਿਵੇਂ ਤੁਸੀਂ ਦੇਖ ਸਕਦੇ ਹੋ, ਅਸੀਂ ਕਲਾਉਡ ਸੇਵਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕਈ ਤਰੀਕਿਆਂ ਨਾਲ ਡਾਟਾ ਸਾਇੰਸ ਕਰ ਸਕਦੇ ਹਾਂ।

ਫੁਟਨੋਟ

ਸਰੋਤ:


ਅਸਵੀਕਾਰਨਾ:
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ Co-op Translator ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀਤਾ ਲਈ ਯਤਨਸ਼ੀਲ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚੀਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਇਸ ਦਸਤਾਵੇਜ਼ ਦਾ ਮੂਲ ਰੂਪ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।