13 KiB
ਟਾਈਮਰ ਸੈਟ ਕਰੋ ਅਤੇ ਬੋਲੀ ਰਾਹੀਂ ਫੀਡਬੈਕ ਦਿਓ
ਸਕੈਚਨੋਟ ਨਿਤਿਆ ਨਰਸਿੰਮਨ ਵੱਲੋਂ। ਵੱਡੇ ਵਰਜਨ ਲਈ ਚਿੱਤਰ 'ਤੇ ਕਲਿੱਕ ਕਰੋ।
ਪਾਠ ਤੋਂ ਪਹਿਲਾਂ ਕਵੀਜ਼
ਪਰਿਚਯ
ਸਮਾਰਟ ਅਸਿਸਟੈਂਟ ਇੱਕ-ਪਾਸੇ ਸੰਚਾਰ ਦੇ ਯੰਤਰ ਨਹੀਂ ਹੁੰਦੇ। ਤੁਸੀਂ ਉਨ੍ਹਾਂ ਨਾਲ ਗੱਲ ਕਰਦੇ ਹੋ, ਅਤੇ ਉਹ ਜਵਾਬ ਦਿੰਦੇ ਹਨ:
"ਅਲੇਕਸਾ, 3 ਮਿੰਟ ਦਾ ਟਾਈਮਰ ਸੈਟ ਕਰੋ।"
"ਠੀਕ ਹੈ, ਤੁਹਾਡਾ ਟਾਈਮਰ 3 ਮਿੰਟ ਲਈ ਸੈਟ ਕੀਤਾ ਗਿਆ ਹੈ।"
ਪਿਛਲੇ 2 ਪਾਠਾਂ ਵਿੱਚ ਤੁਸੀਂ ਸਿੱਖਿਆ ਕਿ ਬੋਲੀ ਨੂੰ ਲਿਖਤ ਵਿੱਚ ਕਿਵੇਂ ਬਦਲਣਾ ਹੈ, ਅਤੇ ਫਿਰ ਉਸ ਲਿਖਤ ਵਿੱਚੋਂ ਟਾਈਮਰ ਸੈਟ ਕਰਨ ਦੀ ਬੇਨਤੀ ਕਿਵੇਂ ਕੱਢਣੀ ਹੈ। ਇਸ ਪਾਠ ਵਿੱਚ ਤੁਸੀਂ ਸਿੱਖੋਗੇ ਕਿ IoT ਡਿਵਾਈਸ 'ਤੇ ਟਾਈਮਰ ਕਿਵੇਂ ਸੈਟ ਕਰਨਾ ਹੈ, ਉਪਭੋਗਤਾ ਨੂੰ ਬੋਲੀ ਰਾਹੀਂ ਪੁਸ਼ਟੀ ਦੇਣ ਲਈ ਜਵਾਬ ਦੇਣਾ ਹੈ, ਅਤੇ ਜਦੋਂ ਟਾਈਮਰ ਖਤਮ ਹੋ ਜਾਵੇ ਤਾਂ ਉਨ੍ਹਾਂ ਨੂੰ ਸੂਚਿਤ ਕਰਨਾ ਹੈ।
ਇਸ ਪਾਠ ਵਿੱਚ ਅਸੀਂ ਕਵਰ ਕਰਾਂਗੇ:
ਲਿਖਤ ਤੋਂ ਬੋਲੀ
ਜਿਵੇਂ ਨਾਮ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ, ਲਿਖਤ ਤੋਂ ਬੋਲੀ ਤੱਕ ਦਾ ਪ੍ਰਕਿਰਿਆ ਲਿਖਤ ਨੂੰ ਆਡੀਓ ਵਿੱਚ ਬਦਲਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ, ਜੋ ਕਿ ਬੋਲੀ ਦੇ ਰੂਪ ਵਿੱਚ ਲਿਖਤ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਇਸਦਾ ਮੁੱਖ ਸਿਧਾਂਤ ਇਹ ਹੈ ਕਿ ਲਿਖਤ ਵਿੱਚ ਸ਼ਬਦਾਂ ਨੂੰ ਉਨ੍ਹਾਂ ਦੇ ਅੰਗੀਕ੍ਰਿਤ ਧੁਨੀਆਂ (ਜਿਨ੍ਹਾਂ ਨੂੰ ਫੋਨੀਮ ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਵਿੱਚ ਤੋੜਿਆ ਜਾਵੇ, ਅਤੇ ਉਨ੍ਹਾਂ ਧੁਨੀਆਂ ਲਈ ਆਡੀਓ ਨੂੰ ਜੋੜਿਆ ਜਾਵੇ, ਚਾਹੇ ਉਹ ਪਹਿਲਾਂ ਤੋਂ ਰਿਕਾਰਡ ਕੀਤੀ ਗਈ ਆਡੀਓ ਹੋਵੇ ਜਾਂ AI ਮਾਡਲਾਂ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੀ ਗਈ ਆਡੀਓ।
ਲਿਖਤ ਤੋਂ ਬੋਲੀ ਤੱਕ ਦੇ ਸਿਸਟਮ ਆਮ ਤੌਰ 'ਤੇ 3 ਪੜਾਅ ਵਿੱਚ ਕੰਮ ਕਰਦੇ ਹਨ:
- ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ
- ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ
- ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨਾ
ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ
ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਦਿੱਤੀ ਗਈ ਲਿਖਤ ਨੂੰ ਲੈਣਾ ਅਤੇ ਉਸਨੂੰ ਬੋਲੀ ਵਿੱਚ ਬਦਲਣ ਯੋਗ ਸ਼ਬਦਾਂ ਵਿੱਚ ਤਬਦੀਲ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ। ਉਦਾਹਰਣ ਲਈ, ਜੇ ਤੁਸੀਂ "ਹੈਲੋ ਵਰਲਡ" ਨੂੰ ਬਦਲਦੇ ਹੋ, ਤਾਂ ਕੋਈ ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ, ਇਹ ਦੋ ਸ਼ਬਦ ਸਿੱਧੇ ਬੋਲੀ ਵਿੱਚ ਬਦਲੇ ਜਾ ਸਕਦੇ ਹਨ। ਪਰ ਜੇ ਤੁਸੀਂ "1234" ਲਿਖਦੇ ਹੋ, ਤਾਂ ਇਸਨੂੰ ਸੰਦਰਭ ਦੇ ਅਨੁਸਾਰ "ਇੱਕ ਹਜ਼ਾਰ, ਦੋ ਸੌ ਚੌਂਤੀ" ਜਾਂ "ਇੱਕ, ਦੋ, ਤਿੰਨ, ਚਾਰ" ਵਿੱਚ ਬਦਲਣ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ "ਮੇਰੇ ਕੋਲ 1234 ਸੇਬ ਹਨ" ਵਿੱਚ ਇਹ "ਇੱਕ ਹਜ਼ਾਰ, ਦੋ ਸੌ ਚੌਂਤੀ" ਹੋਵੇਗਾ, ਪਰ "ਬੱਚੇ ਨੇ 1234 ਗਿਣੇ" ਵਿੱਚ ਇਹ "ਇੱਕ, ਦੋ, ਤਿੰਨ, ਚਾਰ" ਹੋਵੇਗਾ।
ਸ਼ਬਦ ਸਿਰਫ਼ ਭਾਸ਼ਾ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਉਸ ਭਾਸ਼ਾ ਦੇ ਸਥਾਨਕ ਰੂਪ ਦੇ ਅਨੁਸਾਰ ਵੀ ਵੱਖਰੇ ਹੋ ਸਕਦੇ ਹਨ। ਉਦਾਹਰਣ ਲਈ, ਅਮਰੀਕੀ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ 120 ਨੂੰ "ਵਨ ਹੰਡਰਡ ਟਵੈਂਟੀ" ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਜਦਕਿ ਬ੍ਰਿਟਿਸ਼ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਇਹ "ਵਨ ਹੰਡਰਡ ਐਂਡ ਟਵੈਂਟੀ" ਹੁੰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸੌ ਦੇ ਬਾਅਦ "ਐਂਡ" ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।
✅ ਕੁਝ ਹੋਰ ਉਦਾਹਰਣ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਉਹ ਹਨ "in" ਨੂੰ ਇੰਚ ਦਾ ਸੰਖੇਪ ਰੂਪ ਸਮਝਣਾ, ਅਤੇ "st" ਨੂੰ ਸੇਂਟ ਜਾਂ ਸਟ੍ਰੀਟ ਦਾ ਸੰਖੇਪ ਰੂਪ ਸਮਝਣਾ। ਕੀ ਤੁਸੀਂ ਆਪਣੀ ਭਾਸ਼ਾ ਵਿੱਚ ਹੋਰ ਉਦਾਹਰਣ ਬਾਰੇ ਸੋਚ ਸਕਦੇ ਹੋ ਜਿੱਥੇ ਸੰਦਰਭ ਤੋਂ ਬਿਨਾਂ ਸ਼ਬਦ ਅਸਪਸ਼ਟ ਹੁੰਦੇ ਹਨ?
ਜਦੋਂ ਸ਼ਬਦ ਨਿਰਧਾਰਿਤ ਹੋ ਜਾਂਦੇ ਹਨ, ਤਾਂ ਉਹ ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਭੇਜੇ ਜਾਂਦੇ ਹਨ।
ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ
ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਸ਼ਬਦਾਂ ਨੂੰ ਫੋਨੀਮ ਵਿੱਚ ਤੋੜ ਦਿੰਦਾ ਹੈ। ਫੋਨੀਮ ਸਿਰਫ਼ ਵਰਤੀਆਂ ਗਈਆਂ ਅੱਖਰਾਂ 'ਤੇ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਸ਼ਬਦ ਵਿੱਚ ਮੌਜੂਦ ਹੋਰ ਅੱਖਰਾਂ 'ਤੇ ਵੀ ਆਧਾਰਿਤ ਹੁੰਦੇ ਹਨ। ਉਦਾਹਰਣ ਲਈ, ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ 'car' ਅਤੇ 'care' ਵਿੱਚ 'a' ਦੀ ਧੁਨੀ ਵੱਖਰੀ ਹੁੰਦੀ ਹੈ। ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾ ਵਿੱਚ 26 ਅੱਖਰਾਂ ਲਈ 44 ਵੱਖਰੇ ਫੋਨੀਮ ਹਨ, ਕੁਝ ਵੱਖਰੇ ਅੱਖਰਾਂ ਦੁਆਰਾ ਸਾਂਝੇ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ 'circle' ਅਤੇ 'serpent' ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਵਰਤਿਆ ਗਿਆ ਫੋਨੀਮ।
✅ ਖੋਜ ਕਰੋ: ਤੁਹਾਡੀ ਭਾਸ਼ਾ ਵਿੱਚ ਫੋਨੀਮ ਕੀ ਹਨ?
ਜਦੋਂ ਸ਼ਬਦਾਂ ਨੂੰ ਫੋਨੀਮ ਵਿੱਚ ਬਦਲਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਨ੍ਹਾਂ ਫੋਨੀਮਾਂ ਨੂੰ ਸੰਦਰਭ ਦੇ ਅਨੁਸਾਰ ਸੁਰ ਅਤੇ ਅਵਧੀ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ ਵਾਧੂ ਡਾਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਉਦਾਹਰਣ ਹੈ ਕਿ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਸਵਾਲ ਬਣਾਉਣ ਲਈ ਪਿਛਲੇ ਸ਼ਬਦ ਲਈ ਸੁਰ ਨੂੰ ਵਧਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
ਉਦਾਹਰਣ ਲਈ - "ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ" ਇੱਕ ਵਾਕ ਹੈ ਜੋ ਦੱਸਦਾ ਹੈ ਕਿ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ। ਜੇ ਸੁਰ ਆਖਰੀ ਸ਼ਬਦ 'ਤੇ ਵਧਦਾ ਹੈ, ਤਾਂ ਇਹ ਸਵਾਲ ਬਣ ਜਾਂਦਾ ਹੈ "ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ?", ਪੁੱਛਦਾ ਹੈ ਕਿ ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ। ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਸਵਾਲ ਚਿੰਨ੍ਹ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੁਰ ਵਧਾਉਣ ਦਾ ਫੈਸਲਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ।
ਜਦੋਂ ਫੋਨੀਮ ਤਿਆਰ ਹੋ ਜਾਂਦੇ ਹਨ, ਤਾਂ ਉਹ ਆਡੀਓ ਨਿਕਾਸ ਲਈ ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨ ਲਈ ਭੇਜੇ ਜਾਂਦੇ ਹਨ।
ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨਾ
ਸਭ ਤੋਂ ਪਹਿਲੇ ਇਲੈਕਟ੍ਰੋਨਿਕ ਲਿਖਤ ਤੋਂ ਬੋਲੀ ਤੱਕ ਦੇ ਸਿਸਟਮ ਹਰ ਫੋਨੀਮ ਲਈ ਇੱਕੋ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਵਰਤਦੇ ਸਨ, ਜਿਸ ਨਾਲ ਬਹੁਤ ਹੀ ਰੋਬੋਟਿਕ ਬੋਲੀ ਵਾਲੀਆਂ ਧੁਨੀਆਂ ਬਣਦੀਆਂ ਸਨ। ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਫੋਨੀਮ ਤਿਆਰ ਕਰਦਾ ਸੀ, ਇਹ ਫੋਨੀਮ ਧੁਨੀਆਂ ਦੇ ਡਾਟਾਬੇਸ ਤੋਂ ਲੋਡ ਕੀਤੇ ਜਾਂਦੇ ਸਨ ਅਤੇ ਆਡੀਓ ਬਣਾਉਣ ਲਈ ਜੋੜੇ ਜਾਂਦੇ ਸਨ।
✅ ਖੋਜ ਕਰੋ: ਪੁਰਾਣੇ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਸਿਸਟਮਾਂ ਤੋਂ ਕੁਝ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਲੱਭੋ। ਇਸਨੂੰ ਆਧੁਨਿਕ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਨਾਲ ਤੁਲਨਾ ਕਰੋ, ਜਿਵੇਂ ਕਿ ਸਮਾਰਟ ਅਸਿਸਟੈਂਟਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।
ਆਧੁਨਿਕ ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨ ਲਈ ਡੀਪ ਲਰਨਿੰਗ (ਬਹੁਤ ਵੱਡੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਜੋ ਦਿਮਾਗ ਵਿੱਚ ਨਿਊਰੋਨ ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ) ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਜੋ ਕਿ ਬਹੁਤ ਕੁਦਰਤੀ ਧੁਨੀਆਂ ਪੈਦਾ ਕਰਦੇ ਹਨ ਜੋ ਮਨੁੱਖਾਂ ਤੋਂ ਅਲੱਗ ਨਹੀਂ ਲੱਗਦੀਆਂ।
💁 ਇਨ੍ਹਾਂ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲਾਂ ਨੂੰ ਟ੍ਰਾਂਸਫਰ ਲਰਨਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਸਲੀ ਲੋਕਾਂ ਵਾਂਗ ਬੋਲਣ ਲਈ ਦੁਬਾਰਾ ਸਿਖਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੋਲੀ ਨੂੰ ਸੁਰੱਖਿਆ ਪ੍ਰਣਾਲੀ ਵਜੋਂ ਵਰਤਣਾ, ਜੋ ਕਿ ਬੈਂਕ ਵਧ ਰਹੇ ਤੌਰ 'ਤੇ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹਨ, ਹੁਣ ਇੱਕ ਚੰਗਾ ਵਿਚਾਰ ਨਹੀਂ ਹੈ ਕਿਉਂਕਿ ਤੁਹਾਡੀ ਬੋਲੀ ਦੀ ਕੁਝ ਮਿੰਟਾਂ ਦੀ ਰਿਕਾਰਡਿੰਗ ਨਾਲ ਕੋਈ ਵੀ ਤੁਹਾਡੀ ਨਕਲ ਕਰ ਸਕਦਾ ਹੈ।
ਇਹ ਵੱਡੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਤਿੰਨੋ ਪੜਾਅ ਨੂੰ ਜੋੜ ਕੇ ਇੱਕ ਅੰਤ-ਤੱਕ ਬੋਲੀ ਸੰਸਲੇਸ਼ਕ ਬਣਾਉਣ ਲਈ ਸਿਖਾਏ ਜਾ ਰਹੇ ਹਨ।
ਟਾਈਮਰ ਸੈਟ ਕਰੋ
ਟimers
ਅਸਵੀਕਰਤੀ:
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ Co-op Translator ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤ ਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।