|
3 weeks ago | |
---|---|---|
.. | ||
README.md | 3 weeks ago | |
assignment.md | 3 weeks ago | |
pi-text-to-speech.md | 3 weeks ago | |
single-board-computer-set-timer.md | 3 weeks ago | |
virtual-device-text-to-speech.md | 3 weeks ago | |
wio-terminal-set-timer.md | 3 weeks ago | |
wio-terminal-text-to-speech.md | 3 weeks ago |
README.md
ਟਾਈਮਰ ਸੈਟ ਕਰੋ ਅਤੇ ਬੋਲੀ ਰਾਹੀਂ ਫੀਡਬੈਕ ਦਿਓ
ਸਕੈਚਨੋਟ ਨਿਤਿਆ ਨਰਸਿੰਮਨ ਵੱਲੋਂ। ਵੱਡੇ ਵਰਜਨ ਲਈ ਚਿੱਤਰ 'ਤੇ ਕਲਿੱਕ ਕਰੋ।
ਪਾਠ ਤੋਂ ਪਹਿਲਾਂ ਕਵੀਜ਼
ਪਰਿਚਯ
ਸਮਾਰਟ ਅਸਿਸਟੈਂਟ ਇੱਕ-ਪਾਸੇ ਸੰਚਾਰ ਦੇ ਯੰਤਰ ਨਹੀਂ ਹੁੰਦੇ। ਤੁਸੀਂ ਉਨ੍ਹਾਂ ਨਾਲ ਗੱਲ ਕਰਦੇ ਹੋ, ਅਤੇ ਉਹ ਜਵਾਬ ਦਿੰਦੇ ਹਨ:
"ਅਲੇਕਸਾ, 3 ਮਿੰਟ ਦਾ ਟਾਈਮਰ ਸੈਟ ਕਰੋ।"
"ਠੀਕ ਹੈ, ਤੁਹਾਡਾ ਟਾਈਮਰ 3 ਮਿੰਟ ਲਈ ਸੈਟ ਕੀਤਾ ਗਿਆ ਹੈ।"
ਪਿਛਲੇ 2 ਪਾਠਾਂ ਵਿੱਚ ਤੁਸੀਂ ਸਿੱਖਿਆ ਕਿ ਬੋਲੀ ਨੂੰ ਲਿਖਤ ਵਿੱਚ ਕਿਵੇਂ ਬਦਲਣਾ ਹੈ, ਅਤੇ ਫਿਰ ਉਸ ਲਿਖਤ ਵਿੱਚੋਂ ਟਾਈਮਰ ਸੈਟ ਕਰਨ ਦੀ ਬੇਨਤੀ ਕਿਵੇਂ ਕੱਢਣੀ ਹੈ। ਇਸ ਪਾਠ ਵਿੱਚ ਤੁਸੀਂ ਸਿੱਖੋਗੇ ਕਿ IoT ਡਿਵਾਈਸ 'ਤੇ ਟਾਈਮਰ ਕਿਵੇਂ ਸੈਟ ਕਰਨਾ ਹੈ, ਉਪਭੋਗਤਾ ਨੂੰ ਬੋਲੀ ਰਾਹੀਂ ਪੁਸ਼ਟੀ ਦੇਣ ਲਈ ਜਵਾਬ ਦੇਣਾ ਹੈ, ਅਤੇ ਜਦੋਂ ਟਾਈਮਰ ਖਤਮ ਹੋ ਜਾਵੇ ਤਾਂ ਉਨ੍ਹਾਂ ਨੂੰ ਸੂਚਿਤ ਕਰਨਾ ਹੈ।
ਇਸ ਪਾਠ ਵਿੱਚ ਅਸੀਂ ਕਵਰ ਕਰਾਂਗੇ:
ਲਿਖਤ ਤੋਂ ਬੋਲੀ
ਜਿਵੇਂ ਨਾਮ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ, ਲਿਖਤ ਤੋਂ ਬੋਲੀ ਤੱਕ ਦਾ ਪ੍ਰਕਿਰਿਆ ਲਿਖਤ ਨੂੰ ਆਡੀਓ ਵਿੱਚ ਬਦਲਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ, ਜੋ ਕਿ ਬੋਲੀ ਦੇ ਰੂਪ ਵਿੱਚ ਲਿਖਤ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਇਸਦਾ ਮੁੱਖ ਸਿਧਾਂਤ ਇਹ ਹੈ ਕਿ ਲਿਖਤ ਵਿੱਚ ਸ਼ਬਦਾਂ ਨੂੰ ਉਨ੍ਹਾਂ ਦੇ ਅੰਗੀਕ੍ਰਿਤ ਧੁਨੀਆਂ (ਜਿਨ੍ਹਾਂ ਨੂੰ ਫੋਨੀਮ ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਵਿੱਚ ਤੋੜਿਆ ਜਾਵੇ, ਅਤੇ ਉਨ੍ਹਾਂ ਧੁਨੀਆਂ ਲਈ ਆਡੀਓ ਨੂੰ ਜੋੜਿਆ ਜਾਵੇ, ਚਾਹੇ ਉਹ ਪਹਿਲਾਂ ਤੋਂ ਰਿਕਾਰਡ ਕੀਤੀ ਗਈ ਆਡੀਓ ਹੋਵੇ ਜਾਂ AI ਮਾਡਲਾਂ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੀ ਗਈ ਆਡੀਓ।
ਲਿਖਤ ਤੋਂ ਬੋਲੀ ਤੱਕ ਦੇ ਸਿਸਟਮ ਆਮ ਤੌਰ 'ਤੇ 3 ਪੜਾਅ ਵਿੱਚ ਕੰਮ ਕਰਦੇ ਹਨ:
- ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ
- ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ
- ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨਾ
ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ
ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਦਿੱਤੀ ਗਈ ਲਿਖਤ ਨੂੰ ਲੈਣਾ ਅਤੇ ਉਸਨੂੰ ਬੋਲੀ ਵਿੱਚ ਬਦਲਣ ਯੋਗ ਸ਼ਬਦਾਂ ਵਿੱਚ ਤਬਦੀਲ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ। ਉਦਾਹਰਣ ਲਈ, ਜੇ ਤੁਸੀਂ "ਹੈਲੋ ਵਰਲਡ" ਨੂੰ ਬਦਲਦੇ ਹੋ, ਤਾਂ ਕੋਈ ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ, ਇਹ ਦੋ ਸ਼ਬਦ ਸਿੱਧੇ ਬੋਲੀ ਵਿੱਚ ਬਦਲੇ ਜਾ ਸਕਦੇ ਹਨ। ਪਰ ਜੇ ਤੁਸੀਂ "1234" ਲਿਖਦੇ ਹੋ, ਤਾਂ ਇਸਨੂੰ ਸੰਦਰਭ ਦੇ ਅਨੁਸਾਰ "ਇੱਕ ਹਜ਼ਾਰ, ਦੋ ਸੌ ਚੌਂਤੀ" ਜਾਂ "ਇੱਕ, ਦੋ, ਤਿੰਨ, ਚਾਰ" ਵਿੱਚ ਬਦਲਣ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ "ਮੇਰੇ ਕੋਲ 1234 ਸੇਬ ਹਨ" ਵਿੱਚ ਇਹ "ਇੱਕ ਹਜ਼ਾਰ, ਦੋ ਸੌ ਚੌਂਤੀ" ਹੋਵੇਗਾ, ਪਰ "ਬੱਚੇ ਨੇ 1234 ਗਿਣੇ" ਵਿੱਚ ਇਹ "ਇੱਕ, ਦੋ, ਤਿੰਨ, ਚਾਰ" ਹੋਵੇਗਾ।
ਸ਼ਬਦ ਸਿਰਫ਼ ਭਾਸ਼ਾ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਉਸ ਭਾਸ਼ਾ ਦੇ ਸਥਾਨਕ ਰੂਪ ਦੇ ਅਨੁਸਾਰ ਵੀ ਵੱਖਰੇ ਹੋ ਸਕਦੇ ਹਨ। ਉਦਾਹਰਣ ਲਈ, ਅਮਰੀਕੀ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ 120 ਨੂੰ "ਵਨ ਹੰਡਰਡ ਟਵੈਂਟੀ" ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਜਦਕਿ ਬ੍ਰਿਟਿਸ਼ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਇਹ "ਵਨ ਹੰਡਰਡ ਐਂਡ ਟਵੈਂਟੀ" ਹੁੰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸੌ ਦੇ ਬਾਅਦ "ਐਂਡ" ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।
✅ ਕੁਝ ਹੋਰ ਉਦਾਹਰਣ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਲਿਖਤ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਉਹ ਹਨ "in" ਨੂੰ ਇੰਚ ਦਾ ਸੰਖੇਪ ਰੂਪ ਸਮਝਣਾ, ਅਤੇ "st" ਨੂੰ ਸੇਂਟ ਜਾਂ ਸਟ੍ਰੀਟ ਦਾ ਸੰਖੇਪ ਰੂਪ ਸਮਝਣਾ। ਕੀ ਤੁਸੀਂ ਆਪਣੀ ਭਾਸ਼ਾ ਵਿੱਚ ਹੋਰ ਉਦਾਹਰਣ ਬਾਰੇ ਸੋਚ ਸਕਦੇ ਹੋ ਜਿੱਥੇ ਸੰਦਰਭ ਤੋਂ ਬਿਨਾਂ ਸ਼ਬਦ ਅਸਪਸ਼ਟ ਹੁੰਦੇ ਹਨ?
ਜਦੋਂ ਸ਼ਬਦ ਨਿਰਧਾਰਿਤ ਹੋ ਜਾਂਦੇ ਹਨ, ਤਾਂ ਉਹ ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਭੇਜੇ ਜਾਂਦੇ ਹਨ।
ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ
ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਸ਼ਬਦਾਂ ਨੂੰ ਫੋਨੀਮ ਵਿੱਚ ਤੋੜ ਦਿੰਦਾ ਹੈ। ਫੋਨੀਮ ਸਿਰਫ਼ ਵਰਤੀਆਂ ਗਈਆਂ ਅੱਖਰਾਂ 'ਤੇ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਸ਼ਬਦ ਵਿੱਚ ਮੌਜੂਦ ਹੋਰ ਅੱਖਰਾਂ 'ਤੇ ਵੀ ਆਧਾਰਿਤ ਹੁੰਦੇ ਹਨ। ਉਦਾਹਰਣ ਲਈ, ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ 'car' ਅਤੇ 'care' ਵਿੱਚ 'a' ਦੀ ਧੁਨੀ ਵੱਖਰੀ ਹੁੰਦੀ ਹੈ। ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾ ਵਿੱਚ 26 ਅੱਖਰਾਂ ਲਈ 44 ਵੱਖਰੇ ਫੋਨੀਮ ਹਨ, ਕੁਝ ਵੱਖਰੇ ਅੱਖਰਾਂ ਦੁਆਰਾ ਸਾਂਝੇ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ 'circle' ਅਤੇ 'serpent' ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਵਰਤਿਆ ਗਿਆ ਫੋਨੀਮ।
✅ ਖੋਜ ਕਰੋ: ਤੁਹਾਡੀ ਭਾਸ਼ਾ ਵਿੱਚ ਫੋਨੀਮ ਕੀ ਹਨ?
ਜਦੋਂ ਸ਼ਬਦਾਂ ਨੂੰ ਫੋਨੀਮ ਵਿੱਚ ਬਦਲਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਨ੍ਹਾਂ ਫੋਨੀਮਾਂ ਨੂੰ ਸੰਦਰਭ ਦੇ ਅਨੁਸਾਰ ਸੁਰ ਅਤੇ ਅਵਧੀ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ ਵਾਧੂ ਡਾਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਉਦਾਹਰਣ ਹੈ ਕਿ ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਸਵਾਲ ਬਣਾਉਣ ਲਈ ਪਿਛਲੇ ਸ਼ਬਦ ਲਈ ਸੁਰ ਨੂੰ ਵਧਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
ਉਦਾਹਰਣ ਲਈ - "ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ" ਇੱਕ ਵਾਕ ਹੈ ਜੋ ਦੱਸਦਾ ਹੈ ਕਿ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ। ਜੇ ਸੁਰ ਆਖਰੀ ਸ਼ਬਦ 'ਤੇ ਵਧਦਾ ਹੈ, ਤਾਂ ਇਹ ਸਵਾਲ ਬਣ ਜਾਂਦਾ ਹੈ "ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ?", ਪੁੱਛਦਾ ਹੈ ਕਿ ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸੇਬ ਹੈ। ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਸਵਾਲ ਚਿੰਨ੍ਹ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੁਰ ਵਧਾਉਣ ਦਾ ਫੈਸਲਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ।
ਜਦੋਂ ਫੋਨੀਮ ਤਿਆਰ ਹੋ ਜਾਂਦੇ ਹਨ, ਤਾਂ ਉਹ ਆਡੀਓ ਨਿਕਾਸ ਲਈ ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨ ਲਈ ਭੇਜੇ ਜਾਂਦੇ ਹਨ।
ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨਾ
ਸਭ ਤੋਂ ਪਹਿਲੇ ਇਲੈਕਟ੍ਰੋਨਿਕ ਲਿਖਤ ਤੋਂ ਬੋਲੀ ਤੱਕ ਦੇ ਸਿਸਟਮ ਹਰ ਫੋਨੀਮ ਲਈ ਇੱਕੋ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਵਰਤਦੇ ਸਨ, ਜਿਸ ਨਾਲ ਬਹੁਤ ਹੀ ਰੋਬੋਟਿਕ ਬੋਲੀ ਵਾਲੀਆਂ ਧੁਨੀਆਂ ਬਣਦੀਆਂ ਸਨ। ਭਾਸ਼ਾਈ ਵਿਸ਼ਲੇਸ਼ਣ ਫੋਨੀਮ ਤਿਆਰ ਕਰਦਾ ਸੀ, ਇਹ ਫੋਨੀਮ ਧੁਨੀਆਂ ਦੇ ਡਾਟਾਬੇਸ ਤੋਂ ਲੋਡ ਕੀਤੇ ਜਾਂਦੇ ਸਨ ਅਤੇ ਆਡੀਓ ਬਣਾਉਣ ਲਈ ਜੋੜੇ ਜਾਂਦੇ ਸਨ।
✅ ਖੋਜ ਕਰੋ: ਪੁਰਾਣੇ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਸਿਸਟਮਾਂ ਤੋਂ ਕੁਝ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਲੱਭੋ। ਇਸਨੂੰ ਆਧੁਨਿਕ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਨਾਲ ਤੁਲਨਾ ਕਰੋ, ਜਿਵੇਂ ਕਿ ਸਮਾਰਟ ਅਸਿਸਟੈਂਟਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।
ਆਧੁਨਿਕ ਵੇਵ-ਫਾਰਮ ਤਿਆਰ ਕਰਨ ਲਈ ਡੀਪ ਲਰਨਿੰਗ (ਬਹੁਤ ਵੱਡੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਜੋ ਦਿਮਾਗ ਵਿੱਚ ਨਿਊਰੋਨ ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ) ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਜੋ ਕਿ ਬਹੁਤ ਕੁਦਰਤੀ ਧੁਨੀਆਂ ਪੈਦਾ ਕਰਦੇ ਹਨ ਜੋ ਮਨੁੱਖਾਂ ਤੋਂ ਅਲੱਗ ਨਹੀਂ ਲੱਗਦੀਆਂ।
💁 ਇਨ੍ਹਾਂ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲਾਂ ਨੂੰ ਟ੍ਰਾਂਸਫਰ ਲਰਨਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਸਲੀ ਲੋਕਾਂ ਵਾਂਗ ਬੋਲਣ ਲਈ ਦੁਬਾਰਾ ਸਿਖਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੋਲੀ ਨੂੰ ਸੁਰੱਖਿਆ ਪ੍ਰਣਾਲੀ ਵਜੋਂ ਵਰਤਣਾ, ਜੋ ਕਿ ਬੈਂਕ ਵਧ ਰਹੇ ਤੌਰ 'ਤੇ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹਨ, ਹੁਣ ਇੱਕ ਚੰਗਾ ਵਿਚਾਰ ਨਹੀਂ ਹੈ ਕਿਉਂਕਿ ਤੁਹਾਡੀ ਬੋਲੀ ਦੀ ਕੁਝ ਮਿੰਟਾਂ ਦੀ ਰਿਕਾਰਡਿੰਗ ਨਾਲ ਕੋਈ ਵੀ ਤੁਹਾਡੀ ਨਕਲ ਕਰ ਸਕਦਾ ਹੈ।
ਇਹ ਵੱਡੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਤਿੰਨੋ ਪੜਾਅ ਨੂੰ ਜੋੜ ਕੇ ਇੱਕ ਅੰਤ-ਤੱਕ ਬੋਲੀ ਸੰਸਲੇਸ਼ਕ ਬਣਾਉਣ ਲਈ ਸਿਖਾਏ ਜਾ ਰਹੇ ਹਨ।
ਟਾਈਮਰ ਸੈਟ ਕਰੋ
ਟimers
ਅਸਵੀਕਰਤੀ:
ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ Co-op Translator ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀ ਹੋਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸੁਚਤਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਇਸਦੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਤ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਤੋਂ ਪੈਦਾ ਹੋਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਗਲਤ ਫਹਿਮੀ ਜਾਂ ਗਲਤ ਵਿਆਖਿਆ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ।