8.8 KiB

Raw Permalink Blame History

पाठलाई आवाजमा रूपान्तरण - भर्चुअल IoT उपकरण

यस पाठको यस भागमा, तपाईंले पाठलाई आवाजमा रूपान्तरण गर्नको लागि स्पीच सेवा प्रयोग गर्दै कोड लेख्नु हुनेछ।

पाठलाई आवाजमा रूपान्तरण गर्नुहोस्

पछिल्लो पाठमा तपाईंले स्पीचलाई पाठमा रूपान्तरण गर्न प्रयोग गरेको स्पीच सेवाको SDK लाई पाठलाई पुनः आवाजमा रूपान्तरण गर्न पनि प्रयोग गर्न सकिन्छ। आवाजको अनुरोध गर्दा, तपाईंले प्रयोग गर्न चाहिएको आवाज प्रदान गर्नुपर्छ, किनभने विभिन्न प्रकारका आवाजहरू प्रयोग गरेर आवाज उत्पन्न गर्न सकिन्छ।

प्रत्येक भाषाले विभिन्न प्रकारका आवाजहरूको समर्थन गर्दछ, र तपाईं स्पीच सेवाको SDK बाट प्रत्येक भाषाका लागि समर्थित आवाजहरूको सूची प्राप्त गर्न सक्नुहुन्छ।

कार्य - पाठलाई आवाजमा रूपान्तरण गर्नुहोस्

VS Code मा smart-timer प्रोजेक्ट खोल्नुहोस्, र टर्मिनलमा भर्चुअल वातावरण लोड भएको सुनिश्चित गर्नुहोस्।
azure.cognitiveservices.speech प्याकेजबाट SpeechSynthesizer लाई आयात गर्नुहोस् र यसलाई पहिले नै भएका आयातहरूमा थप्नुहोस्:
```
from azure.cognitiveservices.speech import SpeechConfig, SpeechRecognizer, SpeechSynthesizer
```
say फङ्सनको माथि, स्पीच सिंथेसाइजरसँग प्रयोग गर्न स्पीच कन्फिगरेसन बनाउनुहोस्:
```
speech_config = SpeechConfig(subscription=speech_api_key,
                             region=location)
speech_config.speech_synthesis_language = language
speech_synthesizer = SpeechSynthesizer(speech_config=speech_config)
```
यसले पहिचानकर्ताले प्रयोग गरेको समान API कुञ्जी, स्थान र भाषा प्रयोग गर्दछ।
यसको तल, आवाज प्राप्त गर्न र स्पीच कन्फिगमा सेट गर्न निम्न कोड थप्नुहोस्:
```
voices = speech_synthesizer.get_voices_async().get().voices
first_voice = next(x for x in voices if x.locale.lower() == language.lower())
speech_config.speech_synthesis_voice_name = first_voice.short_name
```
यसले उपलब्ध सबै आवाजहरूको सूची प्राप्त गर्दछ, त्यसपछि प्रयोग भइरहेको भाषासँग मेल खाने पहिलो आवाज फेला पार्छ।
💁 तपाईं समर्थित आवाजहरूको पूर्ण सूची Microsoft Docs मा भाषा र आवाज समर्थनको दस्तावेज बाट प्राप्त गर्न सक्नुहुन्छ। यदि तपाईं विशेष आवाज प्रयोग गर्न चाहनुहुन्छ भने, तपाईं यस फङ्सनलाई हटाएर यो दस्तावेजबाट आवाजको नामलाई हार्ड कोड गर्न सक्नुहुन्छ। उदाहरणका लागि:
```
speech_config.speech_synthesis_voice_name = 'hi-IN-SwaraNeural'
```

say फङ्सनको सामग्रीलाई SSML उत्पन्न गर्न अद्यावधिक गर्नुहोस्:

ssml =  f'<speak version=\'1.0\' xml:lang=\'{language}\'>'
ssml += f'<voice xml:lang=\'{language}\' name=\'{first_voice.short_name}\'>'
ssml += text
ssml += '</voice>'
ssml += '</speak>'

यसको तल, स्पीच पहिचान रोक्नुहोस्, SSML बोल्नुहोस्, त्यसपछि पहिचान पुनः सुरु गर्नुहोस्:
```
recognizer.stop_continuous_recognition()
speech_synthesizer.speak_ssml(ssml)
recognizer.start_continuous_recognition()
```
जब पाठ बोलिन्छ, स्पीच पहिचान रोकिएको हुन्छ ताकि टाइमर सुरु भएको घोषणा पहिचान नगरियोस्, LUIS मा पठाइयोस्, र सम्भवतः नयाँ टाइमर सेट गर्न अनुरोधको रूपमा व्याख्या नगरियोस्।

💁 तपाईं यसलाई परीक्षण गर्न सक्नुहुन्छ पहिचान रोक्न र पुनः सुरु गर्नका लागि लाइनहरूलाई कमेन्ट गरेर। एउटा टाइमर सेट गर्नुहोस्, र तपाईंले पाउन सक्नुहुन्छ कि घोषणाले नयाँ टाइमर सेट गर्दछ, जसले नयाँ घोषणा गराउँछ, र यसरी अनन्त चक्र चलिरहन्छ!
एप चलाउनुहोस्, र सुनिश्चित गर्नुहोस् कि फङ्सन एप पनि चलिरहेको छ। केही टाइमरहरू सेट गर्नुहोस्, र तपाईंले सुन्नुहुनेछ कि तपाईंको टाइमर सेट भएको छ भन्ने बोलेको प्रतिक्रिया, त्यसपछि टाइमर पूरा भएपछि अर्को बोलेको प्रतिक्रिया।

💁 तपाईं यो कोड code-spoken-response/virtual-iot-device फोल्डरमा पाउन सक्नुहुन्छ।

😀 तपाईंको टाइमर प्रोग्राम सफल भयो!

अस्वीकरण:
यो दस्तावेज़ AI अनुवाद सेवा Co-op Translator प्रयोग गरी अनुवाद गरिएको हो। हामी यथासम्भव सटीकता सुनिश्चित गर्न प्रयास गर्छौं, तर कृपया ध्यान दिनुहोस् कि स्वचालित अनुवादहरूमा त्रुटि वा अशुद्धता हुन सक्छ। यसको मूल भाषामा रहेको मूल दस्तावेज़लाई आधिकारिक स्रोत मानिनुपर्छ। महत्त्वपूर्ण जानकारीका लागि, व्यावसायिक मानव अनुवाद सिफारिस गरिन्छ। यस अनुवादको प्रयोगबाट उत्पन्न हुने कुनै पनि गलतफहमी वा गलत व्याख्याका लागि हामी जिम्मेवार हुने छैनौं।

8.8 KiB Raw Permalink Blame History

पाठलाई आवाजमा रूपान्तरण - भर्चुअल IoT उपकरण

पाठलाई आवाजमा रूपान्तरण गर्नुहोस्

कार्य - पाठलाई आवाजमा रूपान्तरण गर्नुहोस्

8.8 KiB

Raw Permalink Blame History