You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
IoT-For-Beginners/translations/my/6-consumer/lessons/3-spoken-feedback/README.md

22 KiB

အချိန်တစ်ခုကို သတ်မှတ်ပြီး မိန့်ဖြင့်တုံ့ပြန်ပါ

ဒီသင်ခန်းစာ၏ အကျဉ်းချုပ်ကို ရေးဆွဲထားသော ပုံ

Nitya Narasimhan မှ ရေးဆွဲထားသော ပုံ။ ပုံကို နှိပ်ပြီး ပိုမိုကြီးမားသော ဗားရှင်းကို ကြည့်ပါ။

သင်ခန်းစာမတိုင်မီ မေးခွန်းများ

သင်ခန်းစာမတိုင်မီ မေးခွန်းများ

အကျဉ်းချုပ်

အာရုံခံကိရိယာများသည် တစ်ဖက်သတ် ဆက်သွယ်မှုကိရိယာများမဟုတ်ပါ။ သင်မိန့်ကြားပြီး၊ ၎င်းတို့သည် တုံ့ပြန်သည်-

"Alexa, ၃ မိနစ်အချိန်ကို သတ်မှတ်ပါ"

"အိုကေ၊ သင့်အချိန်ကို ၃ မိနစ်အတွက် သတ်မှတ်ပြီးပါပြီ"

နောက်ဆုံး ၂ သင်ခန်းစာတွင် သင်သည် မိန့်ကို စကားလုံးအဖြစ် ပြောင်းပြီး၊ ထိုစကားလုံးများမှ အချိန်တစ်ခုကို သတ်မှတ်ရန် တောင်းဆိုမှုကို ထုတ်ယူနိုင်သော နည်းလမ်းကို သင်ယူခဲ့ပါသည်။ ဒီသင်ခန်းစာတွင် သင်သည် IoT ကိရိယာပေါ်တွင် အချိန်တစ်ခုကို သတ်မှတ်ပြီး၊ အသုံးပြုသူအား မိန့်ဖြင့် အချိန်ကို အတည်ပြုပြီး၊ အချိန်ပြီးဆုံးသောအခါ သတိပေးမည့် နည်းလမ်းကို သင်ယူပါမည်။

ဒီသင်ခန်းစာတွင် ကျွန်ုပ်တို့ ဖော်ပြမည့်အကြောင်းအရာများမှာ-

စာသားကို မိန့်အဖြစ် ပြောင်းခြင်း

စာသားကို မိန့်အဖြစ် ပြောင်းခြင်းသည် စာသားကို အသံအဖြစ် ပြောင်းလဲပြီး၊ စကားလုံးများအဖြစ် ပြောဆိုသော အသံကို ဖန်တီးခြင်းဖြစ်သည်။ အခြေခံအယူအဆမှာ စာသားထဲရှိ စကားလုံးများကို ၎င်းတို့၏ အသံဖွဲ့စည်းမှု (phonemes ဟုခေါ်သည်) အပိုင်းအစများအဖြစ် ခွဲခြားပြီး၊ ၎င်းအသံများအတွက် အသံကို AI မော်ဒယ်များမှ ဖန်တီးခြင်း သို့မဟုတ် ကြိုတင်မှတ်တမ်းတင်ထားသော အသံများကို အသုံးပြု၍ ပေါင်းစည်းခြင်းဖြစ်သည်။

စာသားကို မိန့်အဖြစ် ပြောင်းလဲသည့် စနစ်များ၏ အဆင့် ၃ ခု

စာသားကို မိန့်အဖြစ် ပြောင်းလဲသည့် စနစ်များတွင် အများအားဖြင့် အဆင့် ၃ ခုရှိသည်-

  • စာသားခွဲခြားခြင်း
  • ဘာသာစကားဆိုင်ရာ ခွဲခြားခြင်း
  • အသံလှိုင်းဖွဲ့စည်းခြင်း

စာသားခွဲခြားခြင်း

စာသားခွဲခြားခြင်းသည် ပေးထားသော စာသားကို ယူပြီး၊ မိန့်ဖန်တီးရန် အသုံးပြုနိုင်သော စကားလုံးများအဖြစ် ပြောင်းလဲခြင်းဖြစ်သည်။ ဥပမာအားဖြင့် "Hello world" ကို ပြောင်းလဲပါက စာသားခွဲခြားရန် မလိုအပ်ပါ၊ စကားလုံး ၂ ခုကို မိန့်အဖြစ် ပြောင်းလဲနိုင်သည်။ "1234" ကို ပြောင်းလဲပါက၊ ၎င်းကို "တစ်ထောင် နှစ်ရာ သုံးဆယ်လေး" သို့မဟုတ် "တစ်၊ နှစ်၊ သုံး၊ လေး" အဖြစ် ပြောင်းလဲရန် လိုအပ်နိုင်သည်။ ၎င်းသည် အကြောင်းအရာပေါ်မူတည်သည်။ "I have 1234 apples" ဆိုပါက "တစ်ထောင် နှစ်ရာ သုံးဆယ်လေး" ဖြစ်သင့်သည်။ "The child counted 1234" ဆိုပါက "တစ်၊ နှစ်၊ သုံး၊ လေး" ဖြစ်သင့်သည်။

စကားလုံးများသည် ဘာသာစကားနှင့် ၎င်း၏ ဒေသအလိုက် ကွဲပြားနိုင်သည်။ ဥပမာအားဖြင့် အမေရိကန်အင်္ဂလိပ်တွင် 120 ကို "One hundred twenty" ဟုခေါ်သည်။ ဗြိတိသျှအင်္ဂလိပ်တွင် "One hundred and twenty" ဟုခေါ်သည်။ "and" ကို ရာဂဏန်းများအပြီးတွင် အသုံးပြုသည်။

အခြားသော စကားလုံးများကို စာသားခွဲခြားရန် လိုအပ်နိုင်သည်။ ဥပမာအားဖြင့် "in" ကို လက်မအတိုင်းအတာအဖြစ်၊ "st" ကို သန့်ရှင်းသောသူ သို့မဟုတ် လမ်းအတိုင်းအတာအဖြစ် အသုံးပြုနိုင်သည်။ သင့်ဘာသာစကားတွင် အကြောင်းအရာမရှိလျှင် မရေရာသော စကားလုံးများကို တွေးပါ။

စကားလုံးများကို သတ်မှတ်ပြီးပါက၊ ၎င်းတို့ကို ဘာသာစကားဆိုင်ရာ ခွဲခြားမှုအတွက် ပို့ပါမည်။

ဘာသာစကားဆိုင်ရာ ခွဲခြားခြင်း

ဘာသာစကားဆိုင်ရာ ခွဲခြားမှုသည် စကားလုံးများကို phonemes အဖြစ် ခွဲခြားသည်။ Phonemes များသည် အသုံးပြုသော အက္ခရာများသာမက၊ စကားလုံးတွင်ပါဝင်သော အခြားအက္ခရာများအပေါ်မူတည်သည်။ ဥပမာအားဖြင့် အင်္ဂလိပ်တွင် "car" နှင့် "care" တွင် 'a' အသံသည် ကွဲပြားသည်။ အင်္ဂလိပ်ဘာသာစကားတွင် အက္ခရာ ၂၆ ခုအတွက် phonemes ၄၄ ခုရှိသည်။ အချို့သည် အခြားအက္ခရာများနှင့်မျှဝေထားသည်။ ဥပမာအားဖြင့် "circle" နှင့် "serpent" တွင် အစမှာ တူညီသော phoneme ကို အသုံးပြုသည်။

သင်၏ဘာသာစကားအတွက် phonemes များကို ရှာဖွေပါ။

Phonemes များကို ဖန်တီးပြီးပါက၊ ၎င်းတို့ကို အကြောင်းအရာအပေါ်မူတည်၍ အသံအလေးအနက်၊ အသံအချိန်ကို ချိန်ညှိရန် ထပ်ဆောင်းဒေတာလိုအပ်သည်။ ဥပမာအားဖြင့် အင်္ဂလိပ်တွင် အသံအမြင့်တက်ခြင်းကို စာကြောင်းကို မေးခွန်းအဖြစ် ပြောင်းလဲရန် အသုံးပြုနိုင်သည်။ နောက်ဆုံးစကားလုံးအတွက် အသံအမြင့်တက်ခြင်းသည် မေးခွန်းကို ရည်ညွှန်းသည်။

ဥပမာ- "You have an apple" ဆိုသော စာကြောင်းသည် သင်သည် ပန်းသီးတစ်လုံးရှိသည်ဟု ဆိုလိုသည်။ အသံအမြင့်တက်ပါက၊ "You have an apple?" ဆိုသော မေးခွန်းဖြစ်သည်။ ဘာသာစကားဆိုင်ရာ ခွဲခြားမှုသည် မေးခွန်းအမှတ်ကို အသုံးပြု၍ အသံအမြင့်တက်ရန် ဆုံးဖြတ်ရမည်။

Phonemes များကို ဖန်တီးပြီးပါက၊ ၎င်းတို့ကို အသံလှိုင်းဖွဲ့စည်းမှုအတွက် ပို့ပါမည်။

အသံလှိုင်းဖွဲ့စည်းခြင်း

ပထမဆုံး အီလက်ထရွန်နစ် စာသားမှ မိန့်ပြောင်းစနစ်များသည် phonemes တစ်ခုစီအတွက် အသံမှတ်တမ်းတစ်ခုစီကို အသုံးပြုခဲ့သည်။ ၎င်းသည် တော်တော်လေး တိရစ္ဆာန်ဆန်သော အသံများကို ဖြစ်စေခဲ့သည်။ ဘာသာစကားဆိုင်ရာ ခွဲခြားမှုသည် phonemes များကို ဖန်တီးပြီး၊ ၎င်းတို့ကို အသံမှတ်တမ်းများမှ တင်ပြီး၊ အသံကို ဖန်တီးရန် ပေါင်းစည်းခဲ့သည်။

သုတေသနလုပ်ပါ- စောင့်ရှောက်မှုစနစ်များ၏ စောင့်ရှောက်မှုအသံမှတ်တမ်းများကို ရှာဖွေပါ။ အခေတ်သစ် စောင့်ရှောက်မှုအသံများနှင့် နှိုင်းယှဉ်ကြည့်ပါ။

နောက်ဆုံးပေါ် အသံလှိုင်းဖွဲ့စည်းမှုသည် ML မော်ဒယ်များကို အသုံးပြု၍ လူသားများနှင့် မကွဲမပြားသော အသံများကို ဖန်တီးသည်။ ၎င်းသည် လူသားများ၏ ဦးနှောက်တွင်ရှိသော နယူးရွန်များနှင့် ဆင်တူသော နယူးရွန်ကွန်ယက်များကို အသုံးပြုသည်။

💁 ML မော်ဒယ်များသည် transfer learning ကို အသုံးပြု၍ လူသားများ၏ အသံများနှင့် ဆင်တူသော အသံများကို ပြန်လည်လေ့ကျင့်နိုင်သည်။ ၎င်းသည် အသံကို လုံခြုံရေးစနစ်အဖြစ် အသုံးပြုခြင်းသည် မသင့်တော်တော့သည်ကို ဆိုလိုသည်။ သင့်အသံမှတ်တမ်းကို မိနစ်အနည်းငယ်သာ ရှိပါက၊ သင့်ကို အတုယူနိုင်သည်။

ML မော်ဒယ်ကြီးများသည် အဆင့် ၃ ခုအား အဆုံးမှ အဆုံးသို့ မိန့်ပြောင်းစနစ်များအဖြစ် ပေါင်းစည်းရန် လေ့ကျင့်နေသည်။

အချိန်ကို သတ်မှတ်ခြင်း

အချိန်ကို သတ်မှတ်ရန်၊ သင့် IoT ကိရိယာသည် သင့် serverless code ကို အသုံးပြု၍ ဖန်တီးထားသော REST endpoint ကို ခေါ်ရန် လိုအပ်ပြီး၊ ရလဒ်အဖြစ် seconds အရေအတွက်ကို အသုံးပြု၍ အချိန်တစ်ခုကို သတ်မှတ်ရမည်။

လုပ်ငန်း- serverless function ကို ခေါ်ပြီး အချိန်ကို သတ်မှတ်ပါ

သင့် IoT ကိရိယာမှ REST endpoint ကို ခေါ်ပြီး လိုအပ်သော အချိန်အတွက် အချိန်တစ်ခုကို သတ်မှတ်ရန် သင့်အတွက် သင့် guide ကို လိုက်နာပါ-

စာသားကို မိန့်အဖြစ် ပြောင်းခြင်း

သင်သည် စကားလုံးကို စာသားအဖြစ် ပြောင်းလဲရန် အသုံးပြုခဲ့သော speech service ကို ပြန်လည်အသုံးပြု၍ စာသားကို မိန့်အဖြစ် ပြောင်းလဲနိုင်ပြီး၊ ၎င်းကို သင့် IoT ကိရိယာပေါ်ရှိ စပီကာမှ ပြန်လည်ဖွင့်နိုင်သည်။ ပြောင်းလဲရန် စာသားကို speech service သို့ ပို့ပြီး၊ အသံအမျိုးအစား (ဥပမာ- sample rate) နှင့် binary data ကို ပြန်လည်ရရှိသည်။

ဤတောင်းဆိုမှုကို ပေးပို့သောအခါ၊ သင်သည် Speech Synthesis Markup Language (SSML) ကို အသုံးပြုသည်။ SSML သည် speech synthesis application များအတွက် XML-based markup language ဖြစ်သည်။ ၎င်းသည် ပြောင်းလဲရန် စာသား၊ စာသား၏ ဘာသာစကား၊ အသံနှင့် အသံအမြန်နှုန်း၊ အသံအတိုးအကျယ်၊ အသံအမြင့်ကို သတ်မှတ်နိုင်သည်။

ဥပမာအားဖြင့်၊ SSML သည် "Your 3 minute 5 second time has been set" စာသားကို British English အသံ en-GB-MiaNeural အသုံးပြု၍ မိန့်အဖြစ် ပြောင်းရန် တောင်းဆိုမှုကို သတ်မှတ်သည်။

<speak version='1.0' xml:lang='en-GB'>
    <voice xml:lang='en-GB' name='en-GB-MiaNeural'>
        Your 3 minute 5 second time has been set
    </voice>
</speak>

💁 စာသားမှ မိန့်ပြောင်းစနစ်များတွင် ဘာသာစကားအမျိုးမျိုးအတွက် အသံများစွာရှိပြီး၊ British English အသံနှင့် အင်္ဂလိပ်အဆင့်အတန်း၊ New Zealand English အသံနှင့် New Zealand အဆင့်အတန်းတို့ကို ရှိသည်။

လုပ်ငန်း- စာသားကို မိန့်အဖြစ် ပြောင်းပါ

သင့် IoT ကိရိယာကို အသုံးပြု၍ စာသားကို မိန့်အဖြစ် ပြောင်းရန် သင့် guide ကို လိုက်နာပါ-


🚀 စိန်ခေါ်မှု

SSML တွင် စကားလုံးများကို ပြောဆိုပုံကို ပြောင်းလဲနိုင်သော နည်းလမ်းများရှိသည်။ ဥပမာ- စကားလုံးများကို အလေးအနက်ပေးခြင်း၊ ခေတ္တရပ်ခြင်း သို့မဟုတ် အသံအမြင့်ကို ပြောင်းလဲခြင်း။ SSML များကို သင့် IoT ကိရိယာမှ ပေးပို့ပြီး၊ output ကို နှိုင်းယှဉ်ကြည့်ပါ။ SSML နှင့် စကားလုံးများကို ပြောဆိုပုံကို ပြောင်းလဲနည်းများအကြောင်းကို Speech Synthesis Markup Language (SSML) Version 1.1 specification from the World Wide Web consortium တွင် ဖတ်ရှုနိုင်သည်။

သင်ခန်းစာပြီးဆုံးသော မေးခွန်းများ

သင်ခန်းစာပြီးဆုံးသော မေးခွန်းများ

ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာခြင်း

လုပ်ငန်း

အချိန်ကို ဖျက်ပါ


အကြောင်းကြားချက်:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု Co-op Translator ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မတိကျမှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာတရ အရင်းအမြစ်အဖြစ် ရှုလေ့လာသင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ ပရော်ဖက်ရှင်နယ် ဘာသာပြန်မှုကို အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအလွတ်များ သို့မဟုတ် အနားလွဲမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။