You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
IoT-For-Beginners/translations/tl/6-consumer/lessons/4-multiple-language-support
co-op-translator[bot] 06c38d0df9
🌐 Update translations via Co-op Translator (#551)
3 weeks ago
..
README.md 🌐 Update translations via Co-op Translator (#551) 3 weeks ago
assignment.md 🌐 Update translations via Co-op Translator (#551) 3 weeks ago
pi-translate-speech.md 🌐 Update translations via Co-op Translator (#551) 3 weeks ago
virtual-device-translate-speech.md 🌐 Update translations via Co-op Translator (#551) 3 weeks ago
wio-terminal-translate-speech.md 🌐 Update translations via Co-op Translator (#551) 3 weeks ago

README.md

Suportahan ang Maraming Wika

Isang sketchnote na buod ng araling ito

Sketchnote ni Nitya Narasimhan. I-click ang imahe para sa mas malaking bersyon.

Ang video na ito ay nagbibigay ng buod ng Azure speech services, kabilang ang speech to text at text to speech mula sa mga naunang aralin, pati na rin ang pagsasalin ng pananalita, na tatalakayin sa araling ito:

Pagkilala sa pananalita gamit ang ilang linya ng Python mula sa Microsoft Build 2020

🎥 I-click ang imahe sa itaas upang panoorin ang video

Pre-lecture quiz

Pre-lecture quiz

Panimula

Sa huling 3 aralin, natutunan mo ang tungkol sa pag-convert ng pananalita sa teksto, pag-unawa sa wika, at pag-convert ng teksto sa pananalita, lahat ay pinapagana ng AI. Isa pang aspeto ng komunikasyon ng tao na maaaring tulungan ng AI ay ang pagsasalin ng wika - pag-convert mula sa isang wika patungo sa iba, tulad ng mula Ingles patungong Pranses.

Sa araling ito, matututo ka tungkol sa paggamit ng AI upang magsalin ng teksto, na nagbibigay-daan sa iyong smart timer na makipag-ugnayan sa mga gumagamit sa iba't ibang wika.

Sa araling ito, tatalakayin natin ang:

🗑 Ito ang huling aralin sa proyektong ito, kaya pagkatapos makumpleto ang araling ito at ang takdang-aralin, huwag kalimutang linisin ang iyong mga cloud services. Kakailanganin mo ang mga serbisyo upang makumpleto ang takdang-aralin, kaya tiyaking tapusin muna iyon.

Sumangguni sa gabay sa paglilinis ng iyong proyekto kung kinakailangan para sa mga tagubilin kung paano ito gawin.

Pagsalin ng teksto

Ang pagsasalin ng teksto ay isang problema sa computer science na pinag-aaralan nang higit sa 70 taon, at ngayon lamang, salamat sa mga pag-unlad sa AI at computer power, malapit nang malutas sa puntong halos kasing husay na ng mga tagasalin ng tao.

💁 Ang mga pinagmulan nito ay maaaring masundan pa sa Al-Kindi, isang cryptographer na Arabe noong ika-9 na siglo na bumuo ng mga teknolohiya para sa pagsasalin ng wika.

Machine translations

Ang pagsasalin ng teksto ay nagsimula bilang isang teknolohiya na kilala bilang Machine Translation (MT), na maaaring magsalin sa pagitan ng iba't ibang pares ng wika. Gumagana ang MT sa pamamagitan ng pagpapalit ng mga salita sa isang wika patungo sa iba, gamit ang mga teknolohiya upang piliin ang tamang paraan ng pagsasalin ng mga parirala o bahagi ng mga pangungusap kapag ang simpleng salin ng salita-sa-salita ay hindi makatuwiran.

🎓 Kapag ang mga tagasalin ay sumusuporta sa pagsasalin sa pagitan ng isang wika at iba pa, ang mga ito ay kilala bilang language pairs. Ang iba't ibang mga tool ay sumusuporta sa iba't ibang mga pares ng wika, at maaaring hindi ito kumpleto. Halimbawa, maaaring suportahan ng isang tagasalin ang Ingles patungong Espanyol bilang isang pares ng wika, at Espanyol patungong Italyano bilang isa pang pares, ngunit hindi Ingles patungong Italyano.

Halimbawa, ang pagsasalin ng "Hello world" mula Ingles patungong Pranses ay maaaring gawin sa pamamagitan ng pagpapalit - "Bonjour" para sa "Hello", at "le monde" para sa "world", na nagreresulta sa tamang salin na "Bonjour le monde".

Hindi gumagana ang mga pagpapalit kapag ang iba't ibang wika ay gumagamit ng iba't ibang paraan ng pagsasabi ng parehong bagay. Halimbawa, ang pangungusap sa Ingles na "My name is Jim", ay isinasalin sa "Je m'appelle Jim" sa Pranses - literal na "I call myself Jim". Ang "Je" ay Pranses para sa "I", ang "moi" ay "me", ngunit pinagsama sa pandiwa dahil nagsisimula ito sa patinig, kaya nagiging "m'", ang "appelle" ay "to call", at ang "Jim" ay hindi isinasalin dahil ito ay isang pangalan, at hindi isang salitang maaaring isalin. Ang pagkakasunod-sunod ng mga salita ay nagiging isyu rin - ang simpleng pagpapalit ng "Je m'appelle Jim" ay nagiging "I myself call Jim", na may ibang pagkakasunod-sunod ng mga salita kumpara sa Ingles.

💁 Ang ilang mga salita ay hindi kailanman isinasalin - ang pangalan ko ay Jim anuman ang wika na ginagamit upang ipakilala ako. Kapag nagsasalin sa mga wikang gumagamit ng iba't ibang alpabeto, o gumagamit ng iba't ibang mga letra para sa iba't ibang tunog, ang mga salita ay maaaring transliterated, ibig sabihin ay pumipili ng mga letra o karakter na nagbibigay ng tamang tunog upang magtunog katulad ng ibinigay na salita.

Ang mga idyoma ay isa ring problema sa pagsasalin. Ang mga ito ay mga parirala na may naiintindihang kahulugan na iba sa direktang interpretasyon ng mga salita. Halimbawa, sa Ingles ang idyoma na "I've got ants in my pants" ay hindi literal na tumutukoy sa pagkakaroon ng mga langgam sa iyong damit, ngunit sa pagiging balisa. Kung isasalin mo ito sa Aleman, malilito ang tagapakinig, dahil ang bersyon sa Aleman ay "I have bumble bees in the bottom".

💁 Ang iba't ibang mga lokalidad ay nagdadagdag ng iba't ibang mga komplikasyon. Sa idyoma na "ants in your pants", sa American English ang "pants" ay tumutukoy sa panlabas na kasuotan, sa British English, ang "pants" ay panloob na kasuotan.

Kung marunong kang magsalita ng maraming wika, mag-isip ng ilang mga parirala na hindi direktang maisasalin.

Ang mga sistema ng machine translation ay umaasa sa malalaking database ng mga patakaran na naglalarawan kung paano isalin ang ilang mga parirala at idyoma, kasama ang mga pamamaraang estadistikal upang piliin ang naaangkop na mga pagsasalin mula sa mga posibleng opsyon. Ang mga pamamaraang estadistikal na ito ay gumagamit ng malalaking database ng mga gawaing isinalin ng tao sa maraming wika upang piliin ang pinaka-malamang na pagsasalin, isang teknolohiyang tinatawag na statistical machine translation. Ang ilan sa mga ito ay gumagamit ng intermediate na representasyon ng wika, na nagpapahintulot sa isang wika na isalin sa intermediate, pagkatapos mula sa intermediate patungo sa isa pang wika. Sa ganitong paraan, ang pagdaragdag ng higit pang mga wika ay nagsasangkot ng mga pagsasalin sa at mula sa intermediate, hindi sa at mula sa lahat ng iba pang mga wika.

Neural translations

Ang neural translations ay gumagamit ng kapangyarihan ng AI upang magsalin, karaniwang isinasalin ang buong pangungusap gamit ang isang modelo. Ang mga modelong ito ay sinasanay sa malalaking dataset na isinalin ng tao, tulad ng mga web page, libro, at dokumentasyon ng United Nations.

Ang mga neural translation model ay karaniwang mas maliit kaysa sa mga machine translation model dahil hindi na kailangan ng malalaking database ng mga parirala at idyoma. Ang mga modernong AI service na nagbibigay ng pagsasalin ay madalas na naghahalo ng maraming teknolohiya, pinaghalo ang statistical machine translation at neural translation.

Walang 1:1 na pagsasalin para sa anumang pares ng wika. Ang iba't ibang mga modelo ng pagsasalin ay magbibigay ng bahagyang magkakaibang mga resulta depende sa data na ginamit upang sanayin ang modelo. Ang mga pagsasalin ay hindi palaging simetriko - ibig sabihin, kung isasalin mo ang isang pangungusap mula sa isang wika patungo sa isa pa, pagkatapos ay pabalik sa unang wika, maaaring makakita ka ng bahagyang naiibang pangungusap bilang resulta.

Subukan ang iba't ibang online translator tulad ng Bing Translate, Google Translate, o ang Apple translate app. Ihambing ang mga isinaling bersyon ng ilang mga pangungusap. Subukan din ang pagsasalin sa isa, pagkatapos ay pagsasalin pabalik sa isa pa.

Mga serbisyo ng pagsasalin

Mayroong ilang mga AI service na maaaring gamitin mula sa iyong mga aplikasyon upang magsalin ng pananalita at teksto.

Cognitive services Speech service

Ang logo ng speech service

Ang speech service na ginamit mo sa mga nakaraang aralin ay may kakayahan sa pagsasalin para sa pagkilala sa pananalita. Kapag kinikilala mo ang pananalita, maaari kang humiling hindi lamang ng teksto ng pananalita sa parehong wika, kundi pati na rin sa iba pang mga wika.

💁 Available lamang ito mula sa speech SDK, ang REST API ay walang built-in na pagsasalin.

Cognitive services Translator service

Ang logo ng translator service

Ang Translator service ay isang dedikadong serbisyo ng pagsasalin na maaaring magsalin ng teksto mula sa isang wika patungo sa isa o higit pang target na wika. Bukod sa pagsasalin, sinusuportahan nito ang malawak na hanay ng mga karagdagang tampok kabilang ang masking ng mga malaswang salita. Pinapayagan ka rin nitong magbigay ng partikular na pagsasalin para sa isang partikular na salita o pangungusap, upang gumana sa mga terminong ayaw mong isalin, o may partikular na kilalang pagsasalin.

Halimbawa, kapag isinasalin ang pangungusap na "I have a Raspberry Pi", na tumutukoy sa single-board computer, sa ibang wika tulad ng Pranses, nais mong panatilihin ang pangalan na "Raspberry Pi" na hindi isinalin, na nagbibigay ng "Jai un Raspberry Pi" sa halip na "Jai une pi aux framboises".

Lumikha ng translator resource

Para sa araling ito, kakailanganin mo ng Translator resource. Gagamitin mo ang REST API upang magsalin ng teksto.

Gawain - lumikha ng translator resource

  1. Mula sa iyong terminal o command prompt, patakbuhin ang sumusunod na utos upang lumikha ng translator resource sa iyong smart-timer resource group.

    az cognitiveservices account create --name smart-timer-translator \
                                        --resource-group smart-timer \
                                        --kind TextTranslation \
                                        --sku F0 \
                                        --yes \
                                        --location <location>
    

    Palitan ang <location> ng lokasyon na ginamit mo noong nilikha ang Resource Group.

  2. Kunin ang key para sa translator service:

    az cognitiveservices account keys list --name smart-timer-translator \
                                           --resource-group smart-timer \
                                           --output table
    

    Kopyahin ang isa sa mga key.

Suportahan ang maraming wika sa mga aplikasyon gamit ang pagsasalin

Sa isang perpektong mundo, ang buong aplikasyon mo ay dapat makaunawa ng maraming iba't ibang wika hangga't maaari, mula sa pakikinig ng pananalita, sa pag-unawa sa wika, hanggang sa pagtugon gamit ang pananalita. Ito ay maraming trabaho, kaya ang mga serbisyo ng pagsasalin ay maaaring pabilisin ang oras ng pag-develop ng iyong aplikasyon.

Isang arkitektura ng smart timer na nagsasalin ng Japanese patungong English, pinoproseso sa English, pagkatapos ay isinasalin pabalik sa Japanese

Isipin na gumagawa ka ng isang smart timer na gumagamit ng Ingles mula simula hanggang dulo, nauunawaan ang sinasalitang Ingles at kino-convert ito sa teksto, pinapatakbo ang pag-unawa sa wika sa Ingles, bumubuo ng mga tugon sa Ingles, at tumutugon gamit ang sinasalitang Ingles. Kung nais mong magdagdag ng suporta para sa Japanese, maaari kang magsimula sa pagsasalin ng sinasalitang Japanese patungong English text, pagkatapos ay panatilihin ang core ng aplikasyon na pareho, pagkatapos ay isalin ang response text sa Japanese bago ito bigkasin. Papayagan ka nitong mabilis na magdagdag ng suporta para sa Japanese, at maaari kang magpalawak upang magbigay ng buong end-to-end na suporta para sa Japanese sa hinaharap.

💁 Ang downside ng pag-asa sa machine translation ay ang iba't ibang wika at kultura ay may iba't ibang paraan ng pagsasabi ng parehong bagay, kaya ang pagsasalin ay maaaring hindi tumugma sa ekspresyon na inaasahan mo.

Ang mga machine translation ay nagbubukas din ng mga posibilidad para sa mga app at device na maaaring magsalin ng nilikha ng user habang ito ay ginagawa. Ang science fiction ay regular na nagtatampok ng 'universal translators', mga device na maaaring magsalin mula sa mga alien na wika patungo sa (karaniwang) American English. Ang mga device na ito ay hindi na science fiction, kundi science fact, kung hindi mo isasama ang bahagi tungkol sa alien. Mayroon nang mga app at device na nagbibigay ng real-time na pagsasalin ng pananalita at nakasulat na teksto, gamit ang mga kombinasyon ng speech at translation services.

Isang halimbawa ay ang Microsoft Translator mobile phone app, na ipinakita sa video na ito:

Microsoft Translator live feature in action

🎥 I-click ang imahe sa itaas upang panoorin ang video

Isipin na may ganitong device na magagamit mo, lalo na kapag naglalakbay o nakikipag-ugnayan sa mga tao na ang wika ay hindi mo alam. Ang pagkakaroon ng mga awtomatikong translation device sa mga paliparan o ospital ay magbibigay ng kinakailangang mga pagpapabuti sa accessibility.

Magsaliksik: Mayroon bang mga translation IoT device na komersyal na magagamit? Paano naman ang mga kakayahan sa pagsasalin na naka-built-in sa mga smart device?

👽 Bagaman walang tunay na universal translators na nagpapahintulot sa atin na makipag-usap sa mga alien, ang Microsoft translator ay sumusuporta sa Klingon. Qapla!

Magsalin ng teksto gamit ang AI service

Maaari mong gamitin ang AI service upang idagdag ang kakayahan sa pagsasalin na ito sa iyong smart timer.

Gawain - magsalin ng teksto gamit ang AI service

Sundin ang kaukulang gabay upang magsalin ng teksto sa iyong IoT device:


🚀 Hamon

Paano makikinabang ang machine translations sa iba pang IoT applications bukod sa mga smart device? Mag-isip ng iba't ibang paraan kung paano makakatulong ang mga pagsasalin, hindi lamang sa sinasalitang salita kundi pati na rin sa teksto.

Post-lecture quiz

Post-lecture quiz

Review at Pag-aaral sa Sarili

Takdang-Aralin

Build a universal translator


Paunawa:
Ang dokumentong ito ay isinalin gamit ang AI translation service na Co-op Translator. Bagama't sinisikap naming maging tumpak, tandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatugma. Ang orihinal na dokumento sa kanyang katutubong wika ang dapat ituring na opisyal na sanggunian. Para sa mahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na dulot ng paggamit ng pagsasaling ito.