Miten kissan puheen kääntämissovellukset toimivat?

Miten kissan puheen kääntämissovellukset toimivat?

Olet todennäköisesti nähnyt sovelluksia, joiden väitetään kääntävän kissasi sanoman. Mutta osaavatko he todella kääntää kissasi miau englanniksi? Lyhyt vastaus on kyllä, tavallaan. Se on vaikeaa, koska jokaisen kissan 'kieli' on ainutlaatuinen, mutta ne voivat päästä melko lähelle nykyaikaista tekniikkaa.





Kissan kääntämissovellukset, kuten MeowTalk, käyttävät puheentunnistusmuotoa, joka korostaa koneoppimista. Katsotaanpa tarkemmin.





Puheentunnistus ja koneoppiminen

Mary Theresa McLean/ Pixabay





Puheentunnistus toimii tallentamalla puhetta ja muuttamalla ääni digitaaliseksi datatiedostoksi. Se koodaa tietoja, kuten äänenkorkeuden ja äänenvoimakkuuden, datapisteiksi, joita sovellus voi analysoida ja yhdistää merkityksiin. DPA -mikrofonit selittää, että nämä datapisteet voivat näyttää hyvin erilaisilta riippuen taustaäänistä ja sanan puhumisesta.

Pidämme joskus äänentunnistusta itsestäänselvyytenä, mutta se on uskomatonta tekniikan saavutusta. Varsinkin kun otetaan huomioon kuinka monimutkainen ihmisen puhe on. Kuten Tiedemies selittää, jokainen sana sisältää laajan valikoiman ääniä tai 'foneemeja' sekoitettuna toisiinsa. Tietokoneen saaminen ymmärtämään puhetta on erittäin vaikeaa. Kissanäänien uusi raja on vieläkin vaikeampi.



Puheentunnistusta käyttävät sovellukset on ohjelmoitu sanastoon, jota kutsutaan tietojoukoksi. Sovellus sitten sovittaa puheesi datasanaston lähimpään vaihtoehtoon.

Kun se tekee virheen, korjaat sen ja se tallentaa tiedot seuraavaa kertaa varten. Tämä on osa koneoppimista. Näin ohjelma oppii tunnistamaan puheen, vaikka se ei olisi sama kuin tietojoukko, jolla se aloitti.





Aiheeseen liittyviä: Mitä ovat koneoppimisalgoritmit? Näin ne toimivat

Puheentunnistuksessa on edelleen ongelmia, erityisesti puhevaikeuksien ja aksenttien kanssa. Jotkut yritykset parantavat kuitenkin koneoppimista näiden ongelmien ratkaisemiseksi. Koneoppiminen voi ajan myötä muuttaa puheentunnistuksen tehokkaaksi työkaluksi.





kuinka tarkistaa, millainen emolevy minulla on

Näin puheentunnistus toimii ihmisille. Mutta toimiiko se kissoilla?

Puheentunnistus vs. Miau -tunnistus

Ariana Suarez / Poista roiskeet

Ensinnäkin meidän on ymmärrettävä, miksi tietynlaisen meow'n kääntäminen 'olen nälkäinen' eroaa ihmisen puheen analysoinnista. Ongelma on lähinnä siinä, että kissan kommunikointi perustuu enemmän sanattomiin vihjeisiin, kuten asentoon. Toinen ongelma on universaalin 'kissan kielen' puuttuminen.

Mukaan ASPCA , aikuiset luonnonvaraiset kissat eivät koskaan meow toisiaan, vain ihmisiä. Muita tutkimuksia Humane Society lisää, että nämä äänet 'eivät esiinny tyhjiössä'. Meidän on tulkittava niitä kehonkielen ja muiden yhteyksien rinnalla. Monissa tapauksissa nämä hiljaiset signaalit ovat ainoa ero miau, joka tarkoittaa 'olen nälkäinen', ja sen välillä, joka tarkoittaa 'haluan pelata'.

Tämän ongelman lisäksi kahdella kissalla ei ole samaa kieltä. Kissat kehittävät omistajilleen henkilökohtaisia ​​'kieliä'. Ne perustuvat osittain omistajan äänen jäljittelyyn ja osittain kissan persoonallisuuteen. Kaksi kissaa ei kuulosta samalta, vaikka ne välittäisivät saman tarpeen tai tarpeen. Joten kuinka yhden sovelluksen puhesanasto voidaan kääntää kaikille?

Joustava koneoppiminen kissoille

Vapaa käyttää ääniä/ Poista roiskeet

Vaikka muutamat virtuaaliset avustajat pitävät Auto yrittää ymmärtää sävyä ja tunteita, puheentunnistus on edelleen kauheaa sanattomissa signaaleissa. Mutta se ei tarkoita, että niitä on mahdotonta tulkita.

kuinka puhdistaa ps4 -tuuletin irrottamatta sitä

MeowTalk käyttää joustavampaa koneoppimista näiden ongelmien ratkaisemiseksi.

Ladata: MeowTalk for Android | ios (Vapaa)

Meowtalkin loi Javier Sanchez, joka työskenteli myös Alexa -tiimissä. Hän kuvitteli sovelluksen askeleeksi kohti älykkäitä kauluksia. Nämä kaulukset kääntäisivät kissan äänet ihmisen puheeksi hyödyntäen monimutkaisia ​​koneoppimisstrategioita auttaakseen ihmisiä ymmärtämään ja hoitamaan kissojaan paremmin.

MeowTalk -tiimi kompensoi ainutlaatuisuusongelmat luomalla jokaiselle kissalle tarkempia profiileja. Sovelluksessa rekisteröit jokaisen kissan erikseen. Tiede Norja raportoi, että pennut miauavat eri tavalla kuin aikuiset kissat, joten sovellus pyytää myös kissan syntymäpäivää. Jokainen profiili luo kissalle ainutlaatuisen tietoverkon, joka sisältää hieman syvää oppimista koneoppimiseen.

Aiheeseen liittyviä: Syväoppiminen vs. koneoppiminen vs. tekoäly: miten ne menevät yhteen?

Sanastoa varten MeowTalk alkaa 10 ääniprofiililla tietojoukossaan. Jokaisella on erilainen merkitys, kuten 'onnellinen' tai 'metsästys'. Kun sovellus kuulee äänen ja saa sen väärin, voit joko korjata sen tai luoda uuden tulkinnan.

CATSOUNDS -tiedot kerätty Akvelon

Korjaus kehottaa sovellusta korvaamaan perussanaston uudella äänellä.

tiedosto tai kansio on auki toisessa ohjelmassa

Voit esimerkiksi kertoa sovellukselle, että se sovittaa 'Metsästys' lyhyisiin piippauksiin pitkän nyytin sijasta. Tällainen korjaus on hyödyllisempi kuin lisätä useita ääniä, jotka vastaavat yhtä puheentunnistuksen tapaa, mikä olisi kuin kertoisi sovellukselle, että pitkä nyyhkytys ja lyhyet piippaukset molemmat tarkoittaa 'Äiti Soita'.

Koneoppiminen puheentunnistussovelluksissa yleensä vastustaa tämän tyyppistä korvaamista. Se olisi kuin yrittäisi opettaa Sirille, että kun sanot 'teknologiablogi', tarkoitat todella 'päärynä'. Mutta MeowTalkin käyttämä joustavampi koneoppimismuoto voi käsitellä tätä korjausta helpommin.

Uuden tulkinnan luominen lisää merkityksen, jota ei ollut aiemmin koodattu. Jos kissallasi on esimerkiksi tietty puhelu, kun hän haluaa lempilelunsa, voit lisätä vaihtoehdon 'Haluan hiiren'. Se on samanlainen kuin sanan lisääminen automaattisen korjauksen sanakirjaasi.

Aiheeseen liittyviä: Kuinka määritellä omat automaattisen korjauksen sanat Androidissa

Ajan myötä voit kehittää kissallesi erittäin henkilökohtaisen puheprofiilin. Lopulta se saattaa jopa olla riittävän hienostunut ollakseen hyödyllinen lemmikkieläinten hoitajille tai käyttäytymisongelmien ratkaisemiseksi. Jos ei muuta, se auttaa kissanomistajia tulemaan tarkkaavaisemmiksi lemmikkejään.

Tuomio: toimivatko kissan kääntämissovellukset?

Lopulta 'kissan kääntäminen' riippuu edelleen paljon siitä, että käyttäjä opettaa sovellukselle, miten kissa puhuu. Näin on todennäköisesti aina, koska kunkin kissan viestintä on ainutlaatuista.

Mutta se tosiasia, että koneoppiminen on tullut niin pitkälle, että kehittäjät voivat jopa osittain onnistua tässä, on uskomatonta. Koneoppiminen ja tekoäly etenevät hurjaa vauhtia, emmekä malta odottaa, mihin he jatkavat.

Jaa Jaa Tweet Sähköposti Liittyvät aiheet
  • Tekniikka selitetty
  • Kielten oppiminen
  • Koneoppiminen
Kirjailijasta Natalie Stewart(47 artikkelia julkaistu)

Natalie Stewart on MakeUseOfin kirjoittaja. Hän kiinnostui tekniikasta ensin yliopistossa ja innostui median kirjoittamisesta yliopistossa. Natalie keskittyy helppokäyttöiseen ja helppokäyttöiseen tekniikkaan, ja hän rakastaa sovelluksia ja laitteita, jotka helpottavat jokapäiväisten ihmisten elämää.

Lisää Natalie Stewartilta

tilaa uutiskirjeemme

Liity uutiskirjeeseemme saadaksesi teknisiä vinkkejä, arvosteluja, ilmaisia ​​e -kirjoja ja ainutlaatuisia tarjouksia!

Klikkaa tästä tilataksesi