OpenAI antaa ChatGPT:lle äänen vastata kehotteisiin ja komentoihin

Kaltaisesi lukijat auttavat tukemaan MUO:ta. Kun teet ostoksen käyttämällä sivustollamme olevia linkkejä, voimme ansaita kumppanipalkkion. Lue lisää.

ChatGPT:stä tulee interaktiivinen luova tekoälykokemus. OpenAI paljasti, että maailman johtava AI-chatbot pystyy puhumaan ja vastaamaan käyttäjien kyselyihin käyttämällä syntetisoitua, oletettavasti tekoälyn luomaa ääntä.

Uuden äänensä ohella ChatGPT pystyy myös vastaamaan ja keskustelemaan tiettyihin kuviin, jotka on ladattu siihen tai napsautettu käytettäessä ChatGPT Android- tai iOS-sovellusta. Kuvantunnistusominaisuus kuulostaa samanlaiselta kuin Google Lensissä ja muissa sovelluksissa, jotka käyttävät hermoverkkoja tietojen tunnistamiseen tarkasti.

Windows ei voinut automaattisesti tunnistaa tämän verkon välityspalvelinasetuksia google chrome

OpenAI antaa ChatGPT:lle äänen

25. syyskuuta 2023, ChatGPT-kehittäjä OpenAI paljastettiin se antaisi maailman johtavalle generatiiviselle AI-chatbotilleen äänen. ChatGPT-käyttäjät voivat puhua suoraan chatbotille ja pyytää sitä puhumaan takaisin, jolloin ChatGPT voi keskustella suoraan äänellä ensimmäistä kertaa.

OpenAI:n esimerkkileike sisältää naisen, joka pyytää ChatGPT:tä luomaan ainutlaatuisen iltasatun, johon ChatGPT vastaa asianmukaisesti naissyntetisoidulla äänellä.

Mukaan Langallinen , uusi tekstistä puheeksi -malli kehitettiin talon sisällä. Se voi luoda 'ihmisen kaltaista' ääntä tekstistä ja muutaman sekunnin näytepuheesta ( käyttämällä OpenAI Whisper -mallia ) ja puhua eri sävyillä ja tyyleillä. Löydät valikoiman ääninäytteitä osoitteesta OpenAI:n blogi .

Jotkut yritykset ovat jo ottaneet käyttöön OpenAI:n uuden äänimallin. Esimerkiksi Spotify käyttää OpenAI:n tekstistä puheeksi -mallia podcastien kääntämiseen eri kielille yhdistäen ChatGPT:n kielikäännöstaidon sen uuteen puhekykyyn.

kuinka ladata gif -kuvia instagramiin

ChatGPT:n uusi tekstistä puheeksi -malli on saatavilla vain Plus- ja Enterprise-tilaajille, jotka käyttävät virallisia Android- ja iOS-sovelluksia, ja sen odotetaan tulevan käyttöön seuraavien kahden viikon kuluessa (alkaen 25.9.2023). Lisäksi uusi ääniominaisuus on rajoitettu aluksi englanniksi, vaikka odotamme tämän muuttuvan nopeasti.

ChatGPT voi tunnistaa ja ottaa valokuvia

OpenAI:n ChatGPT-päivityksen toinen osa on kyky analysoida ja puhua työkaluun ladattuja kuvia. Visuaalisen kuvan analysointivaihtoehto esiteltiin GPT-4-päivitysvideoissa, mutta siitä ei ole keskusteltu paljon sen jälkeen ( ChatGPT-koodin tulkki sivuun ).

Nyt ChatGPT saa Google Lensin kaltaisia toimintoja. Voit ladata kuvan ChatGPT:hen tai ottaa valokuvan älypuhelimesi kameralla ChatGPT-sovelluksessa, ja se tarkentaa kuvaa ja lisää tarvittaessa kontekstia.

Sen kutsuminen 'samankaltaiseksi kuin Google Lens' tekee sen todellakin epäoikeudenmukaiseksi. Mahdollisuus keskustella kuvasta edestakaisin saadakseen lisää tietoa ja kontekstia tekee siitä erittäin hyödyllisen monenlaisissa asetuksissa. On kuitenkin tärkeää huomata pieni teksti, sillä OpenAI tekee selväksi, että se on rajoittanut ChatGPT:n 'kykyä analysoida ja antaa suoria lausuntoja ihmisistä' yksityisyyden ja tarkkuuden vuoksi. Voisiko OpenAI-käyttöinen 'Who Is This' -työkalu kuitenkin olla työn alla tulevaisuudessa? (Toivottavasti ei!)

Kuten uusi tekstistä puheeksi -malli, OpenAI ottaa kuvantunnistuksen käyttöön seuraavien kahden viikon aikana, vaikka se on saatavilla kaikille alustoille, ei vain ChatGPT-sovellukselle.

Yksityisyys, turvallisuus ja muut ongelmat

Puhekäyttöisen ChatGPT:n vaikutukset ovat jyrkät. Totta kai se on jännittävää. Mahdollisuus luoda yksilöllisesti syntetisoitu ääni käyttämällä vain lyhyttä katkelmaa esimerkkinä sisältää kuitenkin huomattavia tietosuoja- ja turvallisuusongelmia. Haitallisten toimijoiden mahdollisuus hyödyntää näitä työkaluja on valtava, ja kuten minkä tahansa generatiivisen AI-työkalun kanssa, kun henki on pullosta poistunut, se ei todellakaan palaa sisään. Mikään hallitusten tai ajatusjohtajien AI-sääntely ei voi kääntyä takaisin. vuorovesi.

mistä voin ladata ilmaisen e -kirjan

Jopa OpenAI:n varoitus aiheesta näyttää kiertävän itsestäänselvyyksiä, vaikka ongelmat mainitaan:

Näihin ominaisuuksiin liittyy kuitenkin myös uusia riskejä, kuten haitallisten toimijoiden mahdollisuus esiintyä julkisuuden henkilöinä tai tehdä petoksia. Tästä syystä käytämme tätä tekniikkaa tietyssä käyttötapauksessa – äänikeskustelussa.

Koska tämä on jäävuoren huippu, voit odottaa vastaiskua ChatGPT:n uutta ääntä vastaan, varsinkin kun epämiellyttävät otsikot, joissa väitetään, että ChatGPT:tä käytetään petokseen ja niin edelleen, kasvavat ennustettavasti.

OpenAI tekee ChatGPT:stä AI-sovelluksen

Mitä enemmän OpenAI lisää käyttäjäystävällisiä ominaisuuksia ChatGPT:hen, sitä enemmän siitä tulee luova tekoälysovellus. ChatGPT on ensimmäinen, joka saavutti laajan maineen alkuperäisen tekoälybuumin aikana, ja se on edelleen edelläkävijä ja ainoa sovellus, jota käytetään Google Bardin (ja mahdollisesti Google Geminin) ja Anthropic's Clauden kaltaisten kilpailijoiden kanssa.

Niin kauan kuin OpenAI voi jatkaa ChatGPT:n käytön helpottavien ominaisuuksien lisäämistä, se pitää ihmiset koukussa ja ajaa yhä lähemmäs tavoitettaan, todella multimodaalista tekoälytyökalua.