5 parasta avoimen lähdekoodin tekoälykuvageneraattoria

Pikalinkit

Värikynä

Vakaa diffuusio 1.5

DreamShaper

InvokeAI

Openjourney

Tekoälypohjaiset tekstistä kuvaksi -sukupolvimallit ovat kaikkialla, ja niitä on helpompi käyttää päivittäin. Vaikka on helppoa vierailla verkkosivustolla ja luoda etsimäsi kuva, avoimen lähdekoodin tekstistä kuvaksi -generaattorit ovat paras vaihtoehto, jos haluat hallita luomisprosessia paremmin.

PÄIVÄN VIDEON TEKEMINEN JATKA SISÄLLÖLLÄ VIERÄTÄ

Internetissä on saatavilla kymmeniä ilmaisia ja avoimen lähdekoodin tekoälyn tekstistä kuvaksi -generaattoreita, jotka ovat erikoistuneet tietyntyyppisiin kuviin. Joten olemme seuloneet kasan ja löytäneet parhaat avoimen lähdekoodin tekoälyn tekstistä kuvaksi generaattorit, joita voit kokeilla juuri nyt.

1 Värikynä

Craiyon on yksi helpoimmin saatavilla olevista avoimen lähdekoodin tekoälykuvageneraattoreista. Se perustuu DALL-E Miniin, ja vaikka voit kloonata sen Githubin arkisto ja asenna malli paikallisesti tietokoneellesi, Craiyon näyttää luopuneen tästä lähestymistavasta verkkosivustonsa hyväksi.

Virallista Githubin arkistoa ei ole päivitetty kesäkuun 2022 jälkeen, mutta uusin malli on edelleen saatavilla ilmaiseksi virallinen Craiyon-sivusto . Myöskään Android- tai iOS-sovelluksia ei ole.

Mitä tulee toimivuuteen, näet kaikki tavalliset vaihtoehdot, joita voit odottaa tekoälykuvageneraattorilta. Kun olet kirjoittanut kehotteen ja saanut kuvan, voit käyttää korkealuokkaista ominaisuutta saadaksesi korkeamman resoluution kopion. Valittavana on kolme tyyliä: taide, valokuva ja piirustus. Voit myös valita 'Ei mitään', jos haluat mallin ratkaisevan.

Lisäksi 'Expert Mode' -tilassa voit sisällyttää negatiivisia sanoja, mikä kehottaa mallia välttämään tiettyjä kohteita. Mukana on myös nopea ennakointiominaisuus, joka käyttää ChatGPT:tä auttaakseen käyttäjiä kirjoittamaan parhaat ja yksityiskohtaisimmat mahdolliset kehotteet. Tekoälypohjaiset taustanpoistotoiminnot voivat auttaa säästämään aikaa ja vaivaa taustan leikkaamisessa kuvista.

kuinka tehdä kollaasi kuvista Facebookissa

Ja siinä on kaikki mitä Craiyon tekee. Se ei ole kaikkein kehittynein tekoälykuvan luontimalli, mutta se toimii hyvin perusmallina, jos et halua jotain yksityiskohtaista tai realistista.

Mallin käyttö on ilmaista, mutta ilmaiset käyttäjät voivat saada enintään yhdeksän ilmaista kuvaa kerrallaan minuutin sisällä. Voit tilata heidän tuki- tai ammattitasonsa (hinta 5 dollaria ja 20 dollaria kuukaudessa, ja ne laskutetaan vuosittain), jotta saat ilman mainoksia tai vesileimoja, nopeamman luonnin ja mahdollisuuden pitää luodut kuvat yksityisinä. Mukautettu tilaustaso mahdollistaa myös mukautetut mallit, integroinnin, erillisen tuen ja yksityiset palvelimet.

2 Vakaa diffuusio 1.5

Stable Diffusion on ehkä yksi suosituimmista avoimen lähdekoodin tekstistä kuvaksi sukupolven malleista. Se toimii myös muissa malleissa, mukaan lukien kolme alla mainittua kuvageneraattoria. Se julkaistiin vuonna 2022, ja sen jälkeen on ollut useita toteutuksia.

Säästän sinut liian teknisiltä yksityiskohdilta mallin toiminnasta (jotka voit tarkistaa niiden virallinen Githubin arkisto ), mutta malli on helppo asentaa jopa täysin aloittelijoille, ja se toimii hyvin, kunhan sinulla on erillinen GPU, jossa on vähintään 4 Gt muistia. Voit myös käyttää Vakaa diffuusio verkossa, ja autamme sinua, jos haluat suorita Stable Diffusion Macissa .

Vakaassa diffuusion käytössä on useita tarkistuspisteitä (pitäkää niitä versioina). Kun testasimme versiota 1.5, versio 2.1 on myös aktiivisessa kehityksessä ja tarkempi.

Yadullah Abidi/MakeUseOf/DreamShaper

Mallin ajaminen on myös melko helppoa. Testasimme sen kanssa AUTOMATIC1111 Stable Diffusio -verkkokäyttöliittymä , ja kaikki säätimet ja parametrit toimivat hyvin. Se on myös melko NSFW-suojattu mallin harjoittaman LAION-5B-tietokannan ansiosta (vaikka se ei ole täydellinen, muistakaa). Vaikka itse sukupolven aika vaihtelee laitteistosi mukaan, voit odottaa kuviesi olevan yksityiskohtaisia ja realistisia jopa peruskehotteilla.

3 DreamShaper

DreamShaper on Stable Diffusioniin perustuva kuvan luontimalli. Se oli tarkoitettu avoimen lähdekoodin vaihtoehdoksi MidJourneylle ja keskittyy luotujen kuvien fotorealismiin, vaikka se pystyy käsittelemään anime- ja maalaustyylit yhtä hyvin muutamalla säädöllä.

Malli on tehokkaampi kuin Stable Diffusion, mikä antaa käyttäjille enemmän vapautta lopullisessa lähdössä salamaparannuksista löysempiin NSFW-rajoituksiin. Mallin käyttäminen on myös helppoa, a ladattava, valmiiksi koulutettu versio saatavilla verkossa paikallista käyttöä varten ja useita verkkosivustoja, mukaan lukien Sinkin.ai , RandomSeed , ja Mage.space (vaatii perustilauksen), jonka avulla voit käyttää mallia GPU-kiihdytyksellä.

Kuten todennäköisesti jo arvaatte, DreamShaperin luomat kuvat näyttävät yleensä realistisemmilta verrattuna Stable Diffusioniin. Vaikka käyttäisit samaa kehotetta molemmissa malleissa, DreamShaper-malli on todennäköisesti realistisempi, yksityiskohtaisempi ja paremmin valaistu.

Tämä pätee erityisesti muotokuviin tai hahmoihin, joista Stable Diffusion puuttui samaan kehotteeseen verrattuna. Jos kuvistasi tulee liian realistisia, tässä neljä tapaa tunnistaa tekoälyn luoma kuva .

Et tarvitse myöskään huipputietokonetta mallin käyttämiseen. GTX 1650Ti 4 Gt:n VRAM-muistilla toimi mallissa täydellisesti. Sukupolviaika oli hieman pidempi, mutta se ei näyttänyt vaikuttavan todelliseen tuotantoon. Saatat kuitenkin tarvita GPU:ita, joissa on enemmän VRAM-muistia, jotta voit käyttää DreamShaper XL:ää, joka perustuu Stable Diffusion XL -malliin.

4 InvokeAI

Invoke AI on toinen AI-pohjainen kuvanmuodostusmalli, joka perustuu Stable Diffusioniin, jonka XL-versio perustuu Stable Diffusion XL:ään. Sillä on myös oma verkko- ja komentorivikäyttöliittymä, joten sinun ei tarvitse hypätä kehiin esimerkiksi Stable Diffusion -verkkokäyttöliittymän kanssa.

Malli keskittyy siihen, että käyttäjät voivat luoda visuaalisia osia henkiseen omaisuuteensa mukautettujen työnkulkujen avulla. InvokeAI on yksi parhaista avoimen lähdekoodin tekoälykuvan luontimalleista räätälöityjen mallien kouluttamiseen ja immateriaalioikeuksien parissa työskentelemiseen.

Sen virallinen Githubin arkisto luetellaan kaksi asennustapaa: asennus InvokeAI:n asennusohjelman kautta tai PyPI:n käyttö, jos olet tyytyväinen päätteeseen ja Pythoniin ja tarvitset enemmän mallin mukana asennettujen pakettien hallintaa.

Ylimääräinen ohjaus tuo kuitenkin joitain rajoituksia, etenkin tiukemmat laitteistovaatimukset. InvokeAI suosittelee omistettua GPU:ta, jossa on vähintään 4 Gt muistia, ja XL-version käyttämiseen suositellaan kuudesta kahdeksaan gigatavua. VRAM-vaatimukset koskevat sekä AMD- että Nvidia-grafiikkasuorittimia. Tarvitset myös vähintään 12 Gt RAM-muistia ja 12 Gt vapaata levytilaa mallia, sen riippuvuuksia ja Pythonia varten.

Yadullah Abidi/MakeUseOf/InvokeAI

Vaikka dokumentaatiossa ei suositella Nvidian GTX 10- ja 16-sarjan GPU:ita niiden videomuistin puutteen vuoksi, mukana toimitettu asennusohjelma toimi hienosti. Vaikka kilometrimääräsi voi vaihdella, jos käytät halvempaa GPU:ta, odota pidempään, jotta kehotteet muuttuvat kuviksi. Lopuksi, jos käytät Windowsia, voit käyttää vain Nvidia GPU:ta, koska AMD GPU:ille ei tällä hetkellä ole tukea.

Kuvan luomisen osalta malli pyrkii taipumaan enemmän taiteellisiin tyyleihin kuin fotorealismiin. Voit tietysti harjoitella mallia tietojoukossasi ja saada sen luomaan kuvia, jotka ovat lähempänä haluamaasi, vaikka se sisältäisi fotorealistisia kuvia, varsinkin jos työskentelet tuotesuunnittelun, arkkitehtuurin tai myyntitilojen parissa. Yksi tärkeä asia on kuitenkin muistaa, että InvokeAI on ensisijaisesti kuvien luontimoottori, mikä tarkoittaa, että joudut todennäköisesti käyttämään omia mallejasi parhaiden tulosten saavuttamiseksi (löytyy helposti verkkokäyttöliittymässä olevan mallinhallinnan kautta) oletusarvona. malli on melko samanlainen kuin itse Stable Diffusion.

5 Openjourney

Openjourney on ilmainen avoimen lähdekoodin tekoälykuvan luontimalli, joka perustuu jälleen Stable Diffusioniin. Jos mietit, miksi mallia kutsutaan nimellä Openjourney, se johtuu siitä, että se on koulutettu Midjourney-kuviin ja se voi jäljitellä tyyliään luomissaan kuvissa.

PromptHero , Openjourneyn takana oleva yritys, antaa sinun testata mallia muiden mallien rinnalla, mukaan lukien Stable Diffusion (versiot 1.5 ja 2), DreamShaper ja Realistic Vision. Rekisteröityessäsi saat 25 ilmaista saldoa (yksi saldo jokaista luotua kuvaa kohden), minkä jälkeen sinun on tilattava heidän Pro-tilaustaso, joka maksaa 9 dollaria kuukaudessa ja antaa sinulle käyttöösi 300 krediittiä kuukaudessa muiden eksklusiivisten ominaisuuksien kera.

Jos kuitenkin haluat käyttää sitä paikallisesti ja ilmaiseksi, voit Lataa mallitiedosto HuggingFacesta ja suorita se käyttämällä Stable Diffusion -verkkokäyttöliittymää. Openjourney on myös toiseksi ladatuin AI-kuvasukupolvimalli HuggingFacessa, heti Stable Diffusionin jälkeen.

Openjourney ei lue sivustollaan mitään erityisiä laitteistovaatimuksia mallin paikallista käyttöä varten, mutta voit odottaa samanlaisia laitteistovaatimuksia kuin Stable Diffusion. Tämä tarkoittaa erillistä GPU:ta, jossa on 4 Gt VRAM-muistia, 16 Gt RAM-muistia ja noin 12–15 Gt vapaata tilaa tietokoneellasi mallin ja sen riippuvuuksien tallentamiseksi.

Yadullah Abidi/MakeUseOf/OpenJourney

Openjourneyn luomat kuvat ovat yleensä tasapainossa fotorealismin ja taiteen välillä, ellei toisin mainita. Jos etsit monipuolista mallia ja pidät Midjourney-ulkoasusta ja tuntumasta maksamatta tilauksesta, Openjourney on yksi parhaista vaihtoehdoista.