Pokud jste předplatiteli ChatGPT Plus (20 USD měsíčně), tak nově je k dispozici i plugin Dall-E 3. Aktivujete ho v horní liště v ChatGPT4 kliknutím na možnost Dall-E 3.
Je to aktuálně nejnovější verze generátoru obrázků z dílny OpenAI, která je zároveň i autorem ChatGPT. Používání Dall-E 3 je v ChatGPT zahrnuto v předplatném, takže žádné extra poplatky se už za něj neplatí.
Na využití Dall-E 3 se vztahují limity na počet dotazů a stále platí, že nebude generovat jakýkoliv útočný, rasistický nebo explicitní obsah. O tom, jak vám FAPI pomůže ušetřit čas, který můžete věnovat tvorbě obsahu si přečtete na konci článku.
Využití pro něj tu najde mnoho skupin uživatelů. Obrázkový výstup se hodí jako ilustrace do článků, knih a e-booků, na blog (ten náš nevyjímaje), jako náhledy k příspěvkům na sociální sítě apod.
Kvalita výstupu je, podobně jako u textových výsledků ChatGPT, závislá jednak na tom, jak zadání ChatGPT a DALL-E pochopí, ale hlavně na promptu (příkazu).
OpenAI tvrdí, že DALL-E 3 je v tomhle zatím z dostupných nástrojů nejdál, protože chápe zadání v celé šíři textu. Tím nám jako uživatelům odpadá nutnost tzv. prompt-engineeringu, což je neustálé opakování téhož příkazu s drobnými úpravami, abychom docílili žádoucí změny.
O psaní správných promptů pro ChatGPT píšeme v tomto článku:
Dall-E podle OpenAI umí pochopit i velmi podrobné textové zadání rovnou a přetvořit ho v obrázek.
Abychom si ukázali schopnosti Dall-E 3 prakticky, zadali jsme mu několik různých typů úloh. U každé přikládáme jak prompt, který jsme zadali, tak první výsledek.
Odzkoušíme různé styly a kombinace toho, jak ChatGPT porozumí zadání a jak dobře pak zadaný výstup pochopí Dall-E 3. Každý výstup jde pomocí zpřesňování promptu upravit, ale tím se v tomhle článku už zabývat nebudeme. Jde nám o „výstup na první dobrou“.
U prvního obrázku jsme použili specificky český styl dětského časopisu Čtyřlístek, se kterým si Dall-E 3 neporadil. Ilustrace je i tak docela povedená.
Druhý obrázek dodržel zadání na první pokus.
U prvního černobílého obrázku nedodržel Dall-E zadání s krajinkou.
U druhého výsledku jsme spokojení, výsledek je podle zadání.
U obou obrázků jsme narazili na to, že ChatGPT neporozuměl zadání, resp. neví jak vizualizovat nadsázku z daného přísloví.
První obrázek je v pořádku.
U druhého nedodržel Dall-E požadovaný styl. Namísto specifického stylu van Gogha ilustrace je ve stylu post-impresionizmu.
Podle OpenAI si Dall-E dobře vede s podrobným zadáním, kde i ze složitých promptů pochopí co přesně má na výstupu být a poskládá podle požadavků výsledný záběr.
Několik výstupů přikládáme:
Výstup vypadá skvěle, byť neodpovídá přesně zadání. Z promptu ve výsledném obrázků chybí stromy, nebo aspoň větvě stromů, okno a závěs nejsou v levém rohu, jak jsme požadovali. Oboje by se ale snadno dalo upravit přegenerováním výstupu.
V tomhle výstupu Dall-E také nedodržel zadání. Jednorožců je 15, chybí bílý Pegas několik samolepek je chybně – jednorožec se dvěma rohy, několik steam-punk jednorožců apod.
S tímhle výstupem nejsme spokojení, je v angličtině. Dáváme tedy ChatGPT za úkol přegenerovat ho do češtiny.
Graficky vypadá výstup lépe, než předchozí pokus. Ale bohužel nedodržel spoustu prvků z původního promptu. Chybí čas akce, chybí informace o bezplatném vstupném, omezení počtu účastníků atd.
Ale obrázek bychom použili jako super základ pro vlastní dotvoření ve Photoshop nebo obdobné aplikaci.
Grafické výstupy jde dnes za peníze i zadarmo tvořit ve spoustě služeb. Z těch populárních třeba:
Každá aplikace umí něco jiného a cílí na jiné uživatele. V některých lze udělat jen jednoduché náhledy a loga, v některých jsou k dispozici palety vícero nástrojů, některé mohou i konkurovat zkušeným uživatelům Photoshopu.
Určitě se vyplatí sledovat trendy a udržovat se v aktuálním povědomí toho, kam se generativní AI ubírá. Už nyní, na počátku rozmachu, jsou grafické výstupy dostatečně dobré, aby se s nimi daly ilustrovat knížky nebo online obsah.
Aktuálně tou hlavní překážkou je to, že Dall-E (stejně jako jiné generátory obrázků) neumí dobře pracovat s texty. Když tvoří slova a věty, tak silně halucinují a tvoří neexistující formulace.
Nemůžeme tak po nich chtít vytvořit grafiku s texty, které si mají sami domyslet a vytvořit. Podle našich testů to ale vypadá tak, že jde tohle omezení s trochou trpělivosti obejít:
Právní souvislosti – autorská práva k obsahu vygenerovanému pomocí AI. Zde stále ještě platí, že je takhle oblast práva jak v evropském, tak světovém měřítku teprve na počátku. Dle aktuálních právních úprav napříč světem nejde přiznat autorství samotné umělé inteligenci. Autorství nebo spolu-autorství u díla, které vzniklo pomocí AI se posuzuje individuálně podle rozsahu tvůrčího přínosu jednotlivých účastníků.
Samotné vytvoření promptu, byť je sebevíc složitý, se ale zároveň nepovažuje za dostatečně kreativní proces, aby autorství výsledného obrázku připadlo tomu, kdo prompt vymyslel a AI ho zadal.
Stručný výklad k právním souvislostem s AI najdete třeba zde (Petra K. Dolejšová).
Postoj samotného OpenAI nyní je takový, že jakýkoliv obrázek pomocí Dall-E vytvoříte, je vám k dispozici pro volné použití a není vyžadováno žádné další povolení k reprodukci, prodeji nebo zpeněžování.
Tvořte obsah pomocí AI nástrojů a starosti s fakturací nechte na FAPI! Tento automatizovaný fakturační systém se postará o celý prodejní proces za vás. Ať už prodáváte digitální produkty, online kurzy nebo grafické materiály, FAPI vám umožní rychle a snadno vystavovat faktury, spravovat platby a automatizovat opakující se procesy. Ušetřete čas, který byste jinak strávili administrativou, a věnujte ho růstu vašeho podnikání. Vyzkoušejte FAPI a prodávejte bez starostí!
Nemáte ještě svůj účet FAPI? Založte si jej zdarma zde. Vybírat můžete ze tří tarifů.