Obálky, které dýchají: Midjourney a jeho magie

Nenávratně pryč jsou časy, kdy vyšla špičková obálka na vyšší tisíce. Dnes ji lze získat zdarma nebo za pár korun a její následnou odbornou úpravu ve Photoshopu od necelých dvou stovek.

A co je možná nejlepší – můžete mít většinu procesu pod kontrolou, přitom si krásně hrát a návrhů obálek si vytvořit třeba tucet. Čím více návrhů vyrobíte, tím bude větší pravděpodobnost, že mezi nimi vyberete tu skutečně nejlepší.

V září 2022 jsem psal o úžasném AI generátoru obrázků Midjourney (dále MJ). Tehdy plně fungovala jen jeho verze 3. Ale uplynulo teprve několik měsíců a už tu máme verzi 5. AI teď prochází tak rychlým (a nekontrolovaným) vývojem, že otevřený dopis s žádostí o pozastavení vývoje AI podepsalo přes tisíc osobností, které se na jejím vývoji podílejí, mezi nimi Elon Musk, Steve Wozniak či vedoucí zástupci jak Microsoftu, tak OpenAI (já bych ho podepsal taky).

Nu, ale není to v našich rukou, a tak se budeme soustředit na to, co nám nové nástroje přinášejí, v tomto případě MJ.

kniha

Test – reálná místa

Strávil jsem již experimentováním přinejmenším desítky hodin. Je to zkrátka úžasná hračka pro někoho, kdo celý život tvoří obrázky

A když už jsme u toho, zkusil jsem nechat MJ vytvořit obrázky některých specifických míst, ke kterým mám pro srovnání vlastní fotografie.

Tím prvním bylo bizarní vietnamské pohoří Hà Giang u hranic s Čínou. Chtěl jsem vidět, jaký bude výsledek zcela jednoduchého zadání s pouhým určením poměru stran pomocí parametru –ar.

Ha Giang

prompt: ha giang mountains –ar 3:2

A toto jsou mé fotky pro srovnání. Nejsou moc pěkné, protože tenkrát byla špatná viditelnost a navíc na těch úzkých silničkách není kde zastavit na focení.

Ushguli

Druhým místem, které jsem nechal vygenerovat, byla krásná gruzínská podhorská vesnička Ushguli. A na té si trochu zaexperimentujeme, abyste viděli, jak různé zadání promptů – já jim říkám zaklínadla – ovlivňuje výsledek.

Takhle Ushguli vypadá v realitě:

A abychom měli srovnání, začnu opět úplně jednoduchým promptem. Tentokrát budeme chtít obrázek na výšku, aby byl případně vhodný i na obálku, takže v parametru –ar prohodíme čísla. První se totiž píše vždy šířka.

prompt: Ushguli village photo –ar 2:3

Vidíte, že zde jsme nespecifikovali nic jiného, než že chceme Ushguli na výšku, a protože jsme nepožadovali specifické počasí, máme tu deštivo a šedivo. To ale pro knihu nemusí být nejlepší obrázek, protože takové barvy s menší pravděpodobností zaujmou – je to méně lákavá scéna.

Zkusme si pro změnu ilustraci. Už od začátku si lajkuju fotky v MJ Community Feedu, abych je měl uložené a mohl se podívat, jaké příkazy u nich zadavatelé použili (a mohl od nich opisovat). Zahrnu tedy do promptu jméno výtvarníka, v jehož stylu bych chtěl obrázek vidět.

prompt: Ushguli, a small village with a mountain in the background, by Arthur Sarkissian, shutterstock, dau-al-set, high rises, in a mountain valley, caucasian, mill –ar 2:3  –v 3

Ale ještě nezavrhujme fotorealistický obrázek jen proto, že nám na něm nevyšlo počasí. To se dá jednoduše napravit. (Pomiňme nyní to, že takový obrázek by byl nejvhodnější pro cestopis nebo průvodce, a tam určitě nechcete dávat fiktivní, uměle vytvořenou „fotografii“. Teď nám jde o experimentování s MJ.) Vysokou stylizaci (–s 1000) zadávám proto, aby se od sebe obrázky více lišily.

prompt: Ushguli village photo in the sunny morning –ar 2:3 –s 1000

Možná se nechcete s MJ učit, chcete si jen vytvořit obrázek a jít od toho. V tom případě vytváření a postupná oprava promptů nejsou pro vás. Dobrá zpráva je, že zkratky existují. Do konce léta budu mít připravený zbrusu nový trénink AI booster, který bude obsahovat takových zkratek nejmíň pět. 

Ta nejdůmyslnější z nich je zároveň pro uživatele šíleně jednoduchá. Prostě vezme „zaklínadlo“ (prompt) z přiložené Knihy zaklínadel (který GPT řekne, jak psát a strukturovat prompty pro MJ) a za něj pouze přidá své původní jednoduché zadání, v tomto případě „Ushguli village photo“. A GPT mu sepíše obsáhlý a detailní prompt.

Čím více informací GPT samozřejmě poskytnete, tím bude výsledek blíže tomu, co chcete. Ale budete to moci popsat jednoduše a vlastními slovy, bez studia architektury MJ promptů.

Zadal jsem tedy náš jednoduchý prompt „Ushguli village photo“ do GPT a toto je výsledek, který jsem měl během pěti sekund:

prompt: A breathtaking view of Ushguli village nestled in the Caucasus Mountains, captured by renowned photographer Elena Ivanova. The photo showcases the picturesque landscape with snow-capped peaks, traditional stone houses, and vibrant wildflowers in the foreground. The composition highlights the rich cultural heritage of the region, with intricate wood carvings adorning the balconies and colorful textiles hanging from the windows. The warm sunlight casts a golden glow on the village, creating a serene and inviting atmosphere. –v 4 –q 2 –stylize 1000 –ar 2:3

Hack: Potřebujete obrázek nějaké bizarní krajiny nebo architektury? Najděte obrázek z reálného světa, který je jí nejpodobnější, a zkuste na toto reálné místo z promptu odkazovat.

Hack 2 (pro neangličtináře): Používejte překladač DeepL a budete v práci s GPT a MJ možná stejně rychlí jako ti, co anglicky umí.

kniha

Obálky reálných knih

Dost bylo teorie, pojďme k obálkám skutečných papírových knih.

První dvě, na které jsem v praxi použil obrázky z MJ, byly cestopis Camino 1. a kniha úvah a básní Dumání. V té době jsem ještě neměl po ruce povel pro GPT na generování komplexních obrázkových zadání a příkazy jsem si psal sám. 

Cestopis

U Camina jsem obrázků vytvořil vícero, ten finální si vybral autor, který neměl původně představu vůbec žádnou. Byly to jedny z vůbec prvních obrázků, které jsem v MJ vytvořil a kvalita tomu odpovídá. 

Na finálním obrázku jsem musel poutníkovi přifotošopovat nohu a batoh. Nohu jsem naklonoval z té levé a batoh je původně produktové foto z internetu, změněné k nepoznání (někdy lze použít i obrázky, na které nemáte licenci: změní-li se k nepoznání, nadto stanou-li se ještě součástí nového obrázku, nikdo podle nich originál neidentifikuje).

I tu retuš pro vás může udělat levně někdo přes Fiverr, nemusíte se kvůli tomu učit s Photoshopem.

Prompt finálního obrázku zněl:
prompt: The Wanderer on the path through spain landscape, lot of space –ar 2:3  –video –v 3

Úvahy a poezie

Kniha Dumání je už sedmá, kterou u mě p. Žák vydal. Na předchozí knihy vždy prosadil svou obálku, maximálně se mi podařilo ji trochu vylepšit. Tentokrát jsem zkusil vzít jeho návrh a vytvořit jej v MJ úplně od nuly a lépe.

Autor měl tentokrát k ruce výtvarnici a nechal výběr titulního motivu na nás, takže se mi povedlo původní návrh díky MJ trochu pozvednout.

Prompt je též sestaven bez GPT. Jména výtvarníků jsem zkopíroval z příkazů jiných autorů v MJ Community feedu (ne že bych je znal, vybíral jsem opticky podle výsledku).

Obrázek generovala verze MJ č. 3 a ta měla velký problém s končetinami. Míchala pravé a levé a měly málokdy přesně pět prstů. I ze vidíte, že levá ruka má 4 prsty, místo pravé ruky je původně další levá a pravá noha má 7 prstů. 

prompt: Watercolour painting of the statue The Thinker from August Rodin whole body, vibrant, colorful, creativity, by Jean Haines, by Albrecht Dürer, by Claude Monet white background

To bylo potřeba opravit, jen u té levé ruky by to bylo příliš náročné, takže jsme se rozhodli to ponechat s tím, že si toho stejně všimne jen minimum lidí. Všimli byste si toho vy, kdybych vás neupozornil?

I pro takovéto úpravy můžete s úspěchem použít Fiverr.com.

kniha

Kvalitativní skok s GPT

Již jsem se zmínil, že detailní prompty není potřeba vymýšlet a může je pro vás vytvořit ChatGPT, když dostane instrukce, jak na to. K tomu slouží poměrně dlouhý povel, který jí vysvětlí, jak má povel pro MJ vypadat, jakou má mít strukturu a jaká slova v něm používat.

Od té doby se kvalita mých výsledků zvýšila tak o 300 %. Ne že by se nevyplatilo se alespoň v základu orientovat, protože pak lze prompty vytvořené GPT podle potřeby pozměňovat a rychleji tak dosáhnout žádaného výsledku. Ale nezbytně nutné to není.

Zkusím tedy s pomocí nového povelu vytvořit alternativy k obálkám knih, které vyšly v době „před Midjourney“. Ani bych se nedivil, kdyby se éra vydávání knih začala dělit na dobu před AI a dobu po ní… Tak významný přelom to je.

Rytířský román

V roce 2021 mě oslovila babička 13letého hocha a vydával jsem mu knihu Rytíři z Dénie – Sámova banda (link). V té době ještě MJ nebyla, takže jsme hledali vhodný obrázek ve fotobankách, a autor si vybral tento.

Jakou obálku bych mu mohl nabídnout dnes díky MJ?

Tohle je několik mých pokusů, než jsem došel k žádanému výsledku (a k tomu, co vlastně chci):

Vítězné a nejdokonalejší obrázky jsem opět získal díky zaklínadlu pro GPT na tvorbu promptů pro Midjourney, pouze jsem upřesnil, že chci detail. Tento prompt mi na základě něj vygenerovala ChatGPT:

prompt: A Knight’s Duel, A Close-up Photorealistic Detail of a Battle Scene  A knight stands tall, his armor shining under the sun. His opponent is a deadly assassin, hired to take him out. The two men stand face to face, their eyes locked in a fierce stare-down.  Behind them, the battle rages on, with swords clashing and arrows flying through the air. But in this moment, all attention is on the two combatants. The ground beneath them is muddy and blood-soaked, with the sounds of the battle muffled by the intensity of the moment.  The mood of the scene is tense, with a feeling of impending danger lurking just below the surface. The atmosphere is charged with adrenaline, as the two men prepare to engage in a life-or-death struggle.  The lighting effect is dramatic, with the bright sun casting long shadows across the ground. The intensity of the light serves to heighten the sense of danger and urgency, while also drawing attention to the intricate details of the fighters‘ armor and weapons.   –c 20 –s 625 –ar 2:3 –no text

… a ten jezdec, prompt je opět vygenerován GPT:

prompt: epic photography of an Egyptian warrior on a horse riding into battle, intense action, dynamic juxtapositon, saturated high-contrast photo, visual effects, vfx –ar 2:3 –c 55 –s 555

Povídky

Jeden z mých autorů funguje v týmu se svým synem, který mu povídky a básničky ilustruje, včetně obálek. Obálka je ale tak důležitá část knihy, že ospravedlní i použití jiného ilustrátora než na vnitřek knihy. Zkusil jsem tedy zapojit MJ a obálku vytvořit znovu s jeho pomocí. 

Prompt, který vedl k tomuto obrázku, pro mě opět vytvořila ChatGPT:

prompt: Color sketch of an an elderly man with a weathered face sitting in a wooden rocking chair on white background. He holds a bubble blower in front of his mouth and blowing large, vibrant bubbles that float in the air. The sunlight filters through the leaves, casting a warm glow on the scene. The man wears a straw hat and a contented smile as he enjoys the simple joy of blowing bubbles. The details of the bubbles are intricate, with swirling colors that catch the light. The illustration is highly detailed and captures the serene and whimsical atmosphere of the moment. –v 4 –q 2 –stylize 1000 –ar 2:3

kniha

Obálky z hotového obrázku

AI nastoupila tak rychle, že nikdo nestihl vymyslet nejen jak to bude s její kontrolou, ale ani jak to bude s autorskými právy. AI se totiž učila na gigantických haldách materiálu, který vytvořili lidé. Když udělá obrázek v Dalího stylu, děje se tak jen proto, že se mohla učit z jeho prací. V jeho případě autorská práva dávno expirovala, ale v případě jiných umělců nikoli.

Výsledkem je, že momentálně nevlastní autorská práva nikdo – ani MJ či její tvůrci, ani zadavatel promptu – čili vy. Kdokoli může vzít váš obrázek a použít jej na cokoli.

Což znamená, že takhle můžete použít i vy obrázek, který vytvořil někdo jiný.

Pravděpodobnost, že byl vytvořen pro obálku knihy, je minimální. I kdyby se tak stalo, a někde v USA nebo v Číně vyšla kniha se stejným obrázkem, nejspíš se o ní nikdy ani nedozvíte, nebude-li zrovna figurovat v nějakém celosvětovém skandálu.

Mně by to ale asi pro skutečnou knihu bylo trochu trapné a líné, takže bych si spíš zkopíroval prompt, který k obrázku vedl a zkusil si s jeho pomocí vytvořit obrázek vlastní. A jeho varianty a vlastní zvětšeninu (upscale).

Budete-li postupovat stejně, v Community Feedu klikněte na tři tečky pod příslušným obrázkem a zvolte Copy>Full Command (aby se vám příkaz zkopíroval celý, i s parametry).

Chci vám pouze ukázat, jak krásné a poutavé obálky lze s MJ vytvořit, takže jsem si cestu o tento poslední krok zkrátil a použil jsem přímo obrázky vytvořené jinými uživateli, které se objevily v Community Feedu. 

Mám do něj nos namočený skoro každý večer a stále znovu žasnu, co MJ dokáže…

Už jste Midjourney sami vyzkoušeli? A jaké máte výsledky?

Pochlubte se (nebo si postěžujte) v komentářích!

Jiří Nosek
průvodce autorů českým knižním bludištěm
o blogu a mé cestě k autorskému vzdělávání

Chcete konečně proniknout do matoucího světa vydávání a propagace knih a získat
komplexní a srozumitelnou mapu hracího pole?

Nebuďte na to sami! Připojte se do facebookové skupiny Jak si vydat knihu, a jak ji i prodat

Hledáte nakladatelství se slušnými podmínkami? Co třeba KLIKA?

Přehled všech článků tohoto blogu

Komentáře

Přidat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *