Midjourney i historia alternatywna – jak AI wizualizuje francuskie USA

przez Marcin

Midjourney jako narzędzie do historii alternatywnej

Midjourney w ciągu kilkunastu miesięcy stał się dla twórców jednym z głównych narzędzi do generowania obrazów AI. Coraz częściej nie służy tylko do „ładnych obrazków”, ale do pełnoprawnego AI content creation – prototypowania gier, wizualizacji filmów, projektowania światów i budowania całych uniwersów. Jednym z ciekawszych zastosowań jest sztuczna inteligencja historia alternatywna, np. wizualizacja świata, w którym to Francja, a nie Wielka Brytania, dominuje w Ameryce Północnej – powstają „francuskie USA”.

Dlaczego to temat ważny właśnie teraz? Po pierwsze, Midjourney V6/V7 (2024/2025) przynosi skok jakościowy w realizmie i spójności świata przedstawionego. Po drugie, rośnie zapotrzebowanie na szybkie, prototypowe wizualizacje – w gamedevie, filmie, edukacji czy marketingu. Wreszcie, takie projekty świetnie odsłaniają potencjał i ograniczenia wizualizacji konceptów AI: jak daleko można zaufać obrazom generowanym przez model, który trenował na danych z naszej, „prawdziwej” historii?

Przyjrzymy się więc, jak z użyciem Midjourney zaprojektować spójny projekt „francuskich USA”: od parametrów technicznych, przez kreatywne promptowanie, po praktyczne wnioski dla twórców gier, pisarzy SF i historyków z zacięciem do eksperymentów wizualnych.

Jak działa generowanie obrazów AI w Midjourney

Midjourney to usługa oparta na generatywnej sztucznej inteligencji, która zamienia tekstowy opis (prompt) na obraz. Pod maską znajdziemy duże modele diffusion, uczone na gigantycznych zbiorach par tekst–obraz. Nie znamy pełnej architektury (Midjourney nie jest open source jak Stable Diffusion), ale z zewnętrznego punktu widzenia działa podobnie: tekst jest kodowany przez model językowy, a sieć generatywna krok po kroku „wyciąga” z szumu finalną grafikę.

Od wersji V5.2, przez V6, aż po najnowszy model V7 (2024/2025), zwiększyła się:

  • rozumienie złożonych promptów,
  • spójność stylistyczna serii obrazów,
  • jakość detali (architektura, stroje, typografia, ciała),
  • możliwość „dopisywania” i edycji scen.

Ważne: Midjourney generuje obrazy na podstawie statystycznych skojarzeń – nie „zna” historii, tylko kojarzy słowa jak „French colonial architecture”, „New Orleans 18th century”, „American city skyline” z określonymi wzorcami wizualnymi. To jednocześnie jego siła (bogata baza wizualna) i słabość (łatwe powielanie stereotypów).

Dlaczego alternatywna historia to idealny poligon testowy

Projekt „francuskie USA” to świetne case study użycia generowania obrazów AI, bo łączy kilka trudnych aspektów:

  • musimy wymusić spójność stylistyczną w długiej serii obrazów,
  • łączymy elementy znane (Nowy Jork, Waszyngton) z nieistniejącymi (francuska dominacja kulturowa),
  • sprawdzamy, jak Midjourney radzi sobie z „przekodowaniem” całej ikonografii kraju.

To bardzo realistyczny scenariusz dla twórców gier (worldbuilding), projektantów kampanii storytellingowych czy naukowców przygotowujących materiały dydaktyczne z zakresu „co by było, gdyby…”.

Konfiguracja wersja modelu parametry koszt

W naszych testach sprawdziliśmy, jak różne wersje modelu radzą sobie z wymagającym projektem worldbuildingu. Specyfikacja mówi sama za siebie, ale kluczowy jest wybór odpowiedniego modelu.

Wybór modelu V6 vs V7

Na potrzeby alternatywnej historii najbardziej sensowny jest wybór najnowszego modelu:

Parametr Midjourney V6 Midjourney V7
Realizm architektury bardzo dobry znakomity, lepsze detale
Konsekwencja stylu dobra lepsza, szczególnie z Style Tuner
Czytelność tekstu (szyldy) średnia–dobra znacznie poprawiona
Dostępność w planach Basic/Standard/Pro tylko w płatnym planie, domyślny model

Wskazówka: do świata „francuskich USA” polecam V7 i włączenie personalizacji stylu (Style Tuner). Pozwala to utrzymać jeden, rozpoznawalny „look” całej serii grafik – kluczowe, jeśli myślimy o materiale na okładki książek, koncepty do gry czy prezentację inwestorską.

Parametry techniczne aspect ratio styl seed

Przy wizualizacji konceptów AI typu „francuskie USA” kluczowe są trzy parametry promptu:

  • --ar (aspect ratio) – np. --ar 16:9 dla ujęć „filmowych” miast, --ar 9:16 dla shortów na TikTok/Reels, --ar 3:2 dla ilustracji okładkowych.
  • --seed – stały seed pozwala zachować podobny układ sceny przy kolejnych iteracjach (np. ta sama „francuska” wersja Times Square widziana o różnych porach dnia).
  • styl – w V7 warto dodatkowo użyć Style Tuner, by wygenerować własny styl świata (np. „neo-belle époque metropolis”).

Ciekawostka: Midjourney w V7 lepiej niż wcześniejsze modele radzi sobie z flagami i symbolami. Da się więc wygenerować np. „flagi francuskich Stanów Zjednoczonych” czy warianty herbu „États-Unis Français”, choć AI czasem miesza proporcje i elementy heraldyczne.

Koszt i dostępność na rynku polskim

Cennik Midjourney (wg stanu na końcówkę 2024 / początek 2025) prezentuje się następująco (w przybliżeniu, ceny w USD):

Plan Przybliżona cena GPU minutes / miesiąc Zastosowanie
Basic ~10 USD ~3,3 h hobbystyczny projekt, pojedyncza seria obrazów
Standard ~30 USD ~15 h mały zespół, praca nad jednym światem gry
Pro ~60 USD ~30 h studio gamedev, agencja kreatywna

Przy typowym projekcie „francuskich USA” (ok. 150–250 finalnych obrazów, wielokrotne iteracje) realnie wchodzimy w zakres 8–20 godzin GPU, więc w praktyce minimum Standard, a przy pracy komercyjnej – Pro. Po przeliczeniu na złotówki (przy kursie ~4,0 zł/USD) mówimy o ok. 120–240 zł miesięcznie. W praktyce oznacza to, że w polskich realiach jest to nadal tańsze niż jednodniowa praca ilustratora, ale pamiętajmy: Midjourney nie zastąpi w pełni koncept artysty, jedynie skraca ścieżkę od pomysłu do mockupów.

Projekt francuskich USA krok po kroku

Oryginalny materiał od @Evolving AI możesz zobaczyć poniżej:

Jak widać w powyższym materiale, kreatywne promptowanie pozwala na budowanie spójnych, alternatywnych światów. Przejdźmy do szczegółów technicznych.

Definicja kanonu świata

Pierwszy etap nie ma nic wspólnego z AI – to klasyczny worldbuilding. Musimy ustalić „kanon”:

  • Jak wygląda mapa – które kolonie stały się jądrami „États-Unis Français”?
  • Jakie są główne miasta – np. „Nouvelle Orléans” jako stolica, „Nouvelle York”, „Philadelphie”, „Saint-Louis”, „Détroit”.
  • Jak wygląda architektura – mieszanka haussmannowskiego Paryża, kolonialnej Nowej Francji i nowoczesnych drapaczy chmur?
  • Jakie symbole państwowe – flaga, herb, mundury armii, styl budynków rządowych?

Wszystko to przekładamy potem na słowa kluczowe w promptach.

Kreatywne promptowanie przykłady

Przykładowy prompt bazowy dla „francuskiego” Nowego Jorku w Midjourney V7:

/imagine prompt: futuristic Nouvelle York, capital of the French United States, haussmannian boulevards mixed with glass skyscrapers, French colonial architecture, tricolore flags everywhere, French language neon signs, dense urban crowd, early evening golden hour, cinematic, ultra detailed, 8k --ar 16:9 --v 7

Do utrzymania spójności świata warto stworzyć kilka „klocków” językowych i używać ich we wszystkich promptach:

  • „États-Unis Français official government building” – dla budynków administracji,
  • „French-American cyberpunk metropolis” – dla ujęć futurystycznych,
  • „Colonial French North America reinterpretation” – dla historycznych retrospekcji.

Wskazówka: zapisuj wszystkie użyte prompty w repo (Git, Notion, Obsidian). Ludzie z branży coraz częściej trzymają „promptbooki” jak kod źródłowy – to realne IP projektu.

Testy i iteracje spójność postaci i miast

Midjourney od V6 lepiej radzi sobie ze spójnością postaci, ale nie ma natywnego „character sheet” jak niektóre inne narzędzia. Można jednak obejść to parametrami:

  • trzymaj stały --seed w serii scen z tą samą postacią,
  • używaj powtarzalnych descriptorów (np. „tall woman, Algerian-French heritage, blue officer uniform of the États-Unis Français”),
  • przechowuj najlepszy portret postaci i używaj go jako reference image (Image Prompt), dodając tekst opisowy.

Dla miast spójność uzyskujemy przez powtarzalny zestaw fraz w promptach, ten sam styl (Style Tuner) i podobne warunki oświetlenia (np. zawsze „overcast sky, soft light” dla ujęć ulicznych).

Techniczne ograniczenia i obejścia

W projektach historii alternatywnej napotkamy kilka typowych problemów:

  • Tekst na szyldach – nawet w V7 AI potrafi „popsuć” litery. Pomaga powtarzanie fraz typu „French language signs” + ręczna podmiana tekstu w Photoshopie/GIMP-ie.
  • Symbole religijne/polityczne – Midjourney stosuje filtry bezpieczeństwa. Niektóre kombinacje (np. zbyt dosłowne nawiązania do rzeczywistych reżimów) będą blokowane – trzeba je „rozmiękczać” opisowo.
  • Chronologia – AI łatwo miesza epoki. Dla „XVIII-wiecznej” wersji francuskich kolonii trzeba wprost pisać „18th century aesthetic, no modern buildings, no cars”.

Uwaga: jeśli planujecie komercyjne użycie obrazów, koniecznie sprawdźcie aktualny regulamin Midjourney i kwestie praw autorskich. Zasady licencji zmieniały się już kilka razy.

Zastosowania francuskich USA w praktyce

Gamedev i prototypowanie światów

Dla małych i średnich studiów gamedev w Polsce Midjourney to realny game changer. Zamiast tygodni pracy concept artistów nad wstępnym look&feel świata, można w kilka dni wygenerować setki ujęć:

  • widoki miast (Nouvelle Orléans, Nouvelle York, Boston w wersji francuskiej),
  • koncepty UI (panoramy jako tła menu),
  • design posterów propagandowych „francuskich USA”,
  • kostiumy NPC – mundury, stroje cywilne, subkultury.

Te obrazy nie trafiają 1:1 do gry, ale dają artystom konkretny, spójny punkt wyjścia. W praktyce skraca to etap preprodukcji nawet o kilkadziesiąt procent.

Storytelling książki edukacja

Autorzy powieści SF/alternatywnej historii mogą wygenerować:

  • okładki i ilustracje rozdziałów,
  • „podręczniki szkolne” z równoległego świata – świetne narzędzie na zajęcia z historii w wersji „co by było, gdyby…”,
  • materiały promocyjne do kampanii crowdfundingowych (np. na Zrzutka/Patronite).

W edukacji sztuczna inteligencja historia alternatywna może stać się sposobem na aktywizację uczniów – zamiast biernego słuchania o wojnach kolonialnych, uczniowie budują własne wizje „francuskich USA” i dyskutują, które są bardziej wiarygodne historycznie.

Wnioski i następne kroki dla twórców

Midjourney, szczególnie w wersji V7, jest dziś jednym z najlepszych narzędzi do wizualizacji skomplikowanych, alternatywnych światów. Projekt „francuskich USA” pokazuje, że generowanie obrazów AI potrafi nie tylko ozdobić tekst, ale realnie wpłynąć na sposób projektowania historii i światów – od pierwszej idei po pitch deck dla wydawcy.

Kluczowe wnioski:

  • Spójność świata nie bierze się z „magii AI”, tylko z dobrze zaprojektowanego kanonu i konsekwentnego, świadomego promptowania.
  • Midjourney wymaga traktowania promptów jak kodu – wersjonowania, dokumentowania, testowania.
  • Kosztowo, przy cenach planów 10–60 USD, narzędzie jest w zasięgu polskich twórców indie i małych studiów. Stosunek ceny do jakości jest bardzo korzystny.
  • Wizualizacje AI są genialne do prototypowania, ale wciąż wymagają kurateli człowieka – zarówno artystycznej, jak i historycznej.

Jeśli chcesz pójść krok dalej, warto:

  • przygotować własny „prompt style guide” dla projektu (jak dokument stylu w firmie),
  • połączyć Midjourney z narzędziami do zarządzania zasobami (Notion, Obsidian, Git) tak jak kodem źródłowym,
  • przetestować obok Midjourney alternatywy (Stable Diffusion z LoRA, Ideogram) i porównać jakość tekstu, stylu i kontroli nad obrazem,
  • śledzić dyskusje prawne wokół AI content creation – kwestia praw do obrazów będzie coraz ważniejsza przy komercjalizacji takich światów.

Midjourney nie napisze za nas historii alternatywnej o „francuskich USA”, ale może sprawić, że jej wizualna strona będzie wyglądała jak wysokobudżetowa produkcja – jeszcze zanim jakikolwiek grafik dotknie tabletu.

Co sądzisz o tej technologii? Podziel się w komentarzach.

Powiązane posty