Ich ging mit einem einzigen Prompt rein. Ich kam mit einem Produkt raus.
Wie ein Zwölf-Panel-Comic über Tirols Energiezukunft zum Anfang von Memolio wurde.
Vor ein paar Monaten habe ich beim Comic-Wettbewerb Tirol 2050 mitgemacht. Die Aufgabe war einfach: Zeig deine Vision für Tirols Energiezukunft. Ich habe mich mit einer Idee hingesetzt und wollte sie in einem einzigen Bild umsetzen.
Am Ende hatte ich einen Zwölf-Panel-Comic. Kurz danach saß ich an Memolio.

Diese Woche habe ich erfahren, dass er einen Preis gewonnen hat. Danke an Tirol 2050 fürs Auswählen, und danke an Gloryfy für die (angeblich) unzerstörbare Sonnenbrille, die mit dem Gewinn kam. Als notorisch chaotische und unordentliche Person bin ich fest entschlossen, sie auf die Probe zu stellen.
Ich möchte über das reden, was zwischen „ich setze mich hin und mache ein einzelnes Bild“ und „am Ende sitze ich vor einer Sequenz“ passiert ist, weil ich glaube, dass es ein Muster ist, das einen Namen verdient.
Der ursprüngliche Prompt war schon ziemlich voll. Ein älterer Mann in Tracht. Kinder zu seinen Füßen. Eine retrofuturistische Farbpalette der 1950er. Solarpaneele auf Tiroler Bauernhöfen. Ich habe alles eingegeben und ein vollkommen kompetentes Bild zurückbekommen. Es war okay. Es war auch flach.
Was fehlte, war keine Qualität. Tracht und Solarpaneele rendert das Modell problemlos. Was fehlte, war Bedeutung. Das Bild sagte nichts. Es hatte keinen Anfang und kein Ende. Es wurde keine Frage gestellt und keine Antwort gegeben. Es war einfach ein Tableau.
Also habe ich ein zweites Panel hinzugefügt. Dann ein drittes. Dann habe ich weitergemacht. Am Ende waren es zwölf. Elektrobusse und Straßenbahnen, die durch grüne Stadtstraßen rollen. Seilbahnen, die vom Stadtzentrum bis zu den Berggipfeln hinauffahren. Bergdörfer, die wieder lebendig sind, weil Energie fast gratis ist. Kühe, die im Schatten von Solarpaneelen ruhen. Strom, der fast gratis fließt, wie Wasser aus einer Bergquelle. Wasser, das im Sommer in Stauseen gepumpt wird, damit Familien im Winter mit ihren Liebsten kuscheln können. Elf Panels geduldigen Aufbaus. Dann das zwölfte: Ein kleines Kind sieht zum alten Mann hoch und fragt: „Aber warum habt ihr das gemacht?“ Und der alte Mann antwortet: „Warum? Warum nicht?“
Dieser letzte Wortwechsel ist der ganze Punkt des Comics. Es gibt kein einziges Bild auf der Welt, das ihn enthalten kann. Die Frage trifft nur, weil elf Panels die Welt schon gemalt haben, über die die Frage gestellt wird. Die Antwort trifft nur, weil dir der alte Mann schon ans Herz gewachsen ist. Man braucht den Aufbau, die Pause, dann die Pointe.
Genau hier hatte ich eine leise Erkenntnis, die die letzten sechs Monate meines Lebens geprägt hat.
Einzelne Prompts sind ein One-Frame-Medium. Sie können schön sein, eindrucksvoll, manchmal verblüffend. Aber sie können strukturell keinen Bogen tragen. Das Modell weiß nicht, was davor war, und nicht, was danach kommt. Der Betrachter muss die ganze redaktionelle Arbeit im Kopf machen, und die meisten machen das nicht.
Erzählung ist die Lösung. Eine Handvoll Bilder und eine Handvoll Worte in Folge können, was keine einzelne Generierung kann. Sie können eine Frage über einen Takt halten und dann beantworten. Sie können ein Gesicht über mehrere Seiten altern lassen. Sie können einen Großvater erst Kind sein lassen, bevor er Großvater von irgendjemandem ist.
Nach dem Wettbewerb habe ich angefangen zu skizzieren, was später Memolio wurde: ein Workflow, der das Leben eines Großelternteils in ein illustriertes Buch verwandelt. Das Produkt steht auf derselben Einsicht wie dieser Zwölf-Panel-Comic. Es geht nicht darum, schöne einzelne Bilder zu erzeugen, auch wenn es das nebenbei tut. Es geht darum, sie zu einer Geschichte zu verbinden, die für eine ganz bestimmte Familie etwas bedeutet.
Tirol 2050 war ein Wettbewerb über erneuerbare Energie. Die Lektion, die ich mitgenommen habe, war eine andere und für das, was ich baue, nützlicher: KI wird in dem Moment interessant, in dem man aufhört, sie um ein Bild zu bitten, und anfängt, sie um eine Geschichte zu bitten. Der Output ist nicht mehr etwas, das man anschaut. Es ist etwas, das man liest.
Diese Verschiebung, vom Anschauen zum Lesen, ist das ganze Spiel.


