KI in der Produktion
Die Technologie der Künstlichen Intelligenz reift rasant, auch für den Einsatz in der Film- und TV-Produktion. Spätestens nächstes Jahr, ist sich Albert Bozesan von Storybook Studios sicher, werden wir Filme in Kinoqualität erleben, deren Pixel zu 80 Prozent KI generiert wurden.
Text: Albert Bozesan
Im Juli rauschte eine Schlagzeile wie ein Tsunami durch die Filmbranche: Der Netflix-Geschäftsführer Ted Sarandos gab zu, dass Sequenzen ihrer Original Series „El Eternauta“ mithilfe von Künstlicher Intelligenz (KI) entstanden waren. Doch das sei keine reine Sparmaßnahme. Die Szenen wären ohne KI nicht einfach teurer gewesen, sondern gar nicht erst im Budget. Unser Team bei Storybook Studios ist von dieser Meldung nicht überrascht gewesen. Als "AI-First"-Produktionsfirma investieren wir in die Entwicklung konkreter Anwendungen, mit denen KI enorme Möglichkeiten in der Filmlandschaft eröffnen wird. 2023 wurde das noch skeptisch belächelt. Inzwischen ist allen klar, dass KI mindestens nützlich ist. Doch ist sie wirklich so revolutionär, wie Tech-Startups behaupten? Was kann sie tatsächlich, was nicht, und wie wird sich das noch entwickeln?
„Control“ und „Consistency“ beim KI-Einsatz
Fangen wir bei „nützlich“ an. Der Einsatz bei Netflix war eine ausgereifte Alternative zu sonst teuren Spezialeffekten, in diesem Fall ein Gebäudeeinsturz. Mit 3D-Grafik erfordert so etwas eine ganze Reihe aufwändiger Schritte: Nicht nur das Äußere, sondern auch das Innenleben des Gebäudes müssen detailreich modelliert, texturiert und ausgeleuchtet werden, damit sie bei der anschließenden physikalischen Simulation realistisch auseinanderbrechen und fallen können. Der Prozess dauert Tage, wenn nicht sogar Wochen. Mit KI benötigt man lediglich ein Ausgangsbild des Gebäudes (den „First Frame“), und eine Beschreibung, wie es einzustürzen hat. Ein gutes Resultat könnte zwar ein paar Anläufe brauchen, aber innerhalb weniger Minuten stehen mehrere Optionen bereit. Das klingt sehr einfach. Wieso sollte man das nun nicht für alle Einstellungen nutzen und die Handarbeit ganz abschaffen? Hier kommen die zwei großen Fragezeichen der KI ins Spiel: „Control“ und „Consistency“. Control beschreibt, wieviel Einfluss Kreative auf das Bild haben können. Mit genügend Zeit und Geld kann ein 3D-Render pixelgenau neu gerechnet werden, bis jeder Backstein nach dem Einsturz dort liegt, wo die Regie ihn haben will. Eine aktuelle KI-Videogenerierung lässt sich nur im Ausgangsbild, danach maximal durch grobe Richtungsvorgaben, steuern. Zeit und Geld hat hierauf nur minimalen Einfluss. Alle Änderungen im Nachhinein sind wieder die Aufgabe talentierter VFX-Teams. „Consistency“, also Einheitlichkeit, beschreibt die Veränderung von Details zwischen zwei Einstellungen. Wenn man besagtes Hochhaus erst in einer Totale, dann in einer Detailaufnahme hätte zeigen wollen, wären es in 3D wenige Klicks. Doch KI versteht Kontext innerhalb einer Szene nicht ohne Hilfe und muss deshalb, vereinfacht gesagt, alles völlig neu generieren. Das kann sie schnell und günstig – potenziell jedoch mit kleinen Fehlern.
Teure Effekte sind für KI ein Leichtes
Der aktuelle Schlüssel in der Zusammenarbeit mit KI ist es deshalb, mit einer möglichst flexiblen und lösungsorientierten Regie zu arbeiten. So entstand zum Beispiel DAISY, ein KI-basierter Horrorkurzfilm von Peter Thorwarth und Sebastian Ungrad. Um die damaligen Limitierungen der KI für uns zu nutzen, schrieb Thorwarth sein Drehbuch rund um ein Team aus Höhlenforscherinnen und -forschern, das in einem durchfluteten Tunnelsystem von einem Monster gejagt wird. Höhlenwände mussten nicht in jeder Einstellung identisch aussehen, und normalerweise teure Effekte wie Wasser und Monster sind für unsere KI-Systeme ein Leichtes. Darüber hinaus nahmen wir die Stimmen von drei echten Schauspielern und Schauspielerinnen auf, die den Film am Stück in unserem Büro kostüm- und maskenlos durchspielten. Es bleibt nämlich viel einfacher, echte Emotionen aufzuzeichnen, anstatt vor einem PC wiederholt auf „Generieren“ zu klicken und auf eine gute KI-Performance zu hoffen. Bei Genres wie DAISYs Horror oder etwa Science-Fiction bietet es sich an, die Bilderwelt gänzlich zu generieren. Doch wie sieht es aus, wenn man seine Schauspielerinnen und Schauspieler weiterhin vor die Kamera stellen möchte? Ist KI vielleicht eine Alternative zu den LED-Hintergründen der Virtual Production, die in Deutschland teuer unter anderem bei „1899“ und „The Crow“ zum Einsatz kamen? Der Ansatz ist da. Mit nur einer Kamera, dem Chiemsee und einer Prise KI gelang es einer Crew aus nur vier Personen, im August einen Piratenkurzfilm umzusetzen, mitsamt Schiff, exotischen Tieren und den dramatischen Wellen des Ozeans.
Qualität der Story und Cast sind das Entscheidende
Spätestens nächstes Jahr werden wir Filme in Kinoqualität erleben, deren Pixel zu 80% KI-generiert wurden. Die Technologie reift rasant. Es wäre ein fataler Fehler, den Umgang mit ihr nicht zu lernen. Das Einzige, was Produktionen in Zukunft hervorheben wird, ist die Qualität der Story und der Cast. Reicht das? Der mehrfache Oscarpreisträger Daniel Kwan ermunterte ein von KI verängstigtes Publikum so: „Ich möchte euch eure Macht zurückgeben und euch daran erinnern, dass ihr die Experten und Expertinnen eurer Branche seid.“ KI-Techunternehmen hätten hier zwar interessante Werkzeuge erfunden, doch die Fähigkeit für packendes Storytelling läge weiterhin bei den Filmschaffenden. Die Schlussfolgerung liegt nahe: Am Ende werden nicht die Maschinen entscheiden, welche Filme uns bewegen – das können nur die Menschen, die sie nutzen.