Seit November 2022 erobert Künstliche Intelligenz die Welt im Sturm und macht auch vor der Medienbranche keinen Halt. Ein Wettrennen der großen Player beginnt, jeder versucht der erste in einem neuen Markt zu sein. Fast zwei Jahre später hat jede namenhafte Software mit Anwendung in der Postproduktion „KI“ Features, unzählige weitere sollen folgen.
Doch im Alltag der Postproduktion hat sich wenig geändert. Nicht weil die KI-Features unbrauchbar sind, sondern weil es die meisten schon seit Jahren gibt… nur unter anderem Namen: Machine Learning. Was hat es mit diesem Begriff auf sich? Wie machen sich Software-Anbieter ihn zu eigen – und wo sind dann die „echten“ KI-Features, von denen alle reden?
Machine Learning - die „langweilige“ Künstliche Intelligenz
Machine Learning (deutsch: Maschinelles Lernen) steht nicht im Gegensatz zu Künstlicher Intelligenz, sondern ist vielmehr ein Bereich des Überbegriffs „KI“. Während KI danach strebt, einer Maschine menschliche Intelligenz zur Problemlösung zu verleihen, ist das Ziel von Machine Learning eine spezifische Aufgabe zu lernen und, anhand des Erkennens von Mustern in Datensätzen, so präzise wie möglich zu lösen.
Dieser Ansatz ist ein Konzept an dem bereits seit den 1950er Jahren geforscht wird und das bereits lange vor Chatbots und persönlichen Assistenten zur Anwendung kam. In der Postproduktion unterstützt Machine Learning beim Skalieren von Bildmaterial, dem erkennen von Gesichtern in Aufnahmen, oder etwa Objekterkennung- und Tracking. Aufgaben die sich zwar nicht besonders spannend anhören, aber sehr zeitintensiv sind.

Als Beispiel ein Problem, dass die meisten in der Postproduktion kennen werden: Der Film ist fertig geschnitten, da fällt im Hintergrund eine Person auf, für die es keine Aufnahmegenehmigung gibt. Die Lösung ist, das Gesicht zu verpixeln. In der Vergangenheit musste das Gesicht maskiert und mit Keyframes die Bewegung nachverfolgt werden. Ein perfekter Anwendungsfall für Machine Learning! Das Netzwerk wird mit einer großen Menge an Bildmaterial, das Gesichter enthält, trainiert, bis es in der Lage ist, diese eigenständig und zuverlässig zu erkennen. Auch menschliche Bewegung beinhaltet viele Muster, welche dem Netzwerk antrainiert werden können.
Das Ergebnis: Ein Tool wie BCC+ Witness Protection ML, das mit einem Knopfdruck alle Gesichter erkennt, trackt und maskiert. Fertig!
Machine Learning könnte also auch als die Mitarbeiterin bezeichnet werden, die die langweiligen, repetitiven Aufgaben übernimmt, während das gehobene Establishment „KI“ sich lieber mit philosophischen und mondänen Aufgaben beschäftigt; und leider ist Postproduktion neben kreativem Schnitt und Konzeption oft sehr viel repetitive, monotone Arbeit.
Wie aus Machine Learning KI wurde
Machine Learning ist also ein sehr etablierter Helfer in der Postproduktion, sogar schon weit bevor der Hype um AI und KI so groß wurde. Da sich „Künstliche Intelligenz“ aber wesentlich besser vermarkten lässt und niemand den Hype auslassen möchte, unterging die gesamte Branche den letzten Jahren einem riesigen re-branding. Jedes Feature, das auch nur annähernd etwas mit Neuralen Netzwerken und Machinellem lernen zu tun hat, ist jetzt ein:
✨ BRAND NEW AI FEATURE ✨
Was die meisten aber unter KI verstehen, oder erwarten, wenn sie hören, dass ein neues KI-Feature veröffentlicht werden soll, ist jedoch generative KI. Hiermit werden KI-Anwendungen beschrieben, die nach Eingabe einer Anweisung neuen Output kreieren; z.B. in Text-, Bild- oder Videoform. Das steht im Gegensatz zu herkömmlichen Machine Learning, dessen Anwendungsgebiet die Manipulation von bestehendem Material ist. Generative KI ist definitiv beeindruckend, aber auch wesentlich komplizierten und steckt zu großen Teilen noch in den Kinderschuhen. Die Text-zu-Video-Anwendungen der großen Player wie Google, OpenAI und Meta bleiben der Öffentlichkeit noch größtenteils vorenthalten, sind nach eigenen Aussagen noch nicht marktreif. Die Ergebnisse der bereits öffentlichen Video-KI Modelle wie RunwayML lassen qualitativ stark zu wünschen übrig. Außerdem ist es auf Grund rechtlicher Hürden und mangelnder Verlässlichkeit schwierig sie in professionelle Workflows einzubinden.

Wo sind sie dann, die “echten” KI-Features?
Um die Ecke, aber eben noch nicht hier. Ein Großteil der als KI angepriesenen Neuerungen, sind Machine Learning Feature, die sich schon seit Jahren bewährt haben, aber für den Marketing Hype von KI ein Rebranding erlebt haben. Echte Neuerungen wie Generative KI, also etwa das Erweitern einer Videoaufnahme, oder das Generieren von Aufnahmen von Text, werden erst in den nächsten Jahren Anwendung finden, dafür stehen sie jetzt noch vor zu vielen Problemen.
Anfang der Woche durften wir an einem Vortrag von Adobe (Premiere Pro, After Effects) zu ihrer Vision von generativer KI teilnehmen. Für die nahe Zukunft versprechen sie das Erstellen von B-Roll aus Text-Befehlen oder Bildern, direkt in der Schnittsoftware. Das Feature sieht sehr vielversprechend aus, ist aber noch in der Testphase.
Ist KI in der Postproduktion also nur ein Marketing Trick?
Es könnte schon gesagt werden, dass es sich bei KI in der Postproduktion mehr um einen Marketing Trick handelt als eine neue Erfindung. Zumindest bisher und in dem Rahmen, in dem KI vermarktet wird. In der Postproduktion werden bereits seit Jahren viele Tools genutzt, die dank Machine Learning repetitive Aufgaben erleichtern, etwa das Tracken, Keying und Sortieren von Videomaterial. Machine Learning fällt zwar unter das Thema KI, doch mit dem Hype um generative KI, der die letzten Jahre aufgekommen ist, haben diese Anwendungen noch wenig zu tun. Erste Versuche mit Text-to-Video und ähnlichen KI-Modellen zeigen, dass das Ganze noch nicht spruchreif ist. Aber: Lange wird es nicht mehr dauern, dann werden auch generative Tools den Einzug in die Welt der Postproduktion halten, das ist sicher.