KI-generierte Videos im Praxistest: Text-zu-Video leicht gemacht

Videocontent ist heute gefragter denn je. Die aufkommenden KI-Videogeneratoren versprechen professionelle Videos in kürzester Zeit: Die Präsentation des Unternehmens auf der Website, originelle Werbevideos auf Social Media oder Erklärvideos auf YouTube – Und das alles ohne Budget, Bühne und Kamerateam! Doch wie nutzt man sie und überzeugt das Ergebnis am Ende auch? Ein Selbstversuch.

Im Rahmen einer Aufgabe habe ich mich zum ersten Mal an einen Text-zu-Video Generatoren mit künstlicher Intelligenz gewagt. Ich war überrascht wie schnell und einfach ein starkes Video entsteht. Hier findet Ihr die Erfahrungen, Tipps und das Fazit aus meinem Selbstversuch.

Das mit dem KI-Videogeneratoren pictory.ai erstellte Video zum Thema «Erfolgreiche Digitalisierung» von Alexandra Nussbaumer (in Englisch)

 

Was kann ein KI-Videogenerator für mich tun?

Ein KI-Text-zu-Video-Generator kann aus einem eingegebenen Text in kurzer Zeit ein Videoplot aus Katalogvideos erstellen mit dem Du auf Deiner Webpage oder den sozialen Medien deine Unternehmung, Dein Produkt oder Dein Projekt vorstellen kannst.

Falls Du bereits selbst Aufnahmen gemacht hast, kannst Du diese hochladen und sie durch den Videogenerator schneiden, optimieren oder mit Untertiteln ergänzen lassen.

Wenn gewünscht, kannst Du bei einigen Anbietern einen Avatar erstellen und ihn in einem Erklärvideo zu den Zuschauern oder Nutzern sprechen lassen.

 

Wie wende ich einen Text-zu-Video Generator an?

In meinem Selbstversuch habe ich mit pictory.ai gearbeitet. Dieser Service ist zwar nur in Englisch verfügbar, aber sehr einfach zu bedienen und er kann 14 Tage kostenlos getestet werden.

Nach der Erstellung des Kontos wird eine Vorlage gewählt, deren Stil zum Thema des Videos passt. Die Styles sind vielfältig und bieten von der Geschäftspräsentation bis zum Mini-Werbespot für Familien alles.

Als nächstes wird eine Story eingegeben – Pro Filmsequenz ein Absatz. Anhand dieser Story sucht der Video-Generator sinnvolle Videosequenzen aus und stellt sie zusammen. Je nachdem wie klar die vorgegebene Story ist, sind hier bereits geeignete Aufnahmen vorhanden. Mit der Suchfunktion können die noch unpassenden Filme ersetzt werden.

Die Story ist als Text auf der Sequenz sichtbar. Sie kann nach Zusammenstellung des Films angepasst oder auch ganz ausgeblendet werden. Es besteht die Möglichkeit die Story vortragen zu lassen. Sie wird flüssig und mit sinnvoller Betonung vorgelesen. Alternativ kann der zusammengestellte Film mit Musik hinterlegt werden.

Logos werden bei Bedarf vor dem Herunterladen des Filmes ergänzt.

 

Wie finde ich den passenden KI-Videogeneratoren für mich?

Es gibt bereits unzählige solcher Videogeneratoren, die sich jedoch erheblich unterscheiden im Angebot, der Funktionalität, der Anwendung und den Businessmodellen. Der Markt ist noch jung und es gibt kaum Empfehlungen aus den allseits bekannten Online-Magazinen.

In den Blogbeiträgen zum Thema (z.B. «Die 10 besten KI-Videogeneratoren 2023» von Blogmojo) werden aber vermehrt Pictory, InVideo, Synthesia und Lumen5 empfohlen.

 

6 wichtige Tipps um rasch ein professionelles Video zu erstellen

  • Überlege Dir zuerst genau, was das Ziel deines KI-generierten Videos sein soll. Was soll es repräsentieren? Für wen ist es gedacht? Welche Stimmung soll es vermitteln?
  • Verschaffe Dir zuerst einen Überblick um das richtige Angebot für Dich zu finden.
  • Schreibe die Story nieder, bevor Du beginnst.
  • Verwende fachspezifische statt verallgemeinernde Worte.
  • Notiere Dir treffende Synonyme (auch in Englisch) um die Videoauswahl weiter zu optimieren.
  • Vergiss nicht zur Transparenz anzugeben, mit welcher KI das Video erstellt wurde.

 

Fazit

Willst Du ein Video das inhaltlich korrekt ist, ist eine saubere Story das A und O. Die getesteten KI-Videogeneratoren Pictory und InVideo haben beide mit iStock und Getty Images gearbeitet – also bestehendes Stockvideomaterial verwendet und nicht selbst Videos kreiert. Text-to-Video (T2V) steckt hier im Vergleich zu Text-to-Images (T2I) noch in den Kinderschuhen – Die Generation mehrerer Bilder pro Sekunde mit Übergängen setzt viel Zeit und höchste Leistungsfähigkeit voraus (Peters, 2023).

Die vom Generatoren vorgeschlagenen Videos waren etwa zur Hälfte passend zum vorgegebenen Text. Die Restlichen waren ungenau – z.B. wurde im Test beim intra-oral Scan eine Röntgenaufnahme anstatt eines 3D Scans gezeigt. Passendere Sequenzen zu suchen hat Zeit gekostet. Da der Rest der Arbeit sehr einfach war und schnell ging, dauerte die Erstellung des Videos etwa zwei Stunden. Die Aussage, dass innert Minuten perfekte Videos erstellt werden können, ist theoretisch korrekt – Aber hinsichtlich des Resultates irreführend. Dennoch ist die Erstellung der Videos sehr einfach und auch Laien können in kurzer Zeit professionell wirkenden Videocontent erstellen.

Beitrag teilen

Alexandra Nussbaumer

Alexandra Nussbaumer ist Informatikerin Digitalisierung bei einer öffentlichen Verwaltung und bloggt aus dem Unterricht des CAS Digital Architect. Um optimale Lösungen zu finden ist es ihr wichtig jeweils die betroffenen Menschen, die zu optimierenden Prozesse und die verfügbaren Tools mit einzubeziehen. Mit Neugier die neuesten technischen Errungenschaften zu testen ist die beste Möglichkeit ihren Nutzen, ihre Anforderungen und ihre Limitationen zu entdecken und ihr Potential beim Einsatz im Firmenalltag zu erkennen.

Alle Beiträge ansehen von Alexandra Nussbaumer →

Schreibe einen Kommentar