Hier im Bild seht ihr Lydia, unsere neue Kollegin im Team der Beat, die euch und uns künftig begleiten, mit Tipps zu Seite stehen und ihr Fachwissen mit euch teilen wird. Und natürlich haben es einige schon bemerkt: Lydia ist ein KI-Avatar – und das führt zur berechtigten Frage: Warum kommt sie dann ins Team und warum sehen wir nicht die echten Redakteure der Beat? Die beiden Antworten darauf sind eigentlich ziemlich simpel ...

Antwort eins: Künstliche Intelligenz boomt
Beinah täglich kommen neue, vermeintlich schlaue KI-Helfer auf den Markt, die das Musiker- und Produzentenleben vereinfachen (wollen). In den aktuellen Beat-Ausgaben versorgen wir euch ja schon seit Anfang des Jahres mit Tests und Tutorials zu den derzeit angesagtesten Techniken. Und auch jene Tools, die Videos und Sound erstellen, worunter auch jene fallen, mit denen wir Lydia geschaffen haben. Sie ist sozusagen Ergebnis unserer Tests, Vorzeigeobjekt und Maskotchen zugleich – und wird sich im Laufe der Zeit sicherlich verändern, denn die Qualität der Apps wird schließlich immer besser.
Und Antwort Nummer zwei?
Ganz offen und ehrlich: Eine Lydia ist einfach viel sympathischer als eine Horde Studionerds, die ohnehin allesamt nicht gerne vor die Kamera treten. Und als wir dann die passenden Tools in den Händen hielten, fiel die Entscheidung entsprechend leicht, sich für eine virtuelle Unterstütztung auszusprechen. Eine Klappe mit zwei Fliegen sozusagen – oder so ähnlich. Kurzum: Von einer gut gelaunten und immer motivierten Expertin habt ihr garantiert mehr.
Die technischen Details: So entstand Lydia
Da wir aus Lydia’s Existenz kein Geheimnis machen, spielen wir konsequenterweise auch bei der Technik mit offenen Karten. Unsere “Kollegin” entstand in der Beta-Version 0.1 aus einer Kombination von Grok, Midjourney, Qwen und Gemini.

Eigentlich ist Grok unser aktuelles To-Go-Tool, wenn’s um Grafiken geht. Die KI ist zurzeit beinah unschlagbar, wenn es um kreativen Output geht. Allerdings sorgen Experimente des Herstellers xXAI mit Grok’s Imagine-Algorithmus aktuell für eher maue Grafiken, daher musste Grok uns stattdessen einen Prompt zur Überarbeitung in Midjourney sowie ein Videoscript zum Animieren liefern. Midjourney lieferte sofort eine gute Grafik, mit Qwen zauberten wir Lydia Gear in die Hände und Gemini’s VEO erzeugte das erste – schon sehr beeindruckende – Kurzvideo.
Ab diesem Stadium versuchten wir uns auch an anderen Tools wie Hey Gen und Eleven Labs, konnten allerdings mit keinem davon auch nur halbwegs authentische Videos oder Stimmen erzeugen – obwohl die Tools gerade da eigentlich stark sind. Aber alles klang unmotiviert und fahl. Gerade so, als hätte man die neue Praktikantin zum Vorlesen eines Textes aus dem Gesetzbuch verdonnert.
Version 1.0 von Lydia ging dann schnell
Die vorige Basis von Midjourney wurde mit dem Skin-Tool von Enhancor mit ihrem V8-Algorithmus (manchmal liefert hier sogar der günstigere Fast-Mode das bessere Ergebnis) um eine deutlich realistischere Optik erweitert und zum Kombinieren des KI-Avatars mit Musik-Gear verwendeten wir nun auch Gemini’s Nano Banana, um abschließend mit VEO 3.1 wieder ein Video zu erzeugen. Das Ergebnis seht hier im YouTube Short:
Falls ihr auch mal einen Avatar bauen wollt, aber aufs Budget achten müsst, haben wir eine gute Nachricht: Mit Ausnahme des Skin-Tools sind alle Techniken kostenlos und frei verfügbar. Wobei selbst der BASIC-Account bei Enhancor lediglich 12 Euro kostet.
Die einzige Grenze stellen die Nutzungslimits der einzelnen KI’s da. So ist bei Grok das Erzeugen von Grafiken auf 50 pro Tage limitiert oder die Video-Generierung mit VEO auf drei pro Tag. Das sind aber zu verschmerzende bzw. tragbare Grenzen und Kosten, finden wir.
Wie geht's weiter?
Einerseits werdet ihr von Lydia in Zukunft öfter bei der Beat sehen, andererseits werden wir auch abseits von Video-Avataren weiterhin in unserer festen KI-Rubrik im Heft die neusten KI-Tool für euch testen – wie beispielsweise Julians neuster Artikel und Workshop zur DAW Luna von Universal Audio, die jetzt auch KI-Features on board bietet, sowie Mario's Test der schlauen Tools in iZotope's Ozone und SoundID's VoiceAI in Beat-Ausgabe 01/26.
So seid ihr stets informiert, welche Tools was können und für euch taugen, damit am Ende des Tages auch mehr gute Musik dabei rauskommt!

