Wie KI unsere Werbewelt verändern wird – Teil 1
Am 26.4. fand das diesjährige Radio Advertising Summit in Köln statt. Ein Live-Event mit unterschiedlichen Akteuren aus der Radio‑, Audio und Werbebranche. Ein Panel beschäftigte sich damit, wie KI unsere Werbewelt verändern wird, denn in dieser hat die Verwendung von künstlicher Intelligenz (KI) in den letzten Jahren stark zugenommen. Teilnehmer dieses Panels war unter anderem Dr. Timo P. Kunz, Mitgründer des Softwareunternehmens Aflorithmic, der sich, gemeinsam mit einem weiteren Gründer, für ein Interview mit uns bereiterklärte.
Interview mit den Gründern von Aflorithmic
Aus diesem aktuellen Anlass sprechen wir im folgenden Interview mit zwei von drei Gründern von Aflorithmic Björn Ühss und Dr. Timo P. Kunz über ihre Erfahrungen mit der Verwendung von KI in der Audiowerbung. Aflorithmic ist der Erfinder von AudioStack, einer generativen KI-Infrastruktur, die eine neue Generation der Audioerstellung für Werbung, Video-Voiceover, Podcasting und Dynamic Audio (DCO) ermöglicht. So wird professionell klingendes Audio aus Text erstellt, einschließlich Musik und komplexer Audiotechnik. AudioStack verkürzt dabei die Audio-Produktionszyklen von Tagen oder Wochen auf Sekunden.
Die Audio-Branche hat das Tool von Aflorithmic zuletzt live auf dem Radio Advertising Summit erlebt. Was kann das Tool?
Dr. Timo P. Kunz: Wir haben unsere eigene Software dort mit der KI-Stimme S.A.R.A., die wir für die Omnicom entwickelt haben, vorgestellt. S.A.R.A. steht für Speech & Audio Realtime Automation und übersetzt in Sekunden eingegebene Texte in Audio, wie hier in der Demo zu sehen und hören ist:
Aflorithmic Co-founder and CEO Timo Kunz and Raphael Fix of Omnicom Media Group showcased the future of audio ads production at Radiozentrale’s #radioadvertisingsummit in #cologne. Check out the live demo here ➡️SOUND ON! pic.twitter.com/HMi2qq3qsb
— AudioStack (@aflorithmic) April 26, 2023
Björn Ühss: Uns geht es bei Aflorithmic darum, die komplette Wertschöpfungskette im Audio-Produktionsprozess abzudecken. Das beginnt mit dem Skript, das man dann in eine Form fusioniert, damit es sich gut mit synthetischen Stimmen verträgt. Wir decken dann den gesamten Prozess vom Arrangement über das Sounddesign bis hin zum Mastering mit unserer Software ab. Unsere Infrastruktur macht das mittlerweile in unter acht Sekunden.
Im letzten Jahr wurde eine Kooperation mit der Omnicom Media Group vorgestellt. Kunden dieser Agenturgruppe haben nun die Möglichkeit, Audioinhalte in Minutenschnelle über das Tool von Aflorithmic zu erstellen? Welche ersten Cases konnten hier generiert werden?
Dr. Timo P. Kunz: Unsere Entwicklung wird zunächst innerhalb der Agentur für Use Cases verwendet, um Showcases zu produzieren. Zusätzlich arbeiten wir an einer ersten Installation mit einem Einzelhändler. Das ist besonders spannend, weil das Tool in Echtzeit Abbinder oder Produktspezifikationen innerhalb eines Spots in wenigen Sekunden pro Filiale erstellen kann. Mithilfe von Schnittstellen lassen sich sogar automatisiert Daten im System hinterlegen, die dann das entsprechende Produkt in das Skript einbinden und produzieren.
Wird die Stimme dafür extra für den Kunden produziert oder wird eine bestehende Stimme genommen?
Dr. Timo P. Kunz: Für das beschriebene Einzelhandels-Projekt bauen wir wieder eine Stimme auf. Je größer die Marke, desto mehr Wert legt der Kunde darauf. Die Kampagnen, die wir bereits in den USA umgesetzt haben, greifen auch auf Standard-Stimmen aus dem System zurück. Diese sind zum jetzigen Zeitpunkt noch nicht übernutzt und werden gerne verwendet.
Björn Ühss: Es gibt aus meiner Sicht zwei große USPs für Kunden. Zum einen ist es für Kunden, die viele Produkte haben und diese in Spots testen möchten, mit einem natürlichen und nicht KI-basierten Produktionsprozess nur schwer abzubilden. Es gibt zu lange Vorlauf- und Produktionszeiten und die Spot-Erstellung ist letztendlich für den Kunden zu teuer. Hier hilft unsere Softwarelösung enorm. Des Weiteren bietet unsere Lösung Vorteile im Einzelhandel mit Filialbetrieben wie Fitnessstudios, Fastfoodketten, Automobilunternehmen. Kampagnen können so zum Beispiel in Sekundenschnelle auf die Geolocation individualisiert werden. Die Umsetzung ist immer kosteneffizient, weil man zu jeder Zeit im Spot noch etwas ändern kann.
Wie bekommen Kunden Zugang zu dieser Entwicklung?
Dr. Timo P. Kunz: Wir bieten entweder ein Lizenzmodell oder die Kunden können direkt projektbezogen auf uns zukommen und wir helfen bei der Erstellung der Spots. Unsere Lösung kann in bestehende Systeme integriert werden oder stand-alone funktionieren.
Es gibt bereits Tools zur Erstellung von lokalen Radiokampagnen. Worin unterscheidet sich das System von Aflorithmic zu diesen?
Dr. Timo P. Kunz: Um eine gute Spotqualität zu erhalten, muss die ganze Produktionskette, die in einem normalen Studio vorhanden ist, abgebildet sein. Musikelemente werden also abgemischt und nicht übereinandergelegt. Ein Call-to-Action in einem Spot muss anders mit Sound hinterlegt werden als ein Spotbestandteil in dem das Produkt vorgestellt wird.
Björn Ühss: Mir gefällt der Vergleich mit Musik immer gut. Es gibt sehr gute Musiker, aber die sind noch längst keine Weltstars. Es gibt einen guten Grund, warum Musiker sich mit Produzenten zusammenschließen. Gute Produzenten machen die Musik erfolgreich. Und so haben auch wir unsere Audio Produktions Engine entwickelt, welche alle Elemente End-to-End verbindet und am Schluss auch mastert und veredelt, für maximalen Hörgenuss. Hier nutzen wir unsere Audio-Mastering-Erfahrung, aber auch komplexe Algorithmen, die ein Tonstudio und Produzenten emulieren. Das ermöglicht, dass es im finalen Gesamtklang gut, stark und sehr hochwertig klingt.
Der Fokus liegt also auf der Soundproduktion. Wie sieht es mit der Texterstellung aus?
Dr. Timo P. Kunz: Bislang haben wir auf Basis von fertigen Templates gearbeitet. Bislang war das die beste Methode, um aus bestehenden Bausteinen ein Skript zu erstellen. Seit diesem Jahr hat sich das mit der Entwicklung von ChatGPT radikal geändert. Die Kunden erwarten nun, dass so ein System prompt schreiben kann.
Björn Ühss: Das geht natürlich nicht an uns vorbei. Die Unreife von ChatGPT besteht zum Beispiel darin, dass bestehende Systeme Skripte immer mit einer Frage beginnen. Das ist nicht immer optimal und sehr repetitiv. Auch ist die Spotlänge abhängig von der gewählten Stimme und der Länge des Skriptes. Diese Learnings wollen wir in unserem System ebenfalls abdecken. Generative Texterstellungsfunktionen, wie auch auf Audiowerbung zugeschnittene KI Modelle, stehen bei uns auf unserer Roadmap für dieses Jahr.
Fortsetzung folgt…
Weitere spannende Fragen und Antworten erwarten Sie nächsten Dienstag im zweiten Teil unseres Interviews. Denn wir wollen unter anderem herausfinden, ob KI den Einsatz von echten Stimmen langfristig gesehen ersetzen wird, welche Anwendungsbeispiele es von KI im Bereich Audio gibt und sich KI-basierte Werbekampagnen in Zukunft von herkömmlichen Kampagnen unterscheiden werden?
Seien Sie gespannt!
Über Aflorithmic
Aflorithmic Labs, Ltd ist ein Technologieunternehmen mit Sitz in London und Barcelona. Die api.audio Plattform ermöglicht eine vollautomatische, skalierbare Audioproduktion mit Hilfe von Text-to-Speech, Voice Cloning und KI-gesteuerter Nachbearbeitung. Die erstellten Audiodateien können dann u.A. auf Webseiten, Mobil-Apps oder Smartspeakern ausgespielt werden.
Mit diesem Audio-As-A-Service können Unternehmen hochwertig-klingende Audiodateien ohne irgendwelche Vorkenntnisse erstellen: angefangen von einfachem Text bis hin zu Sound-Design und komplexer Tontechnik.
Das Team besteht aus hoch qualifizierten Spezialisten für maschinelles Lernen, Softwareentwicklung, Sprachsynthese, KI-Forschung, Audiotechnik und Produktentwicklung.
Quellen: Beitragsbild via AdobeStock von vegefox.com, Logo und Bild von Aflorithmic
Schlagwörter
Neueste Artikel
- Die Online-Audio-Nutzung erreicht neue Höchstwerte
- Vorhang auf und Bühne frei für: BE4 Classic Rock
- Jubiläum – 25 Jahre BE4 Classic Rock
- #TechSimple – Mood Targeting
- STUDIO GONG mit noch größerer Sales-Power in NRW
- STUDIO GONG vermarktet die NEW AUDIO KOMBI NRW
- Newcomer im Fokus beim Deutschen Radiopreis 2024
- Entwicklungen der Musikindustrie
- Vorhang auf und Bühne frei für: charivari Regensburg
- Wie die Apple Vision Pro Audioerlebnisse schafft