AI & Creativity – #4: 
Use cases, Ideen und Konzepte von Netgen

von Dennis Oswald -

Bei Netgen experimentieren wir laufend mit neuen KI-Tools. Wir wollen herausfinden, welche Auswirkungen und Herausforderungen sie für unsere Mitarbeiter:innen mit sich bringen und was das für unsere Kund:innen bedeutet.

In diesem Blogbeitrag stellen wir einige KI-Anwendungsfälle vor, an denen wir kürzlich gearbeitet haben. Wir möchten die Konzepte, Gedanken sowie Erkenntnisse teilen, wie wir Arbeitsabläufe durch KI verbessert und automatisiert haben.

Vorab möchte ich darauf hinweisen, dass sich die von uns verwendeten KI-Tools schnell verändern und weiterentwickeln und nachfolgend eine Einschätzung zur erwarteten Entwicklung geben:

Die erste Phase der KI-Werkzeuge des fast reinen, spielerischen Erkundens von KI-Werkzeugen und ihren Fähigkeiten für meist unterhaltsame Spassprojekte und Anwendungen ist bereits in die zweite Phase übergegangen. Diese beinhaltet die Steuerung von Outputs innerhalb einzelner KI-Werkzeuge und ebnet den Weg direkt zur dritten Phase: Automatisierungsstandards und Verknüpfung mehrerer KI-Werkzeuge zur Beschleunigung von Arbeitsabläufen.

Im letzten Schritt wird dies zu Phase vier führen, in der autonome Systeme in Zukunft ohne direkten menschlichen Input selbstständig arbeiten werden.

NetgenCH_Evo_AItools_2024_DennisOswald

Auch wenn autonome KI-Agenten noch nicht verfügbar sind, wollen wir einen Einblick geben, wie die ersten drei Phasen angewandt wurden: Wir haben kontrollierte Ergebnisse mit automatisierten Arbeitsabläufen kombiniert, um kreative Gedanken, Ideen und Konzepte zu entwickeln. Dies um folgende konkrete Projektbeispiele zu realisieren:

1. Automatisierte und vernetzte Arbeitsabläufe mit KI-Agenten

Die Fähigkeiten und die Konnektivität der Systeme nehmen zu. Dies bedeutet, dass immer mehr Arbeitsprozesse mit Hilfe von KI verbunden und automatisiert werden können. Die Verbesserungen bringen uns Schritt für Schritt näher an die AGI (Artificial General Intelligence) heran. Die kommenden autonomen KI-Agenten werden in Zukunft Aufgaben selbstständig lösen.

IMG_05_01

«Die KI automatisiert bereits die Erstellung von Inhalten, und wird dies in Zukunft auch autonom tun.» 

Amar Delić, AI geek & Senior IT project manager, Netgen Switzerland

Amar Delić, unser KI-Geek und leitender IT-Manager bei Netgen Switzerland, weist bereits mehreren Agenten und Modellen Teilaufgaben zu und verknüpft sie miteinander, um die vorgegebene Hauptaufgabe (automatisch) zu lösen.

2. "AI minutes", der KI-generierte KI Podcast

Idee

Unser KI-Explorer Dennis Oswald und der KI-Experte Amar Delic haben ihre Köpfe zusammengesteckt, um einen AI-generierten Podcast zu realisieren. Sie konzipierten, gestalteten und entwickelten, wobei sie, wo immer es möglich war, KI-Tools einsetzten – vom Konzept über die Namensgebung, die visuellen Elemente und die Textbausteine bis hin zur präsentierenden Stimme.

Das Ergebnis ist AI minutes – einer der ersten KI-generierten KI-Podcasts in der Schweiz, zusammengestellt und gesprochen von einer KI-Moderatorin.

Konzept

Für den Austausch und die Entwicklung von Ideen beschlossen wir, ein internes, angepasstes GPT (OpenAI) einzurichten und es entsprechend seiner Rolle als Sparringspartner bei der Erstellung eines Audio-Podcasts zu "briefen":

  • Die Konzeption des Podcasts an sich und der dazugehörigen Episodenstruktur
  • Die Entwicklung der Textbausteine, z.B. Intro, Outro, Boilerplate und Entwürfe für Social-Media-Posts
  • Die Namensgebung, die im Dialog mit ChatGPT/GPT vorangetrieben und ausgearbeitet wurde
  • Aufforderung zur Eingabe (Prompt engineering) in andere KI-Tools, z.B. zur Generierung visueller Elemente oder Töne (Text-zu-Bild; Text-zu-Ton)
IMG_05_03

Erscheinungsbild

Die ersten Bilder für das spätere Key Visual entstanden direkt im Dialog mit dem GPT. Basierend auf ihrem visuellen Stil und dem Inhalt der Aufforderung wurde die Arbeit in Midjourney fortgesetzt. Die grösste Herausforderung neben der Erstellung des Bildmaterials ist die schiere Anzahl der Varianten, die durch kleine Änderungen in der Aufforderung schnell aus dem Ruder laufen können.

IMG_05_04

Stimme & Klang

Die Stimme, das zentrale Element des Audio-Podcasts, wurde mit dem Text-2-Speech-Tool von Elevenlabs erstellt. Hier und da bricht sie – Lily – in Artefakte des Deutschen aus, vor allem bei längeren Textpassagen oder englischen Begriffen. Die neue Hörbuchlösung "Projects" (beta) von Elevenlabs verspricht, hier in Zukunft Abhilfe zu schaffen.

Für die Hintergrundmusik wurde das Text-to-Sound-Tool waveformer mit dem MusicGen-Modell auf Replicate verwendet.

Implementierung & API

Der spannendste Schritt bei der Erstellung des Podcasts ist die Automatisierung und Koordination zwischen den verschiedenen KI-Tools. Die Wahl fiel auf Python und Streamlit für die grafische Benutzeroberfläche (GUI).

Das Ziel ist es, so viele Schritte wie möglich zu automatisieren und gleichzeitig menschliche Eingriffe an den kritischsten Stellen zu ermöglichen. Im Moment wird der Inhalt einer Episode (noch manuell) über GoogleSheet erfasst und importiert.

Die Sprache der Quelle spielt bei der Erstellung des Episodentranskripts keine Rolle mehr. Die Audiodatei mit der ausgewählten Stimme wird automatisch über die API-Verbindung erzeugt, ebenso wie die Hintergrundmusik im nächsten Schritt.

IMG_05_05

Unser Tool lässt sich über die grafische Benutzeroberfläche konfigurieren und kann die verschiedenen Agenten steuern, die bei der Erstellung des Podcasts zusammenarbeiten. Der interne Arbeitsablauf ist wie folgt:

  • Konfiguration von Parametern und Diensten (APIs)
  • Scraping der einzelnen Nachrichtentexte und Aufbereitung
  • Generierung des Podcast-Episodentextes mit dem OpenAI GPT4 Turbo-Modell über die API
  • Sprachsynthese des Podcasts über die ElevenLabs-API mit der ausgewählten Stimme
  • Abmischen von Stimme und Hintergrundmusik mit generiertem Podcast und Pegelanpassungen
IMG_05_06

Wer sich für weitere technische Details interessiert, kann sich gerne an unseren AI-Geek Amar Delić wenden.

Fazit

Der Audio-Podcast AI minuten ist ein relativ kleines Testprojekt für Netgen Switzerland. Es zeigt aber das enorme Potenzial von kontrollierten und automatisierten KI-Prozessen in der Zukunft.

  • Die Kosten für künstlich erzeugte Inhalte werden sinken, und die sich daraus ergebenden Möglichkeiten werden die sich überschneidenden Bereiche verändern.
  • Automatisierte, umfassende Recherchen und Zusammenfassungen – ob Text, Ton, Bild oder Video in beliebiger Länge und Qualität.
  • Sprache als Input oder Output ist kein Hindernis mehr und kann angepasst und skaliert werden.
  • Andere KI-Tools können angebunden werden, z.B. zur Nachbearbeitung oder Verteilung.
  • Der Prozess ist auf andere Disziplinen, Medien und Arbeitsabläufe übertragbar.

Auch wenn menschliches Eingreifen und Überprüfen hier und da erforderlich und auch erwünscht sind, zeigt sich, dass durch die rasante Weiterentwicklung der KI-Werkzeuge immer mehr Aufgaben automatisiert werden können. Es bleibt also die Frage, die wir als Gesellschaft und als Individuen für uns selbst beantworten müssen: Wenn es keine Grenzen des technisch Machbaren mehr gibt, wo liegen dann die Grenzen des gesellschaftlich und moralisch Akzeptablen?

3. KI-Plugin für CMS

Alle unsere Websites sind CMS-basiert, damit die Ersteller die Flexibilität haben, die Seitenelemente und Inhalte unabhängig von uns zu ändern, zu übersetzen und zu aktualisieren.

Insbesondere für unsere Schweizer Kund:innen sind mehrsprachige Websites aufgrund der vier Landessprachen (Deutsch, Französisch, Italienisch und Rätoromanisch) ein Muss. Hinzu kommt, dass der Inhalt eines Artikels zum Beispiel oft aus mehreren Quellen oder sogar von Autoren in verschiedenen Sprachen stammt.

Deshalb haben wir ein Plugin für das Ibexa CMS entwickelt, das die nahtlose Integration von KI in die Erstellung und Pflege von Inhalten ermöglicht.

Mit dem Netgen-Plugin kann man:

  • automatisch Text-zu-Inhalt zu generieren
  • andere Felder als Quelle für die Inhaltsgenerierung abrufen
  • Bilder auf der Grundlage der eingegebenen Inhalte generieren
  • Rechtschreibung korrigieren, Texte erweitern, kürzen, umformulieren oder übersetzen
  • oder ganze Abschnitte übersetzen
IMG_05_07a
IMG_05_07b
IMG_05_07c

Zudem,

  • kann es mit verschiedenen Online-KI-Engines verbunden werden (wie ChatGPT, Llama, Claude, usw.)
  • es hebt automatisch hervor, welche Felder mit KI generiert werden, um dem Ersteller die Kontrolle zu geben
  • es ist in hohem Masse konfigurierbar und der Benutzer kann die KI-Eingabeaufforderungen für die Inhaltserstellung leicht ändern.

4. Erstellen von Landing Pages mit KI

Die Automatisierung der Erstellung von Landing Pages ist bei unseren Kund:innen sehr gefragt. Das Potenzial, dies mit Hilfe von KI zu tun, ist enorm.

Die Kernaufgabe besteht darin, die KI so einzurichten, dass sie (nur) bestehende und aktualisierte Inhalte der spezifischen Plattformen nutzt und erstellt. Dies kann durch die Verwendung von Retrieval Augmented Generation (RAG) erreicht werden, um Fakten aus einer externen (unternehmenseigenen) Wissensbasis abzurufen und die genauesten Ergebnisse der verbundenen grossen Sprachmodelle (LLMs) zu erzielen.

IMG_05_08

Idee & Konzept

Dieser Prototyp veranschaulicht die Leistungsfähigkeit einer Kombination aus kundenspezifisch geschultem GPT, Web Scraping und modularem Webdesign zur effizienten Erstellung personalisierter, inhaltsreicher Websites.

Zunächst erstellten wir ein GPT-Modell und trainierten es für die Erstellung von Landing Pages. Wir nutzten Web Scraping, um Daten von einer Unternehmensplattform zu extrahieren, und speisten diese Informationen mit Hilfe der Retrieval-Augmented Generation (RAG)-Technik in das GPT ein.

Das Projekt konzentrierte sich vor allem auf die Nutzung der Fähigkeiten des GPT zur Erstellung benutzerdefinierter, detaillierter Landing-Page-Strukturen mit umgeschriebenen und kuratierten Inhalten. Indem wir die GPT mit dem notwendigen Kontext und den Daten versorgten, konnten wir optimierte, hochwertige Inhalte erstellen, die auf die spezifischen Anforderungen der Website zugeschnitten waren.

Der nächste Schritt im Projekt besteht darin, eine Web-UI zu entwerfen, die auf modularen Layout-Blöcken basiert, die sich an der von GPT generierten Landing Page-Struktur orientieren. Dieser modulare Ansatz ermöglicht ein flexibles und visuell ansprechendes Design, das die generierten Inhalte nahtlos integriert.

Sobald die Benutzeroberfläche eingerichtet ist, wird sie in einem letzten Schritt mit den von GPT generierten Inhalten gefüllt, um sicherzustellen, dass jeder Abschnitt der Landing Page mit relevanten, ansprechenden und optimierten Informationen gefüllt ist.

Dieser Prototyp zeigt das Potenzial für die Automatisierung der Website-Erstellung durch die Integration von KI-gesteuerter Inhaltsgenerierung und modularem Webdesign. Durch die Nutzung der Leistungsfähigkeit von GPT und Web Scraping können Unternehmen hochwertige, personalisierte Websites mit minimalem manuellem Aufwand erstellen und so die Erstellung von Websites revolutionieren.

IMG_05_09

5. Fazit

Wir glauben an den Mehrwert der Integration von künstlicher Intelligenz in verschiedene Schritte unserer Arbeitsabläufe, um die Qualität und Quantität unserer Projektarbeit zu verbessern.

Das bedeutet nicht, dass wir menschliche Arbeit durch KI ersetzen wollen, sondern, dass wir unsere Teams und Kund:innen befähigen, sich schnell an die neuen verfügbaren Fähigkeiten und Tools und die Geschwindigkeit ihrer Entwicklungen anzupassen – um intelligenter zu arbeiten und sich auf die spannenderen Teile der Arbeitsabläufe zu konzentrieren.

Wir empfehlen, die Landing Page Nutzen Sie die Kraft der KI für Ihre digitale Transformation zu besuchen, um mehr über unsere Ansätze zur Nutzung des Potenzials von KI für die digitale Transformationsreise zu erfahren, wie z.B.:

Comments

Diese Seite verwendet Cookies. Einige dieser Cookies sind unverzichtbar, während andere uns helfen, deine Erfahrung zu verbessern, indem sie uns Einblicke in die Nutzung der Website geben.

Ausführlichere Informationen über die von uns verwendeten Cookies findest du in unserer Datenschutzrichtlinie.

Einstellungen anpassen
  • Notwendige Cookies ermöglichen die Kernfunktionen. Die Website kann ohne diese Cookies nicht richtig funktionieren und kann nur deaktiviert werden, indem du deine Browsereinstellungen änderst.