Hinweis: Die aktuelle OOP-Konferenz finden Sie hier!

SOFTWARE MEETS BUSINESS:
Die Konferenz für Software-Architektur
03. - 05. Juli 2023

menu

Konferenzprogramm

The Powerpoint Ghostwriter – Foliensätze mit KI erzeugen

Wie gut kann eine KI-generierte Powerpoint-Präsentation sein? Wir haben es ausprobiert.

Das größte Joch des Business-Kaspers, die PowerPoint-Präsentation, musste bis vor Kurzem noch mühsam händisch erstellt werden. Damit ist jetzt Schluss! TNG präsentiert den Powerpoint Ghostwriter. Diese KI benötigt nur einen Titel und generiert damit vollautomatisch ein komplettes Slidedeck. Selbst das Vortragen wird von der KI übernommen: Ein Deepfake-Avatar mit dem Wissen des gesamten Internets führt den Zuhörer durch die Folien.

Zielpublikum: Software-Entwickler:innen mit Interesse oder ersten Erfahrungen im KI-Umfeld
Voraussetzungen: Rudimentäre Entwicklungs-Kenntnisse
Schwierigkeitsgrad: Anfänger

Extended Abstract:
In ihrem Vortrag geben Thomas Endres, Christoph Bergemann und Jonas Mayer einen technischen Überblick über den Powerpoint Ghostwriter und die zugrunde liegende Künstliche Intelligenz. Anhand von anschaulichen Live-Demos wird gezeigt, wie GPT-3 Überschriften und Inhaltstexte generieren kann. Aus diesen Inhalten können mit der Bildgenerierungs-KI Dall-E Mini ansprechende Bilder zu den Folien erzeugt werden. Eine Übersetzungs-KI kann dabei die Präsentation vom Englischen ins Deutsche übersetzen. Ein Deepfake-Avatar liest anschließend die Folieninhalte mit Unterstützung durch die Text to Speech Engine Amazon Polly vor.

GPT-3 von openAI ist eine KI, die allgemeine Anfragen im Umfeld von natürlicher Sprache bearbeiten kann. Sie kann sowohl Fragen beantworten als auch längere Texte erzeugen oder zusammenfassen. Bei Dall-E Mini handelt es sich um eine frei verfügbare KI, die zu einer gegebenen Bildunterschrift ein passendes Bild erzeugt. Amazon Polly schließlich ist ein System zur Umwandlung von Text in Sprache. Daneben kommt auch die Audio2Face KI von NVidia Omniverse zum Einsatz, die Lippensynchronisation an einem 3D-Modell aus gesprochenem Text durchführt. Aus der TNG-Forschung stammen die Deepfakes-KI, die Gesichter in einem Video in Echtzeit durch andere Gesichter ersetzen kann, und die Übersetzer-KI.

Im Vortrag wird auf die Funktionsweise der einzelnen Künstlichen Intelligenzen eingegangen. Außerdem wird gezeigt, wie die Integration der verschiedenen Komponenten zu einem Ganzen erfolgt ist.

Thomas Endres arbeitet in der Rolle eines Partners als IT-Consultant für TNG Technology Consulting in München. Mit dem TNG-Innovation-Hacking-Team entwickelt er verschiedene Prototypen – darunter ein Telepräsenz-Robotik-System, verschiedene KI-Prototypen und AR/VR-Showcases. Als Intel Software Innovator und Black Belt präsentiert er weltweit neue Technologien wie KI, AR/VR und Robotik. Dafür erhielt er unter anderem einen JavaOne Rockstar-Award.

Mehr Inhalte dieses Speakers? Schaut doch mal bei sigs.de vorbei: https://www.sigs.de/experten/thomas-endres/

Jonas Mayer arbeitet im Innovation Hacking Team der TNG Technology Consulting und beschäftigt sich dort hauptsächlich mit der Entwicklung von innovativen Showcases und Prototypen in Soft- und Hardware. So arbeitete er seit 2018 an verschiedensten Projekten, wie zum Beispiel Deepfakes, Mixed Reality KI-Kunstwerken und autonom fliegenden Minidrohnen.

Thomas Endres, Jonas Mayer, Christoph Bergemann
14:30 - 15:30
Vortrag: Mo 4.3

Vortrag Teilen