Die im Konferenzprogramm der OOP 2022 Digital angegebenen Uhrzeiten entsprechen der Central European Time (CET).
Unser Programm gibt es auch als praktische PDF-Datei >>Zum Download
Sie wollen sehen und ausprobieren, wie sich aktuelle Frameworks und Modelle beim Erkennen und Erzeugen deutscher Sprache schlagen? Dann sind Sie hier genau richtig. Probieren Sie online mit uns aus, wie gut freie Modelle inzwischen sind, die Sie unabhängig von den Großen auch lokal nutzen können: Sei es für Sprachbefehle, das Erkennen von Kundentelefonaten, das Erstellen von Audio zur Barrierefreiheit und was deren Grenzen und Vorurteile sind.
Zielpublikum: Sprachversteher:innen, Entwickler:innen
Voraussetzungen: Internetfähiges Gerät fürs Probieren
Schwierigkeitsgrad: Anfänger
Extended Abstract
KI ist nicht mehr ganz so Hype wie vor 2 Jahren und aktuell stehen ethische Themen zu Recht im Nachrichtenfokus. Dabei geht manchmal etwas unter, dass es gerade jetzt gute, frei verfügbare Modelle und Frameworks gibt, um Projekte mit deutscher Sprache und KI umzusetzen. Daten müssen nicht mehr an die Hyperscaler gesendet werden, Frameworks sind in Minuten nicht Stunden installiert und die Erkennung kann an bestimmte Branchen oder Szenarien angepasst werden.
Sie erfahren auf technischer Ebene, wie Spracherkennung und Spracherzeugung mit moderner KI grundsätzlich funktionieren und welche starken Veränderungen sich gerade im letzten Jahr durch neue Algorithmen und Modelle ergeben haben. Wir verwenden in unseren Beispielen Google Colab mit freien deutschen Modellen, die Sie selbst ausprobieren und später erweitern können. Die Beispiele sind an typische Projekte aus der Praxis angelehnt. Die Ersteller der Algorithmen haben häufig einen Forschungsfokus und begnügen sich mit guten Erkennungsraten, aber konzentrieren sich nicht auf den täglichen, skalierbaren Betrieb. Hier stellen wir vor, welche Frameworks heute produktiv einsetzbar sind. Im Bereich der Transkription sehen Sie, wie Diktate automatisiert verschriftlicht werden können und welche Fallstricke dabei lauern. Und beim Erstellen eines KI-Nachrichtensprechers können Sie sich von der Qualität seines bairischen Dialekts überzeugen. Außerdem gehen wir auf weitere typische Einsatzszenarien ein.
Auf organisatorischer Ebene nehmen Sie mit, dass ein Projekt zur Modellerstellung nicht immer so läuft, wie es auf Charts aussieht und was Sie schon jetzt dagegen tun können, auch wenn das Projekt erst in 2 Jahren beginnen sollte. Dabei stellen wir auch vor, mit welchen Daten KI-Modelle am besten trainiert werden sollten und wie man Vorurteile und andere ethische Probleme erkennen und möglichst vermeiden kann. Dabei gehen wir auch auf die Erkennung von Dialekten ein, deren Erkennung den Großen durchaus noch Sorgen bereitet.
Vortrag Teilen