Shownotes
Wer schon mal Audioaufnahmen abtippen musste, weiss, wie zeitaufwändig das ist. Eine neue Transkription-Applikation, greift nun Verwaltungsmitarbeitenden bei diesen Aufgaben unter die Arme. Die Applikation nutzt Technologien wie maschinelles Lernen und künstliche Intelligenz, um das gesprochene Wort automatisch zu transkribieren.
«Transcribo» wurde speziell für den Kanton entwickelt, um den Anforderungen des Amtsgeheimnisses gerecht zu werden und cloudbasierte Lösungen zu vermeiden. Das Modell hinter «Transcribo» ist ein großes Sprachmodell wie GPT von OpenAI, das Audio als Eingabe verwendet und den transkribierten Text generiert. Die Anwendung hat den Vorteil, dass die Verwaltung die Kontrolle über die Daten behält, was für den Umgang mit geschützten Personendaten im Strafverfahren besonders wichtig ist.
Stephan Walder, Leiter der digitalen Transformation bei der Oberstaatsanwaltschaft und Dominik Frefel, Data Scientist im Statistischen Amt erklären, wie sie «Transcribo» gemeinsam entwickelt haben. Die Qualität der Transkription ist erstaunlich gut, hängt aber auch von der Qualität der Aufnahmen ab und ist derzeit in Hochdeutsch besser als in Schweizerdeutsch. Das Modell wird weiter verbessert, und es gibt Bestrebungen, das System für die gesamte kantonale Verwaltung zugänglich zu machen. Der Code der Applikation ist auf GitHub verfügbar, so dass Interessierte die Anwendung herunterladen und betreiben können.
Links zur Folge:
Host: Simon Graf
Schnitt: Daniel Cahn
Feedback, Fragen und Anregungen zu dieser und allen anderen Folgen von «Statistisch gesehen» an: datashop@statistik.zh.ch