KI für Musikwissenschaftler? 

KI für Musikwissenschaftler? 

Die Künstliche Intelligenz ist auf dem Vormarsch. Sie kann alte Schriften erkennen und sie in die moderne Schrift übersetzen. Jetzt soll das auch für Musik möglich sein. 

KI für Musikwissenschaftler? 

Systeme, die uns das Leben erleichtern und uns lästige Aufgaben abnehmen. Was früher nur im Film oder Büchern stattfand, wird mittlerweile immer mehr unser Alltag. Auch in der Musik und in der Musikwissenschaft kommt die sogenannte Künstliche Intelligenz (KI) zunehmend zum Einsatz. Durch Algorithmen und maschinelles Lernen können die KI-Systeme Muster erkennen, Schlussfolgerungen ziehen und menschenähnlich handeln. Nun könnte der Einsatz von KI auch die Musikwissenschaftsforschung revolutionieren. Am Österreichischen Zentrum für Digitale Geisteswissenschaften und Kulturelles Erbe der Österreichischen Akademie der Wissenschaften wurde in diesem Jahr ein Forschungsprojekt gestartet, bei dem Choralhandschriften des Grazer Franziskanerklosters mit Hilfe der KI Transkribus entziffert werden. Projektleiter Dr. Robert Klugseder hat uns berichtet, wozu Transkribus in der Lage ist.

Klassik Radio: Was kann das Programm Transkribus und wie kann es dabei helfen, alte Notenschriften zu entziffern? 

Robert Klugseder: „Transkribus ist ein digitales, KI gestütztes Werkzeugset, das im Wesentlichen auf dem Training neuronaler Netze beruht. Die durch dieses Training erzeugten Transkriptions-Modelle sind in der Lage, handschriftlichen Text zu erkennen und automatisiert in moderne Schrift zu übertragen. Es spielt keine Rolle, um welche Schriftart es sich dabei handelt. [...] Wenn Sie sich die Komplexität von asiatischen Schriftzeichen vorstellen, ist der Weg zur Musiknotation nicht mehr weit. Auch hier handelt es sich um ein Regelwerk von Symbolen und Zeichen. Am besten funktioniert das natürlich mit einstimmiger, [...] nicht gemessener Musik wie dem mittelalterlichen gregorianischen Choral, einer sehr einfachen Art, Musiknotation zu schreiben. Vereinfacht dargestellt handelt es sich hier um Notenköpfe, die entweder auf oder zwischen Notenlinien positioniert sind. Um der KI diese Positionierung beibringen zu können, haben wir uns einen einfachen Notationscode überlegt, mit dem neuronale Netze besonders gut umgehen können, der aber auch für uns Menschen leicht verständlich ist.“ 

Wie darf man sich das Training mit Transkribus vorstellen und wie bringt man der KI bei, richtige Ergebnisse zu liefern? 

Klugseder: „Zum Training werden der künstlichen Intelligenz, Bilder der handschriftlichen Texte oder, im Fall der Musikerkennung, der Notation zur Verfügung gestellt. Gleichzeitig füttert man die KI mit seiten- und zeilenweise übereinstimmenden Übertragungen in der Zielschrift oder in der Musikcodierung. Durch diesen Vergleich erlernt die KI die Art und Weise der Schriftausführung und kann damit später automatisiert und in guter Qualität Transkriptionen von gleichen oder ähnlichen Schreiberhänden beziehungsweise Notationsarten herstellen. Die neuronalen Netze verfügen quasi wie wir Menschen über zwei Augen. Mit dem einen sehen sie das Original, mit dem zweiten eine Übertragung in der Zielschrift. In zahlreichen Trainingsdurchgängen kann die künstliche Intelligenz beide Darstellungsformen immer besser in Relation zueinander setzen und ist schlussendlich in der Lage, neue, der KI unbekannte Dokumente selbstständig zu transkribieren.“ 

Was erhoffen Sie sich durch das KI gestützte Erkennen von älteren Notenhandschriften? 

Klugseder: „KI basierte Tools bringen in vielen Anwendungsszenarien eine deutliche Ersparnis an manueller Arbeit und damit an Zeit. Es wäre in unserem Fall kaum möglich, die Melodien von zig zehntausenden Gesängen manuell zu transkribieren. Das würde viele Monate, wenn nicht Jahre in Anspruch nehmen und viel Forschungsbudget verschlingen. Durch die automatisierte Transkription stehen diese Melodien und Liedtexte in einer ausreichend guten Qualität zur Verfügung und können durchsucht, in andere Codierungsformate transformiert und natürlich auch analysiert werden.“ 

Welche Möglichkeiten kann Transkribus und KI der Musikwissenschaftsforschung zukünftig ermöglichen? 

Klugseder: „Mittelfristig erhoffen wir uns natürlich mit diesem Projekt die Grundlagen für die Erkennung von mehrstimmiger und gemessener Musiknotation legen zu können. Also etwa für mittelalterliche Mensuralnotation oder für moderne, heute bei uns übliche Notation. Wir nutzen Transkribus, damit wir auf vorhandene Technik zurückgreifen können, die die Layoutanalyse, also die Segmentierung der Dokumente und die Texterkennung bereits in Perfektion beherrscht. Wir können uns also auf die Musiknotationserkennung konzentrieren. Das bringt natürlich einen entscheidenden Vorteil gegenüber anderen KI gestützten Notationserkennungsvorhaben abseits von Transkribus. Wir haben die Musiknotationserkennung also nicht erfunden, sind aber auf einem guten Weg der Entwicklung, die Forschung durch die Transkribus-Anbindung zu beschleunigen. Ich denke, ich bin nicht zu optimistisch, wenn ich davon ausgehe, dass wir in ein paar Jahren auch leistungsfähige Transkriptionsmodelle für mehrstimmige Musik zur Verfügung haben werden.“ 

Genießen Sie unsere meistgehörten Musiksender

Neueste Artikel