winter school htr vienna önb

Manche glauben, die Digitalisierung sei der endgültige Sieg über das Vergessen. Wir scannen alte Pergamente, füttern Algorithmen mit verblasster Tinte und wiegen uns in der Sicherheit, dass die Cloud unser kulturelles Erbe für die Ewigkeit konserviert. Doch das ist ein Trugschluss, der die Komplexität der Materie unterschätzt. Die automatisierte Texterkennung, heute oft als Allheilmittel für die Geisteswissenschaften gepriesen, ist kein passiver Prozess des Kopierens, sondern ein Akt der Interpretation, der voller Fehlerquellen steckt. Wer sich ernsthaft mit der Transformation analoger Schätze in maschinenlesbare Daten befasst, stößt unweigerlich auf die Winter School HTR Vienna ÖNB, eine Institution, die zeigt, dass die Technik ohne philologische Demut wertlos bleibt. Hier wird deutlich, dass wir nicht einfach nur Pixel in Buchstaben verwandeln, sondern eine neue Form der digitalen Paläographie erschaffen, die weit über das hinausgeht, was herkömmliche Texterkennung früher leisten konnte.

Die Arroganz der Algorithmen gegenüber der Geschichte

Es herrscht eine gefährliche Naivität in den Chefetagen vieler Archive. Man geht davon aus, dass künstliche Intelligenz die Handschriften der letzten Jahrhunderte mit einem Mausklick lesbar macht. Die Realität sieht anders aus. Ein neuronales Netz ist nur so klug wie die Daten, mit denen es trainiert wurde. Wenn wir von Handwritten Text Recognition sprechen, meinen wir eigentlich statistische Wahrscheinlichkeiten. Die Maschine rät, welcher Buchstabe dort stehen könnte, basierend auf Mustern, die sie zuvor gesehen hat. Das Problem dabei ist der Kontext. Ein Schreiber im 17. Jahrhundert hatte eine andere Handhaltung, andere Abkürzungen und eine völlig andere Logik als ein Bürokrat des 19. Jahrhunderts. Die Annahme, ein universelles Modell könne alles lösen, ist technopolitischer Hochmut. Dieser ähnliche Bericht könnte Sie ebenfalls interessieren: owl labs meeting owl 3.

In Wien, an der Österreichischen Nationalbibliothek, weiß man das. Die Fachleute dort arbeiten mit Transkribus und ähnlichen Plattformen nicht als bloße Anwender, sondern als kritische Beobachter einer Technologie, die ständig scheitern kann. Ich habe gesehen, wie Forscher verzweifeln, wenn eine scheinbar perfekte KI plötzlich konsequent „u“ und „n“ verwechselt, weil die Vorlage zu blass war oder die Tinte durch das Papier geschlagen ist. Diese Nuancen sind es, die den Unterschied zwischen echtem Wissen und digitalem Müll ausmachen. Wer die Komplexität dieser Aufgabe ignoriert, produziert Datenleichen, die zwar durchsuchbar sind, aber die Geschichte verfälschen.

Warum die Winter School HTR Vienna ÖNB das Handwerk neu definiert

Es geht nicht nur um Software, es geht um eine neue Disziplin. Die Ausbildung an der Winter School HTR Vienna ÖNB markiert einen Punkt, an dem die klassische Archivarbeit und die Informatik kollidieren. Früher saßen Gelehrte jahrelang über einem Manuskript. Heute trainieren sie Modelle. Das klingt nach einer Arbeitserleichterung, ist aber in Wahrheit eine Verschiebung der Verantwortung. Der Experte muss nun entscheiden, wie viel Fehlerquote er akzeptiert. Ist eine Genauigkeit von 95 Prozent genug? Was ist mit den restlichen 5 Prozent, in denen vielleicht der entscheidende Name oder das Datum steht, das eine ganze historische Theorie umstößt? Wie erörtert in jüngsten Analysen von t3n, sind die Folgen bemerkenswert.

Die Falle der Ground Truth

In der Fachsprache nennen wir die manuell erstellte Vorlage, an der die KI lernt, die Ground Truth. Das klingt nach absoluter Wahrheit, ist aber oft nur eine subjektive Interpretation des Transkribierenden. Wenn ich einen Text falsch lese und die Maschine damit füttere, wird sie diesen Fehler tausendfach reproduzieren. Das ist die dunkle Seite der Skalierung. Ein einziger Fehler in der Trainingsphase korrumpiert den gesamten Datensatz eines Projekts. Diese Erkenntnis ist schmerzhaft für alle, die auf schnelle Ergebnisse hoffen. Wir müssen uns eingestehen, dass die Maschine die menschliche Expertise nicht ersetzt, sondern ihre Fehler potenziert, wenn wir nicht höllisch aufpassen.

Das Ende des einsamen Gelehrten

Die Arbeit in solchen Programmen erfordert Teamarbeit. Ein Informatiker versteht die Architektur des neuronalen Netzes, aber er hat keine Ahnung von der Kurrentschrift des Barock. Der Historiker hingegen liest die Quelle flüssig, scheitert aber an der Installation einer Python-Umgebung oder der Optimierung der Lernrate. Diese Lücke zu schließen, ist das eigentliche Ziel dieser Formate. Es entsteht eine neue Generation von „Hybrid-Gelehrten“. Diese Leute können sowohl mit Pergament als auch mit Code umgehen. Das ist kein Luxus, sondern eine Notwendigkeit in einer Welt, die ihre Geschichte zunehmend nur noch durch den Filter des Bildschirms wahrnimmt.

Die Illusion der fehlerfreien Volltextsuche

Wir sind darauf konditioniert, alles zu googeln. Wir erwarten, dass eine Suche in einem digitalen Archiv uns alle relevanten Treffer liefert. Doch das ist ein gefährlicher Glaube. Wenn die Texterkennung versagt, verschwinden Dokumente aus dem digitalen Gedächtnis, obwohl sie physisch vorhanden sind. Sie werden zu „dunklen Daten“. Ein Forscher, der sich blind auf die Suchfunktion verlässt, übersieht vielleicht die wichtigste Quelle seiner Karriere, nur weil die KI ein Wort falsch interpretiert hat.

Die Vermittlung von Kompetenzen in der Winter School HTR Vienna ÖNB ist deshalb auch eine Lektion in Skepsis. Man lernt dort, den Ergebnissen zu misstrauen. Man lernt, wie man Layout-Analysen durchführt, um sicherzustellen, dass die Maschine nicht die Randnotizen in den Haupttext mischt. Das ist kleinteilige, mühsame Arbeit. Sie passt so gar nicht in das Bild der glatten, sauberen digitalen Transformation, die uns von Softwareanbietern oft verkauft wird. Es gibt keine magische Taste, die Geschichte in Text verwandelt. Es gibt nur harte Arbeit am Modell.

Man könnte einwenden, dass die Technologie immer besser wird und diese Probleme bald der Vergangenheit angehören. Das ist ein beliebtes Argument der Optimisten. Sicher, die Fehlerraten sinken. Aber die Komplexität der Quellen nimmt zu, je tiefer wir in die Archive vordringen. Je mehr wir uns von den standardisierten Druckschriften entfernen und uns den individuellen, oft chaotischen Handschriften widmen, desto deutlicher treten die Grenzen der Statistik hervor. Ein Computer versteht keine Ironie, keine Emotionen und keine tattrige Handschrift eines sterbenden Königs, es sei denn, wir erklären ihm jedes Detail.

Ein radikaler Blick auf die digitale Überlieferung

Wenn wir ehrlich sind, geht es bei der gesamten Debatte um Macht. Wer die Algorithmen kontrolliert und wer bestimmt, welche Bestände mit welcher Priorität digitalisiert werden, der schreibt die Geschichte der Zukunft. Es ist eine Form von digitalem Kolonialismus, wenn nur die „einfachen“ Texte erschlossen werden, während die widerspenstigen, schwer lesbaren Quellen im Archivschatten bleiben. Wir riskieren eine Verzerrung unserer Wahrnehmung der Vergangenheit, die nur noch das wiedergibt, was maschinenlesbar ist.

✨ Nicht verpassen: sony dsx a410bt bluetooth

Die Arbeit in Wien zeigt uns, dass der Weg zur Erkenntnis über die Fehler führt. Wir müssen lernen, mit der Unvollkommenheit der Technik zu leben. Es ist nicht das Ziel, eine perfekte Maschine zu bauen. Das Ziel ist es, Werkzeuge zu entwickeln, die den Menschen befähigen, mehr zu sehen, als er allein könnte, ohne dabei den kritischen Verstand auszuschalten. Das ist ein Balanceakt, den viele Institutionen noch nicht beherrschen. Sie wollen Effizienz, wo eigentlich Reflexion gefragt wäre.

Vielleicht müssen wir den Begriff der Digitalisierung komplett neu denken. Sie ist keine Konservierung. Sie ist eine Übersetzung. Und wie bei jeder Übersetzung geht etwas verloren, während etwas Neues entsteht. Wer das ignoriert, betreibt keine Wissenschaft, sondern Datenverwaltung. Die wahre Herausforderung besteht darin, die Seele der Dokumente zu bewahren, während wir sie in Einsen und Nullen zerlegen. Das erfordert mehr als nur Rechenleistung; es erfordert eine ethische Haltung gegenüber dem Erbe.

Man sieht das deutlich an der Art und Weise, wie Teilnehmer solcher Kurse ihre Sichtweise ändern. Sie kommen mit der Erwartung, ein Tool zu lernen. Sie gehen mit der Erkenntnis, dass sie Teil eines riesigen Experiments sind. Dieses Experiment wird darüber entscheiden, ob unsere Nachfahren noch Zugang zur Komplexität der menschlichen Erfahrung haben oder ob sie nur noch eine geglättete, KI-generierte Version der Vergangenheit konsumieren. Die Verantwortung, die auf den Schultern derer lastet, die heute die Modelle trainieren, ist gigantisch.

Wir stehen an einem Punkt, an dem wir uns entscheiden müssen. Wollen wir schnelle, billige Daten, die oberflächlich korrekt erscheinen? Oder investieren wir in die mühsame Ausbildung von Experten, die die Maschinen führen, anstatt sich von ihnen führen zu lassen? Der Weg über Wien ist der steinige Weg. Aber es ist der einzige, der zu einer ehrlichen digitalen Geschichte führt. Alles andere ist bloßes Blendwerk für eine Öffentlichkeit, die glaubt, dass Technik alle Probleme löst.

Die digitale Zukunft der Geschichte wird nicht in den Rechenzentren des Silicon Valley entschieden, sondern an den Schreibtischen derer, die den Schweiß und den Staub der Archive noch in den Fingerspitzen spüren, während sie den Code der Zukunft schreiben. Es gibt keine Abkürzung zur Wahrheit, auch nicht in der Welt der künstlichen Intelligenz.

👉 Siehe auch: diesen Artikel

Wer glaubt, dass künstliche Intelligenz uns die Arbeit des Denkens abnimmt, hat den Sinn der Geschichte nicht verstanden.