e l l i s — Yongnam

Stell dir vor, du hast gerade sechzigtausend Euro in die Hand genommen, dein Team hat drei Monate lang Überstunden geschoben und am Tag der Liveschaltung passiert: gar nichts. Ich habe das oft erlebt. Ein mittelständisches Unternehmen aus Süddeutschland wollte unbedingt Ellis in seine bestehende Infrastruktur integrieren, weil der Vorstand irgendwo gelesen hatte, dass man ohne diesen Standard den Anschluss an die europäische KI-Forschung verliert. Sie haben blindlings Ressourcen auf das Problem geworfen, ohne die zugrunde liegende Architektur ihrer Daten zu verstehen. Am Ende saßen sie auf einem Haufen inkompatibler Skripte und einer frustrierten IT-Abteilung, die kurz vor der Kündigungswelle stand. Das Problem war nicht die Technologie selbst, sondern die Annahme, dass man ein komplexes System wie dieses einfach wie eine Standardsoftware installieren kann. Es ist ein klassischer Fall von blindem Aktionismus, der in der Branche leider zum Alltag gehört.

Die Illusion der schnellen Integration von Ellis

Der größte Fehler, den Entscheider machen, ist der Glaube an die Plug-and-Play-Fähigkeit komplexer Forschungsnetzwerke. In meiner Praxis habe ich gesehen, wie Firmen versuchen, diese Strukturen innerhalb von zwei Wochen hochzuziehen. Das ist schlicht unmöglich. Wer denkt, er könnte ein System, das auf jahrelanger akademischer Exzellenz und hochspezialisierten Algorithmen basiert, mal eben zwischen zwei Kaffeepausen implementieren, wird hart auf dem Boden der Realität landen.

Die Wahrheit ist, dass die meisten Unternehmen intern gar nicht über die mathematische Tiefe verfügen, um die Prozesse wirklich zu steuern. Man stellt einen Werkstudenten ein oder beauftragt eine Agentur, die sich gestern erst in das Thema eingelesen hat. Das Ergebnis ist ein instabiles Gebilde, das bei der kleinsten Lastspitze zusammenbricht. Es geht hier nicht um Softwareentwicklung im klassischen Sinne. Es geht um die Anwendung von Machine Learning auf einem Niveau, das höchste Präzision verlangt. Wenn die Datenqualität nicht stimmt – und ich rede hier von einer Reinheit, die weit über das übliche Maß hinausgeht –, dann liefert das gesamte System nur teuren digitalen Müll. Man muss verstehen, dass die europäische Initiative für Lernende Systeme eine enorme Chance bietet, aber nur, wenn man die Grundlagenarbeit nicht überspringt. Wer die Zeit nicht investiert, die Daten sauber zu strukturieren, verbrennt sein Budget schneller, als die Cloud-Rechnung fällig wird.

Das Märchen vom selbstlernenden System ohne Aufsicht

Ein weiterer Punkt, der mich regelmäßig fassungslos macht, ist die Erwartung, dass diese Strategie nach der Einrichtung von alleine läuft. Ich habe Projekte gesehen, bei denen nach der Initialisierung niemand mehr die Validierungsschleifen kontrolliert hat. Man verlässt sich auf die Intelligenz des Algorithmus und wundert sich sechs Monate später, warum die Vorhersagen völlig an der Realität vorbeigehen.

Warum menschliche Expertise unersetzlich bleibt

Ein Algorithmus ist kein magisches Wesen. Er ist Mathematik. Wenn man der Maschine erlaubt, ohne Korrekturmechanismen zu lernen, verstärkt sie bestehende Bias-Strukturen in den Daten. In einem Fall aus der Logistikbranche führte das dazu, dass ein System zur Routenoptimierung plötzlich anfing, bestimmte Regionen komplett zu ignorieren, nur weil es in einer historischen Datenwoche mal einen Stau gab. Ein Mensch hätte das sofort erkannt. Die Maschine dachte, sie sei effizient. Ohne erfahrene Data Scientists, die regelmäßig intervenieren und die Gewichtungen anpassen, ist das Ganze ein Blindflug. Man braucht Leute, die nicht nur programmieren können, sondern die Statistik dahinter verstehen. Das kostet Geld, viel Geld. Aber es ist immer noch billiger, als ein System zu betreiben, das falsche Geschäftsentscheidungen trifft.

Die Kostenfalle der Hardware-Unterschätzung

Oft wird geglaubt, man könne solche Projekte auf herkömmlichen Servern oder mit einer kleinen Instanz bei einem Cloud-Anbieter stemmen. Ich war bei einem Projekt dabei, wo die Verantwortlichen dachten, sie kämen mit einem Budget von fünfhundert Euro im Monat für Rechenleistung aus. Nach drei Tagen war das Budget aufgebraucht, weil die Modellberechnungen die GPUs förmlich gefressen haben.

In der Realität muss man für ein ernsthaftes Projekt in diesem Bereich mit ganz anderen Summen rechnen. Wer nicht bereit ist, fünfstellige Beträge pro Monat allein für die Rechenleistung einzuplanen, sollte gar nicht erst anfangen. Es ist ein Wettrüsten der Hardware. Wenn man versucht, hier zu sparen, verlängern sich die Trainingszeiten der Modelle so massiv, dass die Ergebnisse bereits veraltet sind, wenn sie endlich vorliegen. Das ist, als würde man versuchen, mit einem Kleinwagen an einem Formel-1-Rennen teilzunehmen. Man kommt vielleicht an, aber eben als Letzter und ohne jede Relevanz für den Markt.

Vorher und Nachher: Ein praktisches Beispiel aus der Produktion

Schauen wir uns an, wie ein typischer Prozess schiefläuft und wie er eigentlich aussehen sollte.

Ein Automobilzulieferer wollte die Ausschussrate in der Produktion senken. Der ursprüngliche Plan sah vor, alle Sensordaten der letzten fünf Jahre in einen Topf zu werfen und die KI mal machen zu lassen. Sie engagierten drei Junioren, kauften ein paar teure Grafikkarten und fingen an zu rechnen. Nach vier Monaten hatten sie ein Modell, das eine Genauigkeit von 60 % aufwies – kaum besser als Raten. Die Kosten beliefen sich bis dahin auf etwa achtzigtausend Euro für Gehälter und Hardware. Das Problem? Die Daten waren nicht gelabelt, die Sensoren hatten unterschiedliche Taktungen und niemand hatte die physikalischen Gesetze der Maschinen berücksichtigt.

Nachdem sie mich geholt hatten, haben wir den Ansatz radikal geändert. Zuerst haben wir den Prozess gestoppt. Wir haben zwei Monate lang gar nichts gerechnet, sondern nur Daten bereinigt. Wir haben Experten von der Fabrikhalle dazugeholt, die uns erklärt haben, warum bestimmte Druckabfälle physikalisch gar nicht möglich waren, obwohl der Sensor sie anzeigte (es war ein Kalibrierungsfehler). Wir haben uns auf die relevantesten 10 % der Daten konzentriert, statt auf die vollen 100 %.

Das Ergebnis nach sechs Monaten: Das Modell erreichte eine Genauigkeit von 94 %. Die Ausschussrate sank um 12 %, was dem Unternehmen jährlich über eine halbe Million Euro sparte. Der Unterschied war nicht die Software, sondern die Erkenntnis, dass man das Problem von der physikalischen Seite her verstehen muss, bevor man die Mathematik darauf loslässt. Der erste Ansatz war blindes Vertrauen in die Technik, der zweite war Ingenieurskunst unterstützt durch moderne Verfahren.

Warum Ellis die Art und Weise verändert wie wir über Datenhoheit denken

Man darf nicht vergessen, dass es bei diesem Standard auch um eine politische und strategische Komponente geht. Europa versucht, einen eigenen Weg zwischen den USA und China zu finden. Das bedeutet für Unternehmen, dass sie sich an strengere Datenschutzvorgaben halten müssen, als es vielleicht im Silicon Valley der Fall ist. Viele empfinden das als Klotz am Bein, aber ich sehe das anders.

Wer heute ein System baut, das die europäische Datenschutz-Grundverordnung ignoriert, baut auf Sand. In meiner Beratungstätigkeit habe ich Projekte scheitern sehen, weil die Rechtsabteilung im letzten Moment den Stecker gezogen hat. Sie hatten Monate investiert, um Daten zu sammeln, die sie laut Gesetz gar nicht hätten speichern dürfen. Ellis bietet hier einen Rahmen, der genau diese Anforderungen berücksichtigt. Es ist mühsamer, ja. Aber es ist nachhaltig. Man muss die Rechtsabteilung vom ersten Tag an mit an den Tisch holen. Wer das als bürokratisches Hindernis abtut, wird später mit Bußgeldern oder der kompletten Stilllegung des Systems bestraft. Es ist schlichtweg dumm, die rechtliche Komponente als nachgelagertes Problem zu betrachten.

Die Arroganz der reinen Theorie in der Praxis

Ein Fehler, den ich besonders oft bei Hochschulabsolventen sehe, die direkt in die Industrie kommen, ist die Überbewertung von Papern und theoretischen Modellen. In der Theorie funktioniert alles wunderbar auf einem perfekt kuratierten Datensatz wie ImageNet oder MNIST. In der Industrie hast du es mit verrauschten Signalen, defekten Sensoren und Mitarbeitern zu tun, die den Stecker ziehen, weil sie den Platz für ihren Wasserkocher brauchen.

Ich habe erlebt, wie ein Team versuchte, ein hochkomplexes neuronales Netz zu implementieren, das in einer aktuellen Forschungsarbeit gefeiert wurde. Es war mathematisch brillant, aber in der Produktion völlig unbrauchbar, weil die Latenzzeit bei über zwei Sekunden lag. Die Fließbandgeschwindigkeit erforderte aber eine Entscheidung in weniger als fünfzig Millisekunden. Man muss lernen, Abstriche bei der theoretischen Perfektion zu machen, um die praktische Nutzbarkeit zu garantieren. Ein einfaches Modell, das stabil und schnell läuft, ist tausendmal wertvoller als ein State-of-the-Art-Modell, das die Produktion lahmlegt. Man muss den Mut haben, die komplizierte Lösung zugunsten der robusten Lösung zu verwerfen.

Der Realitätscheck: Was es wirklich braucht

Machen wir uns nichts vor: Der Aufbau einer Infrastruktur, die auf diesen Prinzipien basiert, ist kein Projekt, das man nebenbei erledigt. Es ist eine fundamentale Entscheidung für die nächsten fünf bis zehn Jahre. Wenn du nicht bereit bist, die folgenden Punkte zu akzeptieren, dann lass es lieber gleich:

Erstens: Du wirst im ersten Jahr wahrscheinlich keinen positiven Return on Investment sehen. Die Kosten für die Talentakquise, die Datenaufbereitung und die Hardware-Infrastruktur sind massiv. Wer schnelle Gewinne sucht, sollte lieber in Standard-Automatisierung investieren.

Zweitens: Du brauchst Leute, die mehr können als nur Python-Skripte von GitHub zu kopieren. Du brauchst Brückenbauer zwischen der akademischen Welt und der harten Realität der Werkhalle. Diese Leute sind selten und sie wissen, was sie wert sind. Wenn du versuchst, sie mit einem Durchschnittsgehalt abzuspeisen, gehen sie zu den großen Tech-Konzernen.

Drittens: Scheitern gehört dazu. Ich habe Projekte begleitet, die nach acht Monaten eingestellt wurden, weil die Datenlage einfach nicht hergab, was man sich erhofft hatte. Das ist kein Versagen der Technologie, sondern eine wertvolle Erkenntnis. Man muss die Eier haben, ein Projekt zu beenden, wenn es keinen Sinn ergibt, statt immer mehr Geld hinterherzuwerfen.

Erfolg in diesem Bereich kommt nicht durch das neueste Tool oder das hippste Framework. Er kommt durch Disziplin bei der Datenpflege, tiefes Verständnis der Domäne und die Ausdauer, auch dann weiterzumachen, wenn die erste Euphorie verflogen ist und die harte Arbeit der Modelloptimierung beginnt. Es gibt keine Abkürzung. Es gibt nur den harten, steinigen Weg der korrekten Implementierung. Wer das versteht, hat eine echte Chance, den Markt zu dominieren. Alle anderen produzieren nur teure Präsentationen für die nächste Aufsichtsratssitzung.

✨ Nicht verpassen: Wie Space X die Raumfahrt radikal verändert hat und was das für unsere Zukunft bedeutet