Welche Leistung soll durch Daten besser werden, und messbarer sein als heute?

Wenn diese Frage keine präzise Antwort hat, ist die Investition verfrüht.

Entsteht dieser Datenvorteil durch eine Aktivität, die wir auch ohne KI weiterführen würden?

Wenn ja, fallen die Daten als Nebenprodukt an und das Risiko ist gering. Wenn nein, setzt das Modell eine Aktivität voraus, die nur Sinn ergibt, wenn das Modell schon funktioniert, das ist ein Henne-Ei-Problem, das viele Data-Moat-Konzepte still begraben.

Wie lange würde es einen finanzstarken Wettbewerber dauern, diese Daten zu replizieren?

Wenn die Antwort unter zwei Jahren liegt, ist das kein Moat. Das ist ein temporärer Vorsprung.

Haben wir heute die Datenqualität und Governance, auf der ein Modell verlässlich trainieren kann?

Wenn nein: hier anfangen, bevor anderswo investiert wird.

Der Data Moat: Verteidigungslinie oder Ablenkungsmanöver?

Kaum ein Begriff hat in den vergangenen Jahren so viel strategisches Gewicht bekommen wie der Data Moat. Unternehmen, die genug Daten sammeln, bauen sich einen Schutzgraben, der Wettbewerber fernhält. Die Logik klingt überzeugend. Sie ist es meistens nicht.

Das Problem ist nicht das Konzept selbst. Es stimmt, dass proprietäre Daten Wettbewerbsvorteile erzeugen können. Das Problem ist, wie Unternehmen es anwenden: als Freifahrtschein, sich keine Gedanken über Datenqualität, Governance oder strategische Ausrichtung zu machen, weil man ja „Daten hat“. Der Data Moat wird zur Selbstberuhigung, nicht zur Strategie.

Was ein Data Moat tatsächlich ist

Ein Data Moat ist ein Wettbewerbsvorteil, der aus dem Besitz einzigartiger, schwer replizierbarer Daten entsteht. Er entfaltet seine Wirkung, wenn drei Bedingungen gleichzeitig erfüllt sind: Die Daten verbessern kontinuierlich eine Leistung, auf die Kunden angewiesen sind. Sie sind für Wettbewerber praktisch nicht zugänglich. Und sie werden mit der Zeit besser, nicht schlechter.

Das klassische Beispiel ist Tesla. Milliarden realer Fahrkilometer, die in Echtzeit in das Training des Autopilot-Systems fließen. Jede Fahrt macht das Modell präziser. Ein Wettbewerber, der heute anfängt, hat nicht nur einen technologischen Rückstand, er hat einen zeitlichen: Jahre an Daten, die er nie aufholen kann, weil Tesla diesen Vorsprung täglich ausbaut.

Das ist ein echter Data Moat. Er basiert auf einem geschlossenen Kreislauf: Nutzung erzeugt Daten, Daten verbessern das Produkt, besseres Produkt erzeugt mehr Nutzung. Dieser Flywheel-Effekt ist die eigentliche Defensivkraft.

Aber wie viele Unternehmen haben das wirklich? Und wie viele bilden sich ein, es zu haben?

Die häufigsten Missverständnisse

„Wir haben viele Daten“ ist keine Strategie

Volumen allein schafft keinen Moat. Fünf Jahre alte Transaktionsdaten, die nie bereinigt wurden, die in drei verschiedenen Systemen mit unterschiedlichen Schemata liegen, die kein Analyst ohne tagelange Vorarbeit nutzen kann, das ist kein Vorteil. Das ist technische Schuld.

Der häufigste Fehler, den wir in Beratungsprojekten sehen: Ein Unternehmen hat jahrelang Daten gesammelt und ausgewertet, aber nie systematisch in Datenqualität oder Governance investiert. Das Resultat ist ein Datenberg, kein Datenasset. Kein Modell der Welt trainiert verlässlich auf inkonsistenten, unvollständigen, unverlinkten Rohdaten.

Branchendaten sind nicht automatisch proprietär

Viele Mittelständler glauben, ihre langjährige Kundenbasis mache ihre Daten einzigartig. Das stimmt manchmal. Aber die relevante Frage ist nicht, ob die Daten einzigartig sind, sondern ob sie eine Leistung ermöglichen, die Wettbewerber nicht replizieren können, und ob diese Leistung etwas ist, das Kunden wechseln lässt.

Wenn ein Maschinenbauer zehn Jahre Wartungsprotokolle seiner Anlagen hat, aber diese Daten nirgendwo in seinen Service, seine Produktentwicklung oder seine Kundenkommunikation fließen, sind sie strategisch wertlos. Ihr Wert liegt nicht im Besitz, sondern in der Anwendung.

Foundation-Modelle haben den Kontext verändert

Vor drei Jahren war der Zugang zu Large Language Models und Bildverarbeitungsmodellen auf wenige Akteure beschränkt. Modellleistung war ein Differenzierungsmerkmal. Das ist heute nicht mehr so. GPT-4o, Claude, Gemini: Hochleistungsfähige Basismodelle sind für Unternehmen jeder Größe zugänglich.

Das bedeutet: Wer seinen Wettbewerbsvorteil auf der Fähigkeit aufgebaut hat, überhaupt ein KI-Modell zu betreiben, verliert diesen Vorteil. Die Frage ist nicht mehr „Können wir ein Modell trainieren?“ Die Frage ist: „Haben wir Daten, mit denen ein Modell etwas kann, was ein generisches Modell nicht kann?“

Das verschiebt den Moat in Richtung Domänenspezifität. Nicht mehr Modellarchitektur, sondern Datenrelevanz für ein spezifisches Problem.

Wann ein Data Moat ein echter strategischer Vorteil ist

Es gibt klare Bedingungen, unter denen eine Datenansammlung zu einem echten Wettbewerbsgraben wird. Sie sind selten alle gleichzeitig erfüllt, aber wenn sie es sind, entsteht etwas, das verteidigt werden kann.

Erstens: Die Daten entstehen als Nebenprodukt einer Kernaktivität, die Wettbewerber nicht replizieren können.

Stripe verarbeitet Zahlungen für Millionen von Händlern. Die dabei entstehenden Transaktionsdaten sind nicht einfach Rohdaten, sie sind ein Abbild des globalen Onlinehandels mit einer Präzision und Granularität, die kein Forschungsinstitut und kein Wettbewerber ohne dieselbe Marktstellung besitzt. Der Moat entsteht nicht durch Datenstrategie, er entsteht durch Marktposition, die Daten als Nebenprodukt generiert.

Zweitens: Die Daten verbessern eine Leistung, die Kunden nicht einfach ersetzen können.

Tempus AI hat in der Onkologie einen Datensatz aufgebaut, der genomische Sequenzierungsdaten mit klinischen Verlaufsdaten und Behandlungsergebnissen verknüpft. Ein neuer Wettbewerber braucht nicht nur Geld, er braucht Klinikpartnerschaften, regulatorische Zulassungen und Jahre an Datensammlung, um nur in die Nähe dieser Tiefe zu kommen. Das ist ein echter Moat: Er kostet Zeit, die man nicht kaufen kann.

Drittens: Der Feedbackkreislauf ist geschlossen.

Daten, die nur gesammelt, aber nie genutzt werden, trainieren kein Modell und verbessern keine Leistung. Ein echter Moat entsteht nur, wenn Nutzungsdaten systematisch in das System zurückfließen, das Kunden nutzen. Das erfordert technische Infrastruktur, aber vor allem organisatorische Bereitschaft: Wer darf auf die Daten zugreifen? Wer ist verantwortlich für ihre Qualität? Wer entscheidet, welche Modelle trainiert werden?

Diese Fragen sind keine IT-Fragen. Sie sind Führungsfragen.

Wann ein Data Moat eine Ablenkung ist

Das ist die unbequeme Seite der Diskussion.

Ein Data Moat, der nicht auf einem dieser drei Fundamente steht, ist meistens ein Narrativ. Er dient dem Fundraising, der internen Legitimation von Dateninvestitionen oder der Positionierung gegenüber Analysten. Er hilft selten dem Kerngeschäft.

Die Gefahr ist spezifisch: Unternehmen, die glauben, sie bauten gerade einen Moat, investieren in Datenmengen statt in Datenqualität. Sie sammeln, statt zu nutzen. Sie priorisieren Infrastruktur über Anwendung.

Gleichzeitig vernachlässigen sie die Fragen, die ihre tatsächliche Wettbewerbsposition ausmachen: Wie schnell können sie auf Kundenbedürfnisse reagieren? Wie gut sind ihre Prozesse integriert? Wie konsistent ist die Qualität ihrer Leistung?

Für viele mittelständische Unternehmen ist ein Distributions- oder Prozessmoat relevanter als ein Datamoat. Ein Unternehmen, das seine Kunden besser versteht als die Konkurrenz, weil seine Vertriebsmannschaft seit zwanzig Jahren dieselben Beziehungen pflegt, hat einen Vorteil, der nicht digital replizierbar ist. Diesen Vorteil durch Dateninfrastruktur zu ergänzen, ergibt Sinn. Ihn durch einen angeblichen Datenflywheel zu ersetzen, der noch nicht existiert, ist eine Fehlinvestition.

Was tatsächlich zählt: Das Fundament vor dem Flywheel

Die Diskussion um Data Moats überspringt meistens einen Schritt, der entscheidend ist: das Fundament.

Bevor ein Flywheel funktioniert, muss die Infrastruktur halten. Das bedeutet konkret: konsistente Datendefinitionen über Systeme hinweg, Herkunftsnachverfolgung, die im Zweifelsfall erklärt, warum eine Zahl in zwei Berichten unterschiedlich ist, Governance-Strukturen, die klären, wer Daten unter welchen Bedingungen nutzen darf, und Qualitätsprozesse, die sicherstellen, dass Modelle auf verlässlichen Eingaben trainieren.

Das ist keine glamouröse Arbeit. Es ist die Arbeit, die den Unterschied macht zwischen einem Datenberg und einem Datenasset.

Wir sehen in der Praxis regelmäßig das gleiche Muster: Ein Unternehmen hat signifikante Mittel in Data-Warehouse-Modernisierung oder einen neuen BI-Stack investiert. Die Dashboards sind schön. Die Reaktionszeit auf Abfragen ist schnell. Aber wenn es darum geht, ein ML-Modell auf diesen Daten zu trainieren, tauchen Probleme auf, die kein Werkzeug löst: fehlende Labels, inkonsistente Kategorisierungen, unvollständige historische Daten, keine dokumentierten Annahmen hinter Berechnungslogiken.

Das Fundament wurde nicht gebaut. Die Fassade wurde gebaut.

Ein Data Moat, der auf diesem Fundament aufbaut, kollabiert, sobald man ihn wirklich benötigt.

Die eigentliche Frage

Der Data Moat ist kein Selbstzweck. Er ist ein Mittel zu einem spezifischen Ziel: eine Leistung zu erbringen, die Wettbewerber nicht replizieren können, weil sie die Daten nicht haben.

Wer diese Frage ehrlich beantwortet, stellt fest, dass ein echter Moat in den meisten Fällen nicht das dringlichste Problem ist. Das dringlichste Problem ist meistens ein anderes: Die Daten, die ein Unternehmen hat, werden noch nicht so genutzt, wie sie genutzt werden könnten. Nicht wegen mangelnder Technologie, sondern wegen mangelnder Grundlagen.

Wer diese Grundlagen baut, schafft die Bedingungen für einen echten Moat. Wer den Moat baut, ohne die Grundlagen zu schaffen, baut eine Geschichte.

Der Unterschied zwischen beidem entscheidet nicht im Fundraising-Gespräch. Er entscheidet in der Produktion.