---
title: "Mistral OCR 4: Wenn KI Dokumente versteht statt nur liest"
description: "Das französische KI-Unternehmen Mistral hat OCR 4 vorgestellt – ein Modell, das Dokumente nicht bloß in Text umwandelt, sondern ihre Struktur erkennt, Inhalte klassifiziert und nach eigenen Angaben 170 Sprachen beherrscht."
category: "Wissenschaft"
category_url: https://weltturm.de/kategorie/wissenschaft
author: "Lena Baumann"
published: 2026-06-25T01:48:20.000Z
updated: 2026-06-25T01:48:20.000Z
canonical: https://weltturm.de/artikel/mistral-ocr-4-wenn-ki-dokumente-versteht-statt-nur-liest
tags: ["KI", "OCR", "Mistral", "Dokumentenanalyse", "Europa"]
---
# Mistral OCR 4: Wenn KI Dokumente versteht statt nur liest

Das französische KI-Unternehmen Mistral hat OCR 4 vorgestellt – ein Modell, das Dokumente nicht bloß in Text umwandelt, sondern ihre Struktur erkennt, Inhalte klassifiziert und nach eigenen Angaben 170 Sprachen beherrscht.

Wer an OCR denkt, denkt meist an simple Zeichenerkennung: Bild rein, Text raus. Das französische KI-Unternehmen Mistral will mit OCR 4 mehr bieten. Wie [heise online berichtet](https://www.heise.de/news/Dokumente-verstehen-statt-nur-lesen-Mistral-OCR-4-ist-da-11343027.html), analysiert das neue Modell Dokumente auf struktureller Ebene – es erkennt also nicht nur Buchstaben, sondern auch, wie ein Dokument aufgebaut ist.

## Struktur statt nur Text

OCR 4 klassifiziert die einzelnen Bausteine eines Dokuments – etwa Überschriften, Tabellen, Formeln oder Unterschriften – und liefert für jedes erkannte Element Positionsangaben (sogenannte Bounding Boxes). Hinzu kommen Konfidenzwerte pro Wort und pro Seite, die angeben, wie sicher die Erkennung ausfiel. Gerade dort, wo Fehler teuer werden – in der Buchhaltung oder bei Compliance-Prüfungen –, ist das ein praktischer Vorteil.

Das Modell ist in zwei Stufen verfügbar: Die Basis-API extrahiert Inhalte samt Struktur, während der erweiterte „Document AI"-Modus strukturiertes JSON nach benutzerdefinierten Schemata ausgibt – damit lassen sich etwa Rechnungsfelder oder Formulareinträge direkt maschinell weiterverarbeiten.

## 170 Sprachen

Mistral bewirbt OCR 4 mit Unterstützung für 170 Sprachen aus zehn Sprachgruppen, mit ausdrücklichem Augenmerk auf weniger verbreitete Sprachen. Für Unternehmen, die mit mehrsprachigen Dokumenten arbeiten, ist das ein relevantes Verkaufsargument.

Auf öffentlichen Vergleichstests gibt das Unternehmen Werte von 85,20 Punkten (OlmOCRBench) und 93,07 Punkten (OmniDocBench) an. Solche Zahlen sind allerdings mit Vorsicht zu genießen: Wie auch heise betont, haben Benchmark-Ergebnisse nur begrenzte Aussagekraft und können je nach Dokumententyp stark schwanken.

## Preis und Verfügbarkeit

Die Nutzung kostet laut Mistral 4 US-Dollar pro 1.000 Seiten, im Stapelbetrieb 2 Dollar; der Document-AI-Modus schlägt mit 5 Dollar pro 1.000 Seiten zu Buche. Erreichbar ist das Modell über Mistrals eigene Plattform sowie über Amazon SageMaker und Microsoft Foundry. Für Unternehmen mit hohen Datenschutzanforderungen bietet Mistral zudem ein Self-Hosting im eigenen Rechenzentrum an.

## Eine europäische Stimme im KI-Wettbewerb

Mistral aus Paris versteht sich seit der Gründung 2023 als europäische Antwort auf US-Konzerne wie OpenAI oder Google. OCR 4 reiht sich in diese Strategie ein – auf einem Markt, auf dem etablierte Anbieter wie Adobe, Microsoft und Google längst aktiv sind. Mistrals Unterscheidungsmerkmale sind dabei die Möglichkeit zum Self-Hosting und die breite Mehrsprachigkeit, was vor allem für europäische Behörden sowie Finanz- und Gesundheitsunternehmen interessant sein dürfte.

## Quellen

- [Dokumente verstehen statt nur lesen: Mistral OCR 4 ist da](https://www.heise.de/news/Dokumente-verstehen-statt-nur-lesen-Mistral-OCR-4-ist-da-11343027.html)
- [Mistral OCR 4](https://mistral.ai/news/ocr-4/)

