Was ist ein Large Language Model, und was kann es zuverlässig — und was nicht?
Ein Large Language Model (LLM) ist ein KI-System, das auf Milliarden von Texten trainiert wurde und dadurch menschliche Sprache versteht und erzeugt. LLMs wie GPT, Claude oder Gemini können Texte zusammenfassen, übersetzen, Fragen beantworten und Code schreiben. Sie arbeiten auf Basis statistischer Muster — nicht auf Basis von echtem Wissen. Deshalb liefern sie bei sprachlichen Aufgaben starke Ergebnisse, können aber keine Fakten garantieren.
Was kann ein LLM zuverlässig?
LLMs sind stark bei Aufgaben, die auf Sprachverständnis und Sprachproduktion basieren. Dazu gehören: das Zusammenfassen langer Dokumente, das Übersetzen zwischen Sprachen, das Beantworten von Fragen auf Basis eines mitgelieferten Textes, das Umformulieren von Inhalten für verschiedene Zielgruppen und das Erzeugen von Entwürfen — sei es ein E-Mail-Text, ein Konzeptpapier oder ein Codeblock. Besonders gut funktionieren LLMs, wenn sie klare Anweisungen erhalten und der relevante Kontext in der Eingabe mitgeliefert wird. Deshalb setzen viele Unternehmensanwendungen auf RAG (Retrieval Augmented Generation): Das LLM bekommt die passenden Dokumente als Kontext und generiert seine Antwort daraus.
Wo liegen die Grenzen — was kann ein LLM nicht zuverlässig?
LLMs haben kein Faktengedächtnis. Sie generieren die wahrscheinlichste Wortfolge, nicht die nachweislich richtige Antwort. Das führt zu drei konkreten Einschränkungen. Erstens: Halluzinationen. Ein LLM kann eine überzeugende Antwort erzeugen, die sachlich falsch ist — etwa falsche Zahlen, erfundene Quellen oder fehlerhafte Rechtsauslegungen. Zweitens: Wissensgrenzen. Jedes LLM hat ein Trainingsdatum. Ereignisse danach kennt es nicht, sofern keine externe Datenquelle angebunden ist. Drittens: Inkonsistenz. Die gleiche Frage kann bei unterschiedlichen Formulierungen oder zu verschiedenen Zeitpunkten leicht abweichende Antworten liefern. Für Unternehmen bedeutet das: LLMs eignen sich für Entwürfe, Zusammenfassungen und Recherche-Unterstützung. Für rechtsverbindliche Dokumente, Finanzberichte oder Compliance-Entscheidungen braucht es zusätzliche Absicherung.
Welche LLMs gibt es, und worin unterscheiden sie sich?
Die bekanntesten LLMs im Unternehmenseinsatz sind GPT (von OpenAI), Claude (von Anthropic) und Gemini (von Google). Sie unterscheiden sich in Leistungsfähigkeit, Kontextfenstergröße, Preis pro Anfrage und Datenschutzoptionen. Daneben gibt es Open-Source-Modelle wie Llama (von Meta), die Unternehmen auf eigener Infrastruktur betreiben können — mit mehr Kontrolle, aber auch mehr Betriebsaufwand. Für den Mittelstand ist weniger die Modellwahl entscheidend als die Frage, wie das LLM eingebettet wird: über eine fertige App wie ChatGPT, über eine API-Anbindung an eigene Systeme oder als Teil einer maßgeschneiderten Lösung mit Unternehmensdaten.