← Zurück zum Lexikon

KI-Grundlagen

Was ist ein Large Language Model (LLM)?

Ein Large Language Model (LLM), auf Deutsch „großes Sprachmodell", ist ein KI-Modell, das darauf trainiert wurde, menschliche Sprache zu verarbeiten und Text zu erzeugen. Es berechnet auf Basis großer Mengen an Trainingstexten, welches Wort (genauer: welcher Textbaustein) als Nächstes am wahrscheinlichsten folgt – und reiht diese Vorhersagen zu zusammenhängenden Antworten aneinander. Bekannte Beispiele sind die Modelle hinter Diensten wie ChatGPT, Claude oder Gemini.

Der Begriff „large" bezieht sich auf zwei Größen: die Menge an Text, mit der das Modell trainiert wurde, und die Anzahl der internen Parameter – das sind die einstellbaren Werte, in denen das Modell die gelernten Sprachmuster speichert. Moderne LLMs haben oft Milliarden solcher Parameter.

Wie ein LLM funktioniert

Ein LLM arbeitet nach einem einfachen Grundprinzip: Vorhersage des nächsten Tokens. Ein Token ist ein Textbaustein – meist ein Wort oder ein Wortteil. Bekommt das Modell einen Text (den „Prompt"), berechnet es, welches Token am wahrscheinlichsten folgt, hängt es an und wiederholt diesen Schritt. So entsteht Wort für Wort eine Antwort.

Damit das funktioniert, durchläuft Text mehrere Schritte:

  • Tokenisierung: Der Eingabetext wird in Tokens zerlegt.
  • Embeddings: Jedes Token wird in eine Zahlenreihe übersetzt, die seine Bedeutung im Verhältnis zu anderen Tokens abbildet.
  • Verarbeitung: Das Modell gewichtet, welche Teile des Texts füreinander wichtig sind, und leitet daraus die nächste Vorhersage ab.

Die heute übliche Architektur dafür heißt Transformer. Sie wurde 2017 im Forschungspapier „Attention is All You Need" vorgestellt und kann bewerten, wie stark einzelne Teile einer Wortfolge zusammenhängen – auch über größere Abstände im Text hinweg. Dieser Mechanismus (oft „Attention" genannt) ist der Grund, warum LLMs längere Zusammenhänge erfassen können, statt nur das jeweils letzte Wort zu betrachten.

Wichtig: Ein LLM „versteht" Sprache nicht im menschlichen Sinn. Es erkennt statistische Muster in Texten und nutzt sie zur Vorhersage. Das erklärt sowohl die Stärken als auch die typischen Schwächen.

Training: Wie ein LLM lernt

Das Lernen geschieht in einem rechenintensiven Trainingsprozess. Vereinfacht laufen meist zwei Phasen ab:

  1. Vortraining: Das Modell verarbeitet sehr große Mengen an Text und lernt dabei allgemeine Sprachmuster, Fakten und Zusammenhänge. Es lernt, fehlende oder folgende Tokens vorherzusagen.
  2. Feinjustierung: Anschließend wird das Modell gezielt nachtrainiert, etwa damit es Anweisungen besser befolgt oder hilfreichere und sicherere Antworten gibt. Dabei kommt oft menschliches Feedback zum Einsatz.

Nach dem Training ist das Wissen eines LLM zunächst auf den Stand seiner Trainingsdaten begrenzt. Aktuelle Informationen oder firmeneigenes Wissen sind nicht automatisch enthalten.

Stärken und Grenzen

LLMs sind vielseitig: Sie können Texte zusammenfassen, übersetzen, formulieren, Fragen beantworten, Code schreiben und Inhalte klassifizieren. Diese Breite macht sie zu einem flexiblen Werkzeug für viele sprachbezogene Aufgaben.

Gleichzeitig gibt es klare Grenzen, die man kennen sollte:

  • Halluzinationen: Ein LLM kann falsche Aussagen sprachlich überzeugend formulieren, weil es Wahrscheinlichkeiten berechnet, nicht Wahrheit prüft.
  • Wissensstand: Ohne Anbindung an externe Quellen kennt es keine Ereignisse nach seinem Trainingszeitpunkt.
  • Kein eigenes Faktenwissen über Ihr Unternehmen: Interne Daten muss man ihm gezielt zur Verfügung stellen.
  • Abhängigkeit von der Eingabe: Unklare oder unvollständige Prompts führen zu schlechteren Antworten.

Ein verbreiteter Weg, diese Grenzen zu mildern, ist die Retrieval-Augmented Generation (RAG): Dabei werden dem Modell vor der Antwort passende Dokumente aus einer geprüften Wissensquelle bereitgestellt, damit es auf belegbaren Inhalten arbeitet statt nur auf seinem Trainingswissen.

LLMs als Baustein – nicht als ganzes System

In der Praxis ist ein LLM selten allein im Einsatz. Es bildet meist die sprachliche Komponente innerhalb einer größeren Architektur. Erst durch die Anbindung an Datenquellen, Werkzeuge, Schnittstellen (APIs) und Geschäftsabläufe wird aus dem reinen Modell eine nutzbare Anwendung.

Genau hier setzt der Schritt von einem einzelnen Modell zu handlungsfähigen Systemen an. Ein KI-Agent nutzt ein LLM als „Sprachzentrum", kann darüber hinaus aber eigenständig Aufgaben planen und Werkzeuge bedienen – Stichwort Agentic AI. Standards wie das Model Context Protocol (MCP) regeln dabei, wie ein Modell auf externe Daten und Funktionen zugreift.

Einordnung: LLMs und AI-Mitarbeiter

Bei scoreprise.AI sind LLMs ein Bestandteil, nicht das Endprodukt. Ein AI-Mitarbeiter ist eine fest umrissene Rolle mit Namen, Aufgabe und Tonalität, die eine konkrete Tätigkeit dauerhaft übernimmt. Das LLM liefert dabei die Sprachfähigkeit; entscheidend für den praktischen Nutzen sind aber die Anbindung an die richtigen Daten, klare Aufgabendefinition und ein verlässlicher Betrieb.

Ein Beispiel: Der Sales Assistant Carl nutzt Sprachverarbeitung, um Leads zu recherchieren und zu qualifizieren. Damit das verlässlich funktioniert, arbeitet er mit definierten Quellen und Regeln – nicht allein mit dem allgemeinen Wissen eines Modells. So lassen sich die Stärken eines LLM nutzen und seine Schwächen, etwa Halluzinationen, durch Datenanbindung und klare Abläufe begrenzen.

Wer tiefer in die Grundlagen einsteigen möchte, findet einen breiteren Überblick im Beitrag KI-Grundlagen: Was jeder Entscheider über künstliche Intelligenz wissen sollte.

Nächster Schritt

30 Minuten.
Ein echtes Gespräch.

Erzählen Sie uns, wo bei Ihnen die Zeit verloren geht. Wir sagen Ihnen, welcher AI-Mitarbeiter diese Aufgabe übernehmen würde und ob es für Sie überhaupt Sinn ergibt. Kein Pitch, keine Folien.

Erstgespräch vereinbaren → Erst Use Cases ansehen