Eine Vektordatenbank ist ein Datenbanksystem, das Inhalte – etwa Texte, Bilder oder Produktbeschreibungen – als sogenannte Vektoren speichert, also als lange Zahlenreihen. Statt nach exakten Übereinstimmungen zu suchen, findet sie Inhalte, die sich in ihrer Bedeutung ähneln. Damit ist sie die technische Grundlage für semantische Suche, Empfehlungssysteme und viele KI-Anwendungen.
Warum normale Datenbanken hier an Grenzen stoßen
Klassische Datenbanken speichern Daten in Tabellen mit Zeilen und Spalten. Eine Suche funktioniert dort über exakte Übereinstimmung: Wer nach „Rechnung" sucht, findet Einträge, in denen genau dieses Wort steht. Synonyme wie „Faktura" oder inhaltlich verwandte Begriffe bleiben außen vor.
Für viele Aufgaben reicht das. Sobald es aber um Bedeutung geht – „Finde mir Dokumente, die zu dieser Frage passen" –, stößt diese Logik an Grenzen. Menschen formulieren dieselbe Sache auf hundert verschiedene Arten. Eine reine Stichwortsuche übersieht das.
Eine Vektordatenbank löst dieses Problem anders: Sie vergleicht nicht Buchstaben, sondern Bedeutungen.
Was ein Vektor in diesem Zusammenhang ist
Ein Vektor ist hier einfach eine Liste von Zahlen, zum Beispiel mehrere hundert oder tausend Werte. Diese Zahlenreihe nennt man Embedding. Sie wird von einem KI-Modell erzeugt und beschreibt die Bedeutung eines Inhalts in numerischer Form. Ähnliche Inhalte bekommen ähnliche Zahlenreihen.
Ein vereinfachtes Bild: Stellen Sie sich eine Landkarte vor, auf der jedes Dokument einen Punkt bildet. Texte über ähnliche Themen liegen nah beieinander, themenfremde Texte weit auseinander. Statt zwei Koordinaten (Länge und Breite) nutzt ein Embedding allerdings sehr viele Dimensionen, um feine Bedeutungsunterschiede abzubilden. Wie diese Zahlenreihen entstehen, erklären wir ausführlich im Artikel Was sind Embeddings – einfach erklärt.
Die Aufgabe der Vektordatenbank ist es, Millionen solcher Punkte zu speichern und auf eine Anfrage hin schnell die nächstgelegenen zu finden.
Wie die Ähnlichkeitssuche funktioniert
Der zentrale Vorgang heißt Ähnlichkeitssuche (englisch: similarity search oder nearest neighbor search). Er läuft in drei Schritten ab:
- Eingabe umwandeln: Die Suchanfrage – etwa eine Frage eines Nutzers – wird vom selben KI-Modell in einen Vektor umgewandelt.
- Abstand messen: Die Datenbank berechnet, welche gespeicherten Vektoren diesem Anfrage-Vektor am nächsten liegen. Dafür misst sie den mathematischen Abstand zwischen den Zahlenreihen.
- Treffer zurückgeben: Die ähnlichsten Inhalte werden ausgegeben – auch wenn sie kein einziges Wort mit der Anfrage gemeinsam haben.
Damit das bei großen Datenmengen in Millisekunden gelingt, nutzen Vektordatenbanken spezielle Indexverfahren. Sie prüfen nicht jeden einzelnen Eintrag, sondern grenzen die Suche geschickt ein. Zusätzlich lassen sich Ergebnisse über klassische Filter (etwa nach Datum, Sprache oder Abteilung) eingrenzen – man kombiniert also Bedeutung und Struktur.
Typische Einsatzgebiete
Vektordatenbanken stecken heute hinter vielen Anwendungen, die mit Sprache und Inhalten arbeiten:
- Semantische Suche: Mitarbeitende finden Dokumente nach Inhalt, nicht nach exaktem Wortlaut.
- Empfehlungssysteme: „Ähnliche Produkte" oder „Das könnte Sie interessieren" basieren auf der Nähe von Vektoren.
- Bild- und Mediensuche: Auch Bilder lassen sich als Vektoren ablegen und nach Ähnlichkeit durchsuchen.
- Wissenszugriff für KI: Sprachmodelle (Large Language Models) erhalten Zugriff auf firmeneigene Dokumente, ohne dass diese im Modell selbst gespeichert sein müssen.
Gerade der letzte Punkt ist für Unternehmen relevant. Er ist das Herzstück von Retrieval-Augmented Generation (RAG) – einem Verfahren, bei dem ein Sprachmodell passende Inhalte zunächst aus einer Vektordatenbank holt und seine Antwort darauf stützt. So antwortet die KI auf Basis geprüfter Firmendokumente statt aus ihrem allgemeinen Trainingswissen.
Einordnung: Wozu wir sie bei AI-Mitarbeitern nutzen
Eine Vektordatenbank ist kein Produkt für Endnutzer, sondern ein Baustein im Hintergrund. Bei AI-Mitarbeitern sorgt sie dafür, dass eine KI-Rolle auf das relevante Wissen eines Unternehmens zugreifen kann – etwa auf Produktinformationen, Richtlinien oder frühere Vorgänge.
Ein einfaches Beispiel: Stellt ein Interessent eine Frage, kann ein AI-Mitarbeiter wie Carl, der Sales Assistant, die passenden internen Inhalte über Ähnlichkeitssuche heraussuchen und seine Antwort darauf aufbauen – auch wenn die Frage anders formuliert ist als die Quelldokumente. Das macht Antworten konkreter und nachvollziehbarer, weil sie sich auf belegbare Inhalte stützen.
Wichtig dabei: Die Daten bleiben dort, wo sie hingehören. Eine Vektordatenbank speichert die Embeddings, nicht jedoch ein neu trainiertes Modell. Inhalte fließen also nicht ins Modell selbst, sondern werden gezielt nachgeschlagen – ein Unterschied, der für Datenschutz und Kontrolle über die eigenen Daten zählt.
Vektordatenbank, Embedding, RAG – wie das zusammenhängt
Diese drei Begriffe werden oft verwechselt. Kurz unterschieden:
- Das Embedding ist die Zahlenreihe, die die Bedeutung eines Inhalts beschreibt.
- Die Vektordatenbank speichert diese Embeddings und durchsucht sie nach Ähnlichkeit.
- RAG ist das Verfahren, das beides nutzt, um ein Sprachmodell mit passenden Inhalten zu versorgen.
Man kann es sich als Kette vorstellen: Embeddings sind die Sprache, die Vektordatenbank ist das Archiv, und RAG ist der Arbeitsablauf, der das Richtige zur richtigen Zeit herausholt. Wer KI-Anwendungen verstehen oder bewerten will, kommt an diesem Zusammenspiel kaum vorbei. Einen breiteren Überblick über solche Grundlagen bietet der Artikel KI-Grundlagen: Was jeder Entscheider wissen sollte.
Verwandte Einträge
Was sind Embeddings – einfach erklärt?
Embeddings übersetzen Text, Bilder oder Audio in Zahlenfolgen, deren Abstand Bedeutung abbildet. Sie sind die Grundlage für semantische Suche, Empfehlungen und RAG.
Weiterlesen →Was ist Tool-Calling (Function Calling) bei LLMs?
Tool-Calling (Function Calling) erlaubt es einem Sprachmodell, gezielt externe Funktionen und Schnittstellen anzusteuern. Wir erklären die Funktionsweise und den praktischen Nutzen.
Weiterlesen →Nächster Schritt
30 Minuten.
Ein echtes Gespräch.
Erzählen Sie uns, wo bei Ihnen die Zeit verloren geht. Wir sagen Ihnen, welcher AI-Mitarbeiter diese Aufgabe übernehmen würde und ob es für Sie überhaupt Sinn ergibt. Kein Pitch, keine Folien.