Question 1

Was sind Embeddings und warum kosten sie Geld?

Accepted Answer

Ein Embedding ist die Umwandlung von Text in einen Zahlen-Vektor, der die Bedeutung abbildet. Für ein RAG-System („Frage-Antwort auf eigenen Dokumenten“) müssen alle Dokumente einmal in solche Vektoren übersetzt werden. Embedding-Modelle rechnen nach Tokens ab — meist mit einem Preis je 1 Mio. Tokens. Bei text-embedding-3-small sind das nur wenige Cent pro Million, bei größeren Modellen entsprechend mehr.

Question 2

Wie berechnen sich die einmaligen Kosten?

Accepted Answer

Anzahl Dokumente × Ø Tokens je Dokument ergibt die Gesamt-Tokens. Geteilt durch 1 Mio. und multipliziert mit dem Token-Preis des Modells ergibt das die einmaligen Vektorisierungs-Kosten. Faustregel: rund 750 Wörter entsprechen etwa 1.000 Tokens. Lange Dokumente werden vorher in kleinere Chunks zerlegt — jeder Chunk zählt als eigene Einheit.

Question 3

Was sind die laufenden Kosten nach dem Aufbau?

Accepted Answer

Zwei Posten: erstens die Neu-Vektorisierung, wenn sich Dokumente ändern oder neue dazukommen (im Rechner als Prozentsatz des Bestands pro Monat). Zweitens der Storage in der Vektor-Datenbank — der hängt von Anzahl und Dimensionen der Vektoren ab. Eine Managed-Vektor-DB ist teurer pro GB als eine selbst betriebene, dafür ohne eigenen Betriebsaufwand.

Question 4

Lohnt sich ein self-hosted Open-Source-Modell?

Accepted Answer

Self-hosted (z. B. BGE-M3) hat keine Token-Kosten, aber GPU- oder Server-Betrieb, Wartung und Modell-Hosting kosten realistisch ab ein paar hundert Euro im Monat. Das rechnet sich erst bei sehr großem oder dauerhaft hohem Volumen. Für die meisten Mittelstands-Projekte ist eine API zu Beginn günstiger und schneller startklar — der Rechner zeigt den Token-Anteil neutral, die Betriebskosten kommen separat dazu.

Was kostet die Vektorisierung für ein RAG-System?

0,11 €

Embeddings sind selten der teure Teil

Worauf es bei der Modellwahl ankommt

Häufige Fragen

Weiter rechnen

LLM-API-Preise

ROI: KI & Reporting

Datenplattform-Kosten

Alle Rechner