Question 1

Wie wird der Trainings-Aufwand berechnet?

Accepted Answer

Die effektiven Trainings-Tokens ergeben sich aus Trainings-Tokens × Epochen — ein Datensatz mit 25 Mio. Tokens über 3 Epochen sind 75 Mio. verarbeitete Tokens. Bei OpenAI wird das pro Token abgerechnet, beim eigenen Open-Source-Modell ergibt sich daraus die Zahl der GPU-Stunden (Durchsatz der GPU). Es ist eine Orientierung, kein Angebot.

Question 2

Wann lohnt sich Managed (OpenAI), wann eine eigene GPU?

Accepted Answer

Faustregel: Bei geringem Token-Durchsatz pro Monat ist die token-basierte Abrechnung (OpenAI) günstiger, weil eine eigene GPU im Dauerbetrieb auch im Leerlauf Geld kostet. Ab hoher, gleichmäßiger Last kippt es Richtung eigener GPU — die fixen Stundenkosten schlagen dann die linear steigende Token-Rechnung. Genau diesen Kipppunkt zeigt der Vergleich.

Question 3

Sind die Inferenz-Kosten der eigentliche Treiber?

Accepted Answer

Meistens ja. Das Training ist eine einmalige Investition, aber die Inferenz läuft Monat für Monat — über ein Jahr summiert sie sich schnell auf ein Vielfaches der Trainingskosten. Deshalb ist die HERO-Zahl die Gesamtkosten für Jahr 1: Training einmalig plus zwölf Monate Inferenz. Spielt vor allem am Inferenz-Slider, um den Hebel zu sehen.

Question 4

Warum spielt Datenschutz bei dieser Entscheidung mit?

Accepted Answer

Beim Managed-Weg verlassen Trainings- und Inferenzdaten die EU und laufen über einen US-Anbieter — bei personenbezogenen oder sensiblen Daten ein DSGVO-Thema. Ein eigenes Open-Source-Modell (z. B. Llama oder Mistral) lässt sich EU-gehostet betreiben, mit voller Datenkontrolle. Das kann den Ausschlag geben, selbst wenn die reinen Kosten knapp für Managed sprechen.

Question 5

Was zeigt der Rechner bewusst NICHT?

Accepted Answer

Den Aufwand für die Aufbereitung der Trainingsdaten, Evaluation und Prompt-Iteration — oft der größte versteckte Posten. Außerdem keine Reservierungs- oder Spot-Rabatte auf GPUs und keine Qualitätsunterschiede zwischen Modellen. Die Zahlen sind Listenpreis-Richtwerte für die Größenordnung, nicht für die Ausschreibung.

LLM Fine-Tuning Kosten

459 €

Warum die Inferenz wichtiger ist als das Training

Zwei Wege, ein Modell zu betreiben

Häufige Fragen

Weiter rechnen

LLM-API-Preise

ROI: Reporting & KI

Datenplattform-Kosten

Alle Rechner