Question 1

Was ist eine DBU genau?

Accepted Answer

DBU = Databricks Unit. Eine Abstraktionseinheit, die Databricks pro Stunde berechnet, abhängig von Cluster-Größe und Workload-Typ. Ein 8-vCPU/32-GiB-Worker zählt typisch als 1,5 DBU/Stunde. Multipliziert mit dem DBU-Preis (workload- und edition-abhängig) ergibt das den Databricks-Anteil. Dazu zahlst du DIE VMs SELBST nochmal an AWS/Azure/GCP — das ist der entscheidende Punkt, den viele Erstkunden übersehen.

Question 2

Warum ist die Edition so teuer?

Accepted Answer

Standard hat Basic-Security, Premium hat fine-grained ACLs und Identity-Federation, Enterprise hat Audit-Logs, HIPAA und Compliance-Pakete. Für Hobby-Projekte reicht Standard. Sobald du regulierte Daten anfasst, Identity-Provider integrierst oder Audit-Trails brauchst — Premium ist meist die Mindest-Wahl. Enterprise nur für streng regulierte Branchen.

Question 3

Jobs vs All-Purpose — was ist günstiger?

Accepted Answer

Jobs-Compute ist deutlich billiger pro DBU (typisch 0,15 USD vs 0,40 USD für All-Purpose), aber: Jobs-Cluster sind ephemer — sie starten für einen Workflow und sterben danach. All-Purpose-Cluster bleiben warm und unterstützen interaktive Notebooks. Faustregel: wenn die Arbeit getriggert per Workflow läuft, immer Jobs-Cluster nehmen. Wenn ein Data-Scientist die ganzen Tage darauf SQL und Python ad-hoc tippt, All-Purpose.

Question 4

Habe ich Spot-Discount in der Rechnung?

Accepted Answer

Nein, das ist On-Demand. Spot- oder Reserved-Instances können die VM-Hälfte um 30-70 % drücken (Spot mehr Risiko, Reserved Commitment). Für Jobs-Cluster mit Restart-Toleranz sind Spot-Worker eine sehr gute Idee — bei All-Purpose ist Spot meist zu riskant, weil Notebooks abstürzen.

Question 5

Wie genau ist der Snowflake-Vergleich?

Accepted Answer

Sehr grob. Wir schätzen Snowflake bei ähnlicher Workload typisch 5-15 % teurer als Databricks (großzügig gerundet). Die Wahrheit hängt von der Query-Charakteristik ab — Snowflake ist bei kurzen Burst-Queries sehr effizient (auto-suspend nach 60s), Databricks bei großem Throughput-Compute. Ein eigener Snowflake-Rechner kommt — bis dahin dient die Zahl nur als Größenordnung.

Question 6

Lohnt sich Standalone-Spark auf eigenen VMs?

Accepted Answer

Auf dem Papier ja — du sparst den DBU-Markup, der gerne 1.5-3x die VM-Kosten erreicht. In der Praxis musst du dafür einen Spark-Admin (oder ein halbes SRE-Team) bezahlen, der Cluster verwaltet, Jobs migriert, JVM-tuned und mit Library-Konflikten kämpft. Faustregel: ab ~5-7k EUR/Monat Databricks-Rechnung wird DIY rechenbar — darunter ist Databricks immer billiger als ein FTE.

Databricks-DBU-Rechner: was dein Cluster wirklich kostet

2.300 €

Jobs vs All-Purpose — der häufigste Fehler

Edition wählen — Standard, Premium, Enterprise

vs Standalone Spark

Was die Tabelle nicht zeigt

Häufige Fragen

Weiter rechnen

Cloud-VM-Vergleich

Object-Storage-Rechner

LLM-API-Preisrechner

Egress-Rechner

Jeden Freitag ein neuer Rechner oder Vergleich