Rechner · Data & AI

Vector-DB-Rechner: Pinecone vs Weaviate vs Qdrant vs pgvector

Storage, Reads, Writes — und die realen Ops-Stunden für Self-Host. Die ehrliche Zahl, bevor du blind Pinecone draufschmeißt.

13 Tarife·4 Use-Case-Presets·Stand 14.05.2026·Ops-Stunden eingerechnet

live

Bei dieser Vector-Workload sparst du

8.650 €

pro Jahr — Wechsel von Self Weaviate zu Zilliz Free

Günstigster: Zilliz Free · 0,00 €/Monat

Use-Case

Anzahl Vectors

5.0M

100k1M10M100M

Dimension

1024

Reads

500k/Tag

1k10k100k1M10M

Writes

1.0M/Mo

1k100k1M10M100M

Self-Host Ops-Stundensatz

80€/h

Realistisch sind 2 h/Woche bei Self-Host. Setz 0 wenn du eh dauerhaft Bock auf Postgres-Tuning hast.

Zilliz Free

fixed · managed

BEST

0,00€/Mo

0 €/Jahr · 22.89 GB Index

Bis 5M Vec, shared infrastructure

pgvector

fixed · managed

0,00€/Mo

0 €/Jahr · 22.89 GB Index

Extension auf existing Postgres, gratis on top — Perf-Limit bei >5M Vec

Pinecone p1

fixed · managed

64,40€/Mo

773 €/Jahr · 22.89 GB Index

Base

64,40 €

Fixed Pod, predictable latency, 5M Vec/Pod cap

Pinecone s1

fixed · managed

64,40€/Mo

773 €/Jahr · 22.89 GB Index

Base

64,40 €

Storage-optimiert, 5x mehr Vectors/Pod als p1

Zilliz Std

usage · managed

93,19€/Mo

1.118 €/Jahr · 22.89 GB Index

Base

91,08 €

Storage

2,11 €

Dedicated CU, GPU-Search-Add-ons verfügbar

Weaviate Std

usage · managed

126,20€/Mo

1.514 €/Jahr · 22.89 GB Index

Base

124 €

Storage

2,00 €

ab $0.095/GB/Mo Storage on top, SLA included

Self Qdrant

fixed · self-host

self#7

712,80€/Mo

8.554 €/Jahr · 22.89 GB Index

Base

20,00 €

Ops-Zeit

693 €

DE-Hosting, kein managed Backup, du machst Updates

Self Weaviate

fixed · self-host

self#8

720,80€/Mo

8.650 €/Jahr · 22.89 GB Index

Base

28,00 €

Ops-Zeit

693 €

Mehr RAM, gut bei Hybrid-Search

Qdrant Free

fixed · managed

n/a

0,00€/Mo

0 €/Jahr · 22.89 GB Index

Free Tier nur bis 1.0M Vec

Pinecone SLS

usage · managed

n/a

22,43€/Mo

269 €/Jahr · 22.89 GB Index

Storage

6,95 €

Writes

0,30 €

Reads

15,18 €

Free Tier nur bis 0.1M Vec

Weaviate Sandbox

fixed · managed

n/a

23,00€/Mo

276 €/Jahr · 22.89 GB Index

Base

23,00 €

Max 1.0M Vec

Qdrant Std

fixed · managed

n/a

23,00€/Mo

276 €/Jahr · 22.89 GB Index

Base

23,00 €

Storage 22.9 GB > Tier 4 GB

Qdrant Pro

fixed · managed

n/a

82,80€/Mo

994 €/Jahr · 22.89 GB Index

Base

82,80 €

Storage 22.9 GB > Tier 16 GB

Monatliche Kosten · Top 8

€ pro Monat

Zilliz Free

0,00 €

pgvector

0,00 €

Pinecone p1

64,40 €

Pinecone s1

64,40 €

Zilliz Std

93,19 €

Weaviate Std

126,20 €

Self Qdrant

712,80 €

Self Weaviate

720,80 €

Pricing-Stand: 14. Mai 2026 · 13 Tarife · Storage = vectors × dim × 4 B × 1.2USD→EUR ≈ 0.92 · ohne MwSt.

Wann pgvector reicht — Production-Spoiler: meistens

Der häufigste Fehler, den Teams beim ersten RAG-Setup machen: sie schmeißen Pinecone drauf, weil Pinecone in jedem Twitter-Thread auftaucht. Dabei laufen 80 % aller Production-RAG-Workloads mit unter 1 M Vectors. Bei dieser Größe ist pgvector — die Postgres-Extension, die einen HNSW-Index pro Spalte legt — fast immer ausreichend. Du hast dieselbe DB für deine App-Daten und für die Embeddings. Du kannst in einem SQL-JOIN aus User-Tabelle und Vector-Suche kombinieren — etwas, das mit externem Pinecone zwei API-Calls und eine Sync-Pipeline kostet.

Die Grenze: HNSW-Index-Builds in pgvector dauern bei 10 M Vectors mit 1024 dim 30-60 Minuten und blockieren während dieser Zeit das Schreiben. Updates auf bestehende Vectors triggern partielle Re-Builds. Für Use-Cases mit häufigen Updates (z. B. Knowledge-Base, die wöchentlich re-indexed wird) wird pgvector unhandlich. Bis zu 5 M Vectors mit eher Read-heavy Workload: keine Bedenken.

Was du nicht bekommst: Sub-50ms-Latenzen bei 50 M+ Vectors. Distributed Multi-Region-Setups. Wenn du eine konsumentennahe Search-App baust (Algolia-Ersatz für Produkt-Search), kommt irgendwann ein Pinecone- oder Qdrant-Move. Aber selbst dann ist der Switch-Path easy — alle ernstzunehmenden Vector-DBs sprechen REST oder gRPC, und die meisten Frameworks (LangChain, LlamaIndex) haben swap-bare Adapter.

Pinecone Serverless vs Pod — wann der Wechsel sich rechnet

Pinecone hat 2024/2025 sein Serverless-Modell deutlich verbessert. Du zahlst $0,33 pro Million Write-Units, $1,10 pro Million Read-Units und $0,33 pro GB-Monat Storage. Klingt günstig — und ist es für viele Hobby- und Mittelschicht-Workloads. Ab einer bestimmten Größe kippt die Rechnung aber: ein einziger fixed Pod (p1.x1 oder s1.x1) kostet ~70 USD/Monat unabhängig vom Traffic. Bei 10 M Reads pro Tag — also 300 M pro Monat — zahlst du auf Serverless rund 330 USD nur für Reads. Ein s1-Pod macht das fix für 70 USD ohne extra Read-Charges.

Faustregel: sobald deine monatliche Serverless-Rechnung über 150-200 USD geht, wechselst du zu Pods. Sub-Faustregel: für planbare Workloads mit konstantem Traffic sind Pods sowieso ehrlicher kalkulierbar — du hast keinen versteckten Cost-Spike bei einer viral gegangenen Marketing-Aktion. Für Sandbox-Workloads, Spikes und neue Features ist Serverless der bessere Start.

Was du bei Pods aufgibst: Multi-Tenancy. Ein Pod ist ein Index. Wenn du eine B2B-SaaS mit 5.000 Kunden baust und jeder Kunde sein eigenes RAG braucht, ist Serverless mit Namespaces der einzige sinnvolle Weg — oder du wechselst zu Qdrant Cloud, das Multi-Tenancy von Grund auf eingebaut hat.

Self-Hosting auf Hetzner — die echten Stundenkosten

Auf Twitter und in Indie-Hacker-Threads wirst du oft lesen: „Hetzner CCX13 für 20 EUR, da läuft Qdrant drauf, spar dir 200 EUR Pinecone". Das ist halb richtig. Die VM kostet wirklich nur 20 EUR im Monat. Was niemand mit-kalkuliert: die Stunden, die du investierst. Realistisch sind es 2 Stunden pro Woche, sobald die Box wirklich Production-Traffic sieht — Sicherheits-Updates, Backup-Checks, gelegentliche OOM-Alerts, das Drama mit dem ersten Disk-Full-Event.

Bei einem Marktstundensatz von 80 EUR für deine Zeit (oder die deines Engineers in DE) sind 2 h/Woche × 4.33 Wochen = etwa 700 EUR/Monat versteckte Ops-Kosten. Bei dieser Rechnung gewinnt Self-Host nur, wenn:

du in einem Team bist, das ohnehin Postgres oder Redis selbst betreibt — die Vector-DB ist dann marginal-cost und die Ops-Stunden verteilen sich,
du a) als Solo-Founder ohne Ops-Stundenkosten arbeitest (deine Zeit ist „kostenlos"), oder b) das Lernen wert ist — also du sowieso tiefere Vector-DB-Internals verstehen willst,
die Workload-Größe einen Managed-Provider deutlich teurer macht (10 M+ Vectors mit Production-Traffic auf Pinecone Pods läuft schnell auf 300+ USD/Monat — da gewinnt Hetzner auch mit 700 EUR Ops-Kosten).

Der Rechner oben hat einen Slider für deinen Ops-Stundensatz. Stell ihn auf 0, wenn du Solo-Founder bist und deine Zeit nicht opportunistisch verbuchst. Stell ihn auf 80-120 EUR, wenn du ehrlich kalkulierst und dein Engineer die Zeit auch produktiv im Core-Produkt verbringen könnte.

Multi-Tenancy: was nur Pinecone und Qdrant richtig können

Multi-Tenant-Vector-Search ist eines dieser Themen, die im Sandbox harmlos aussehen und in Production zu Schmerzen werden. Das Problem: du hast 1.000 Kunden, jeder Kunde hat 10.000 Dokumente, du willst beim Suchen filtern nach Kunde — oder besser: gar nicht erst kreuz-suchen. Wer das mit einer einzigen großen Index-Tabelle macht und über WHERE tenant_id filtert, lässt den HNSW-Index halb ungenutzt — die Filter werden post-search angewendet, und du holst für jede Query mehr Vectors als nötig.

Pinecone Namespaces sind die saubere Lösung: jeder Tenant kriegt seinen eigenen logischen Index innerhalb derselben physikalischen Pinecone-Region. Du kannst Millionen Namespaces erstellen, ohne extra zu zahlen. Bei Reads filterst du per Namespace in der API-Call selbst — der Index sucht nur in den passenden Vectors.

Qdrant Collections machen dasselbe etwas explizit anders: du hast Sharding pro Collection. Bei vielen kleinen Tenants mit wenig Daten ist das günstiger als Weaviate, das pro Tenant einen eigenen Shard hat (also einen Storage-Overhead pro Tenant). pgvector löst es mit einer einfachen tenant_id-Spalte und einem Composite-Index — funktioniert, aber wird inefficient bei stark unbalanced Tenants (ein Kunde hat 1 M Vectors, alle anderen unter 1.000 — der Index ist dann für die kleinen Tenants verschwenderisch).

Häufige Fragen

Wann reicht pgvector als Production-Vector-DB?

Praktisch immer, solange du unter 5 M Vectors bleibst und Latenz im Bereich 50-200 ms tolerierst. Das deckt 80 % aller Production-RAG-Workloads ab. pgvector hat den Riesenvorteil, dass du in der gleichen DB wie deine App-Daten suchst — keine Sync-Pipeline, kein Eventual-Consistency-Drama. Erst ab ~10 M Vectors oder bei Sub-50ms-Anforderungen wird der Index in pgvector zur Falle, weil HNSW-Index-Builds zu lange dauern und die DB blocken.

Pinecone Serverless vs Pod — wann lohnt der Wechsel?

Serverless ist ideal für unvorhersehbare Workloads und kleine bis mittlere Vector-Mengen. Du zahlst pro Read und Write. Sobald deine Reads konstant über ~500k/Tag liegen oder du sub-50ms p99-Latenz garantieren musst, wird ein dedicated Pod (p1.x1 oder s1.x1, je ~70 USD/Monat fixed) plötzlich günstiger. Bei 10 M Reads/Tag zahlst du auf Serverless ~330 USD/Monat — ein einziger s1-Pod macht das für 70 USD. Faustregel: über 200 USD/Monat Serverless-Bill = Pod-Check machen.

Self-Hosting auf Hetzner: was kostet 'die echte Stunde' Ops?

Realistisch 2 h pro Woche auf Steady-State: Sicherheits-Updates, Backup-Checks, gelegentliche Index-Rebuild-Alerts, Snapshot-Restore-Drills. Bei einem Marktstundensatz von 80 EUR (Senior-DevOps in DE) sind das 700 EUR/Monat versteckte Kosten — mehr als jeder Managed-Plan bis ~10 M Vectors. Self-Host gewinnt nur, wenn du a) ohnehin Ops-Kapazität hast, oder b) wenn die Vector-DB einer von vielen Services auf derselben Hetzner-Box ist und die Stunden sich verteilen.

Multi-Tenancy: was unterscheidet die Anbieter?

Pinecone und Qdrant haben echtes Namespacing pro Tenant inklusive — du kannst Millionen Tenants in derselben Instance halten. Weaviate hat Tenant-Isolation seit 2024, ist aber Shard-basiert und teurer bei vielen kleinen Tenants. pgvector löst Multi-Tenancy über WHERE-Clauses (tenant_id-Spalte) — funktioniert, aber jeder Query muss durch alle Vectors filtern, was den Index-Vorteil bei kleinen Tenants halb wieder einkassiert. Pinecone Pods sind übrigens dezidiert nicht multi-tenant — ein Pod = ein Index.

Wieviel Storage verbraucht 1 M Vectors wirklich?

Faustregel: vectors × dimension × 4 Bytes (float32) plus ~20 % Index-Overhead. 1 M Vectors mit 1024 Dimensionen = ~4,8 GB Index-Storage. Bei Pinecone Serverless zahlst du 0,33 USD/GB/Monat = ~1,60 USD nur für Storage. Bei 50 M Vectors mit 1024 dim sind das schon 240 GB Index = ~80 USD/Monat allein für Storage. Cool Trick: viele Anbieter unterstützen mittlerweile int8-Quantization für 4x weniger Storage bei 1-3 % Recall-Verlust — bei großen Indices ein No-Brainer.

Was die Tabelle nicht zeigt — versteckte Kosten?

Embeddings-Generation selbst (OpenAI text-embedding-3 oder Cohere) ist nicht im Rechner — bei 1 M Writes/Monat mit OpenAI sind das ~5-15 USD on top. Bei Self-Host zusätzlich der Backup-Storage (rechne 2-3x den Index-Storage für sinnvolle Snapshot-History). Bei Pinecone Pods: Replikas verdoppeln den Preis (für HA wichtig). Bei Weaviate Cloud: GPU-Re-Ranking-Add-on kostet ~$50-200 extra. Faustregel: Rechner-Zahl × 1.3 für realistisches Production-Budget.

Verwandte Rechner

Jeden Freitag ein neuer Rechner oder Vergleich

Konkrete Zahl, keine 1.500-Wörter-Texte.

Mit der Anmeldung willigst du ein, von AInfach Data (Daten- & KI-Beratungsagentur) Werbe-E-Mails und Preisupdates zu erhalten. Bestätigung per Double-Opt-in, Abmeldung jederzeit mit 1 Klick.

Auch alle Rechner ansehen.

Vector-DB-Rechner: Pinecone vs Weaviate vs Qdrant vs pgvector

8.650 €

Wann pgvector reicht — Production-Spoiler: meistens

Pinecone Serverless vs Pod — wann der Wechsel sich rechnet

Self-Hosting auf Hetzner — die echten Stundenkosten

Multi-Tenancy: was nur Pinecone und Qdrant richtig können

Häufige Fragen

Weiter rechnen

Postgres-Hosting

LLM-API-Preisrechner

Cloud-VM-Vergleich

Jeden Freitag ein neuer Rechner oder Vergleich