Inhaltsverzeichnis20 Abschnitte
- TL;DR
- Was Governance für kleine Teams wirklich heißt
- Die Kandidaten
- Atlan — Der moderne Data-Catalog
- Alation — Der Enterprise-Standard
- DataHub — Open Source
- Feature-Vergleich
- Wann welches Tool?
- Atlan, wenn:
- Alation, wenn:
- DataHub, wenn:
- Harbinger Explorer, wenn:
- Die echten Kosten von "Free" und "Enterprise"
- Praktischer Workflow für kleine Teams
- 1. Source-Inventur (30 Minuten)
- 2. PII automatisch flaggen
- 3. Beim Querying dokumentieren
- 4. Monatliche Review (1 Stunde)
- Was Harbinger Explorer ehrlicherweise nicht kann
- FAQ
Du entdeckst, dass dein Praktikant Produktiv-Kund:innendaten — vollständige Namen, Mails, Telefonnummern — aus einem undokumentierten API-Endpoint zieht. Kein Access-Log, keine Column-Permissions, keine Möglichkeit zu sehen, wer in den letzten sechs Monaten noch PII abgefragt hat.
Für ein 500-Personen-Enterprise ist das ein Incident-Ticket. Für ein 12-Personen-Datenteam ohne dedizierte Governance-Rolle ist das Dienstag.
TL;DR
- Brauchst volle Enterprise-Governance, hast Budget? → Atlan oder Alation
- Open Source und Engineer:innen für Maintenance? → DataHub
- Lightweight Governance auf APIs und Files heute? → Harbinger Explorer
Was Governance für kleine Teams wirklich heißt
Vier Dinge:
- Wissen, was du hast — Quellen katalogisieren, Schemas verstehen
- Wissen, was sensibel ist — PII, Finanzdaten, Health-Records
- Steuern, wer was sieht — Column-Level statt nur Table-Level
- Compliance nachweisen — Audit-Trails, Lineage, Doku
Wenn dein Tool das ohne Full-Time-Admin schafft, ist der Job erledigt.
Die Kandidaten
Atlan — Der moderne Data-Catalog
Modern Data Workspace, Slack-Style-UI, tiefe Integration mit Snowflake, dbt, Looker.
Stärken: Schöne UI, dbt-Lineage, ML-PII-Klassifikation, Collaboration auf Data-Assets.
Haken für kleine Teams: Pricing ~30–50k $/Jahr, Onboarding 4–8 Wochen, Featuretiefe, die du bei Teamgröße < 20 nicht nutzt.
Passt für: Teams 20–100 mit modernem Stack und Budget.
Alation — Der Enterprise-Standard
Behavioral Analytics, lernt aus Query-Patterns. Fortune-500-Standard.
Stärken: Search via Usage Analytics, 50+ Konnektoren, GDPR/HIPAA/SOX-Templates.
Haken: ab 50k $/Jahr, 8–16 Wochen Implementation, setzt Data Stewards voraus.
Passt für: Regulierte Branchen mit Compliance-Mandate.
DataHub — Open Source
Leading Open-Source-Metadaten-Plattform (Acryl Data, ex-LinkedIn).
Stärken: Free, extensibles Metadaten-Modell, 50+ Ingestion-Sources, GraphQL-API.
Haken: Self-Hosted = Kubernetes + Kafka + Elasticsearch. Initial-Setup 1–3 Tage. Keine PII-Detection out-of-the-box. Acryl Cloud (managed) ab 12–20k $/Jahr.
Passt für: Engineering-heavy Teams mit Kubernetes-Erfahrung.
Feature-Vergleich
| Feature | Harbinger Explorer | Atlan | Alation | DataHub (OSS) |
|---|---|---|---|---|
| Setup-Zeit | 5 Minuten (Browser) | 4–8 Wochen | 8–16 Wochen | 1–3 Tage |
| PII-Detection | Auto Column Scan | ML-basiert | Built-in | Custom Setup |
| SQL auf Daten | DuckDB im Browser | – | – | – |
| Natural Language | KI generiert SQL | – | NL Search | – |
| API-Crawling | Docs-URL → Auto | – | – | Custom Recipe |
| DB-Konnektoren | Noch nicht | 30+ native | 50+ native | 50+ via Recipes |
| Lineage | Source-Level | Column-Level | Column-Level | Column-Level |
| Compliance-Templates | Manuell | GDPR, HIPAA | GDPR, HIPAA, SOX | Community |
| Pricing | 8–24 €/Monat | ~30–50k $/Jahr | ~50k $+/Jahr | Free (Self-Host) |
Wann welches Tool?
Atlan, wenn:
- 20+ Personen mit modernem Stack
- Lineage über dbt → Snowflake → Looker nötig
- 30k+ Budget
- Non-Tech-User:innen sollen den Catalog nutzen
Alation, wenn:
- Regulierte Branche mit spezifischen Mandaten
- 50+ DB-Konnektoren nötig
- Data Stewards vorhanden oder eingestellt werden
- 50k+ Budget
DataHub, wenn:
- Engineering-Kapazität und Kubernetes-Erfahrung
- Volle Kontrolle über Metadata-Modelle
- Budget eng, Engineering-Zeit verfügbar
Harbinger Explorer, wenn:
- Team unter 20, Governance ist Side-Responsibility
- Primary Sources sind APIs, CSVs, File-based Data
- PII-Detection und Profiling heute, nicht in 8 Wochen
- Keine Infra-Kapazität für Catalog
- Budget unter 300 €/Jahr
Die echten Kosten von "Free" und "Enterprise"
Trap 1: "Wir nehmen die Open-Source-Lösung." DataHub ist exzellente Software — auch ein Kubernetes-Deployment mit Kafka, Elasticsearch, MySQL. Für ein 5-Personen-Team versteckte Kosten von 4–8 Stunden/Monat Engineering. Bei typischen Sätzen 2.000–4.000 €/Monat Opportunitätskosten — mehr als viele kommerzielle Tools.
Trap 2: "Wir kaufen Enterprise und wachsen rein." 50k €/Jahr bei 8 Personen = 6.250 € pro Kopf/Jahr für einen Catalog, dessen 80 % du nicht nutzt. Kleine Teams nutzen typisch < 30 % der Capabilities.
Praktischer Workflow für kleine Teams
1. Source-Inventur (30 Minuten)
Source-Typ | Anzahl | Dokumentiert? | PII-Risiko
------------------|--------|---------------|------------
REST APIs | 12 | 4 von 12 | Hoch
CSV-Uploads | ~30 | 0 | Unbekannt
DB-Tabellen | 45 | 20 von 45 | Mittel
Spreadsheets | ??? | 0 | Unbekannt
2. PII automatisch flaggen
Manuell skaliert nicht. In Harbinger Explorer passiert das beim Hinzufügen einer Quelle automatisch.
3. Beim Querying dokumentieren
Beste Doku ist die, die sich selbst schreibt. Tool, das Queries loggt, Spalten mappt, gibt dir einen lebenden Catalog ohne Doku-Sprints.
4. Monatliche Review (1 Stunde)
- Neue Quellen?
- PII-Flags zu bearbeiten?
- Wer queryt was?
- Compliance-Lücken?
Eine Stunde monatlich schlägt 16 Wochen Implementation.
Was Harbinger Explorer ehrlicherweise nicht kann
- Keine DB-Konnektoren für Snowflake, BigQuery, Postgres (auf Roadmap, noch nicht da).
- Keine Team-Collaboration (kein Shared Workspace, keine Workflows).
- Kein Scheduled Refresh im Starter-Plan — Pro für Automatisierung nötig.
- Kein Streaming-Governance für Kafka-Topics.
- Browser-only, keine Mobile-App.
FAQ
Reicht das DSGVO-konform? Für PII-Erkennung und Spalten-Doku ja. Für Records-of-Processing und Cross-Border-Transfer-Doku brauchst du zusätzlich vertragliche Doku.
Brauche ich einen DPO, wenn ich Atlan/Alation einführe? Tool ändert das nicht. DPO-Pflicht hängt an Mitarbeitendenzahl und Verarbeitungsart, nicht am Catalog.
Was ist mit On-Prem-Daten? DataHub Self-Hosted ist die naheliegende Wahl. Atlan/Alation gehen via Konnektoren.
Wie schnell von zero zu auditierbar? HE: 5 Minuten + 1h/Monat Review. DataHub: 1–3 Tage Setup + laufend Maintenance. Enterprise: 8–16 Wochen.
Stand: 14. Mai 2026.
Geschrieben von
Harbinger Team
Cloud-, Data- und AI-Engineer in DACH. Schreibt seit 2018 über infrastrukturkritische Tech-Entscheidungen — keine Marketing- Folien, sondern echte Trade-offs aus Production-Workloads.
Hat dir das geholfen?
Jede Woche ein neuer Artikel über DACH-Cloud, Data und AI — direkt in dein Postfach. Kein Spam, kein Marketing-Sprech.
Kein Spam. 1-Klick-Abmeldung. Datenschutz bei Loops.so.