Data Mesh Implementation: Cloud-Patterns für AWS, Azure und GCP

Inhaltsverzeichnis14 Abschnitte

TL;DR
Die vier Säulen in Cloud-Architektur
Pattern 1: Account-pro-Domain (Strong Isolation)
Pattern 2: Workspace-pro-Domain (Shared Account)
Pattern 3: Schema-pro-Domain (Logical Isolation)
Entscheidungs-Framework
Data-Product-Architektur
Self-Serve: Build vs Buy
Federated Governance
Anti-Patterns
Cloud-Plattform-Vergleich
6-Monats-Roadmap
Wann Data Mesh nicht die Antwort ist
FAQ

Dein Plattform-Team ertrinkt. Marketing, Finance, Logistics — jede Domain reicht Tickets für neue Pipelines ein, und das zentrale Team ist der Bottleneck, den alle anrufen, aber niemand staffen will. Data Mesh verspricht das zu fixen, indem Ownership zu den Domains verschoben wird, die ihre Daten wirklich verstehen. Zwischen Zhamak Dehghanis Vision und deinem Cloud-Stack klafft eine Lücke voller harter Architekturentscheidungen.

TL;DR

Data Mesh ist ein Operating Model, keine Technologie.
Vier Säulen: Domain-Ownership, Data as a Product, Self-Serve-Platform, Federated Governance.
Drei Isolations-Patterns in der Cloud: Account-pro-Domain, Workspace-pro-Domain, Schema-pro-Domain.
Pures Decentralization (jede Domain wählt Stack) scheitert in der Praxis.
Unter 30 Data-Praktiker:innen lohnt Mesh meist nicht.

Die vier Säulen in Cloud-Architektur

Prinzip	Architektur-Concern	Cloud-Implementierung
Domain-Ownership	Compute + Storage Isolation	Separate Accounts/Projects/Workspaces pro Domain
Data as a Product	Discoverability, SLAs, Schema-Contracts	Catalog, Quality-Checks, versionierte APIs
Self-Serve-Platform	Abstrahiertes Infra-Provisioning	IaC-Templates, Platform-Engineering-Team
Federated Governance	Globale Policies, lokale Autonomie	Policy-as-Code, zentraler Catalog, verteilte Enforcement

Pattern 1: Account-pro-Domain (Strong Isolation)

Jede Domain bekommt eigenen Cloud-Account (AWS), Project (GCP) oder Subscription (Azure). Plattform-Team liefert IaC-Templates.

Wann: Regulierte Branchen (Blast Radius zählt), Domains mit verschiedenen Compliance-Anforderungen, Organisationen mit 50+ Data-Engineers über 5+ Domains.

Wann nicht: Teams kleiner als 3 Data-Engineers pro Domain — der Ops-Overhead erschlägt sie.

Trade-Offs:

Starke Security-Grenzen, unabhängige Skalierung, klare Kostenattribution

Cross-Domain-Queries werden Netzwerk- und Governance-Problem
Duplizierte Infra-Kosten (jeder Account braucht eigenes Monitoring, IAM)

Cloud-spezifisch:

AWS: Organizations mit SCPs für Guardrails. Cross-Account-Sharing via Lake Formation oder S3-Bucket-Policies. AWS RAM für Shared Resources.
Azure: Management Groups + Azure Policy. Databricks UC spannt sich nativ über Workspaces.
GCP: Folders in Resource Hierarchy. BigQuery Authorized Datasets für Cross-Project. Analytics Hub für Data-Product-Publishing.

Pattern 2: Workspace-pro-Domain (Shared Account)

Alle Domains teilen sich einen Cloud-Account, kriegen aber isolierte Workspaces.

Wann: Mid-Size-Organisationen (20–50 Praktiker:innen), Domains mit ähnlicher Infrastruktur und Compliance.

Wann nicht: Wenn Security-Incident in einer Domain die andere kompromittieren darf.

Trade-Offs:

Niedrigerer Ops-Overhead, einfacherer Cross-Domain-Zugriff

Noisy-Neighbor-Risiko, Kostenattribution braucht Tagging-Disziplin

Implementation: Databricks Unity Catalog passt hier besonders gut. Ein Metastore über mehrere Workspaces — catalog.schema.table mappt natürlich auf domain.data_product.asset.

Pattern 3: Schema-pro-Domain (Logical Isolation)

Alle teilen eine Plattform-Instanz, eigene Schemas/Datasets pro Domain.

Wann: Kleine Orgs (< 20 Praktiker:innen), Migration von Monolith, PoC-Phase.

Wann nicht: Echte Compute-Isolation nötig.

Trade-Offs:

Minimaler Overhead, schnell, einfache Cross-Domain-Joins

Keine Compute-Isolation, Governance ist Konvention nicht Infra-erzwungen
"Mesh in Name Only" Risiko

Entscheidungs-Framework

Start Data Mesh
   ↓
Wie viele Data-Engineers pro Domain?
   ├─ < 3 → Compliance variiert pro Domain?
   │           ├─ JA → Account-pro-Domain
   │           └─ NEIN → Schema-pro-Domain
   ├─ 3–8 → Workspace-pro-Domain
   │           ↓
   │       Compute-Isolation nötig?
   │           ├─ JA → Account-pro-Domain
   │           └─ NEIN → Workspace
   └─ > 8 → Account-pro-Domain

Start mit Team-Größe — stärkster Prädiktor.
Compliance ist Override — bei differenzierten Anforderungen ist Strong Isolation Pflicht.
Du kannst hochupgraden — Schema → Workspace → Account. Andere Richtung schmerzhaft.

Data-Product-Architektur

Komponente	Zweck	Optionen
Data Asset	Die Daten	Delta-Tabelle, Iceberg-Tabelle, API-Endpoint
Schema-Contract	Versionierte Schema-Definition	Protobuf, Avro, JSON Schema, dbt Contracts
Quality-Checks	Automatisierte Validierung	Great Expectations, Soda, dbt Tests, DLT
SLA-Definition	Freshness, Availability	Custom Metadata, README
Access-Interface	Zugriff	SQL-View, Delta Sharing, REST-API, Pub/Sub
Doku	Menschlich lesbar	Catalog-Eintrag, README
Lineage	Wo kommen Daten her	OpenLineage, UC Lineage, dbt docs

Kritischer Fehler: Die meisten Teams überspringen die SLA-Definition. Ohne ist ein "Data Product" nur eine Tabelle mit README.

Self-Serve: Build vs Buy

Capability	Build	Buy/Managed	Empfehlung
Workspace-Provisioning	Terraform-Module	Databricks-Account-API, GCP Dataplex	Buy — IaC um Managed-APIs
Data-Catalog	Custom	UC, Datahub, Atlan, Collibra	Buy — Catalog ist Table-Stakes
Quality-Framework	Custom Checks	Great Expectations, Soda, Monte Carlo	Start OSS, später managed
Schema-Registry	Confluent	AWS Glue, Databricks-Schemas	Kommt drauf an — Confluent bei Streaming
Cost-Management	Custom	Cloud + Kubecost/Vantage	Buy — FinOps ist reif
Policy-Enforcement	OPA/Rego	Cloud-IAM + UC	Hybrid

Federated Governance

Das Pattern, das sich durchsetzt: zentrale Policy-Definition, verteilte Enforcement.

Zentral:

Globale Klassifikations-Taxonomie (PII, vertraulich, public, intern)
Naming-Conventions und Schema-Standards
Cross-Domain-Sharing-Agreements
Audit- und Compliance-Reporting

Domain-Ebene:

Klassifikationen auf eigene Data-Products anwenden
Domain-spezifische Quality-Checks
Access innerhalb der Domain
SLAs definieren

Anti-Patterns

"Data Mesh" ohne organisatorische Änderung. Zentral-Team in "Plattform-Team" umbenennen, aber Pipelines weiter zentral bauen = Rebranded Monolith.
Self-Serve-Plattform überengineeren. AWS-Komplexität nachbauen, bevor eine Domain ein Data-Product produziert.
Keine Data-Product-Standards. Wenn jede Domain "Data Product" anders definiert, kann niemand vertrauen. DATSIS oder FAIR.
Mesh als Tech-Migration behandeln. Tech = 20 % des Aufwands, Org-Rewiring = 80 %.
Domain-Identifikation skippen. Domains sollen Business-Capabilities sein, keine Org-Chart-Boxes.

Cloud-Plattform-Vergleich

Capability	AWS	Azure + Databricks	GCP
Multi-Tenancy	Accounts + Orgs	Subscriptions + UC	Projects + Folders
Native Sharing	Lake Formation, Clean Rooms	Delta Sharing, UC	Analytics Hub, Authorized Datasets
Catalog	Glue	UC, Purview	Dataplex
Policy-as-Code	SCP, IAM	Azure Policy, UC	Org Policies
Cross-Domain-Compute	Athena Federated	UC Cross-Workspace	BigQuery Cross-Project
Data-Product-Publishing	Kein natives Konzept	UC Shares + Delta Sharing	Analytics Hub
Mesh-Reife	Mittel — viel Assembly	Hoch — UC purpose-built	Mittel — BigQuery-zentrisch

Meinung: Anfang 2026 bietet Azure + Databricks mit UC die kohärenteste Mesh-Experience out-of-the-box. AWS gibt dir maximale Flexibilität, aber du baust das Framework selbst.

6-Monats-Roadmap

Monat 1–2: Foundation

2–3 Pilot-Domains identifizieren
Shared Catalog deployen
Minimum Data-Product-Standard definieren
IaC-Templates für Workspace-Provisioning

Monat 3–4: Erste Data-Products

Pilot-Domains publishen 2–3 Products
Cross-Domain-Consumption-Patterns
Automatisches Quality-Monitoring
Product-Registry

Monat 5–6: Skalieren

2–3 weitere Domains
Federated Governance formalisieren
Cost-Chargeback pro Domain
Retrospective

Wann Data Mesh nicht die Antwort ist

Org hat weniger als 30 Data-Praktiker:innen.
Ein dominanter Use Case (80 % Workload für eine Funktion).
Data-Kultur ist unreif (keine Tests = keine Quality-Checks).
Regulierte Branche mit uniformer Compliance.

FAQ

Was kostet Data Mesh in der Praxis? Plattform-Team von 3–5 Engineers ist Minimum. Plus Catalog (UC, Atlan, DataHub) ab 12k €/Jahr.

Lohnt sich Mesh für ein DACH-Mittelstand-KMU? Selten. Unter 100 Personen ist zentralisierte Plattform meist effizienter.

Welches Cloud-Setup passt am besten? Azure + Databricks mit Unity Catalog. EU-Region (West Europe / North Europe) für Compliance.

Können Domains unterschiedliche Tools wählen? Theoretisch ja, praktisch scheitert es meist. Plattform-Standards mit Wahl innerhalb sind realistischer.

Stand: 14. Mai 2026.

Geschrieben von

Harbinger Team

Cloud-, Data- und AI-Engineer in DACH. Schreibt seit 2018 über infrastrukturkritische Tech-Entscheidungen — keine Marketing- Folien, sondern echte Trade-offs aus Production-Workloads.

Mehr über Marc hello@harbingerexplorer.com

Hat dir das geholfen?

Jede Woche ein neuer Artikel über DACH-Cloud, Data und AI — direkt in dein Postfach. Kein Spam, kein Marketing-Sprech.

Mit der Anmeldung willigst du ein, von AInfach Data (Daten- & KI-Beratungsagentur) Werbe-E-Mails und Preisupdates zu erhalten. Bestätigung per Double-Opt-in, Abmeldung jederzeit mit 1 Klick.

Data Mesh Implementation: Cloud-Patterns für AWS, Azure und GCP

TL;DR

Die vier Säulen in Cloud-Architektur

Pattern 1: Account-pro-Domain (Strong Isolation)

Pattern 2: Workspace-pro-Domain (Shared Account)

Pattern 3: Schema-pro-Domain (Logical Isolation)

Entscheidungs-Framework

Data-Product-Architektur

Self-Serve: Build vs Buy

Federated Governance

Anti-Patterns

Cloud-Plattform-Vergleich

6-Monats-Roadmap

Wann Data Mesh nicht die Antwort ist

FAQ

Weitere Artikel aus Cloud allgemein

Streaming vs Batch Processing: Wann was nutzen (2026)

Surrogate vs Natural Keys: Wann was nutzen (2026)

Event-Driven Data Architecture mit Kafka und CQRS