Die Wissenschaft hinter synthetischen Daten

Synthetische Befragte sind nicht mehr Spekulation, sondern Standard. Peer-Review-Studien in Political Analysis, dem Journal of Marketing, Psychology & Marketing sowie Replikationen von EY, Harvard, MIT Sloan und Qualtrics zeigen, dass kalibrierte synthetische Daten heute die traditionelle rein menschliche Forschung erreichen — und in manchen Fällen übertreffen.

95%
Korrelation der EY-Markenumfragen-Replikation
90%
der menschlichen Test-Retest-Reliabilität (arXiv 2025)
77%
der von Menschen erkannten Themen wiedergewonnen (Journal of Marketing 2025)
DAS WICHTIGSTE ERGEBNIS

EY replizierte seine CEO-Markenumfrage mit 1.000 synthetischen Personas

95%
Korrelation mit der Originalumfrage

In einem Doppelblindtest führte das Beratungsunternehmen EY seine jährliche Global Brand Survey—gerichtet an CEOs von US-Unternehmen mit über 1 Mrd. $ Umsatz—zweimal durch: einmal über klassische Befragung, einmal über 1.000 von Aaru erstellte synthetische Personas.

Die synthetische Umfrage zeigte eine 95%-Korrelation mit der echten. EY rekonstruierte zudem den jährlichen Global Wealth Research Report an einem einzigen Tag mit einer medianen Korrelation von über 90% zur ursprünglichen sechsmonatigen Studie.

— Toni Clayton-Hine, EY CMO. Berichtet in Solomon Partners (Sept. 2025).

Fallstudie lesen
PEER-REVIEW-FORSCHUNG

Die wissenschaftliche Grundlage für synthetische Befragte

Vier grundlegende Studien aus führenden Fachzeitschriften belegen, dass kalibrierte synthetische Daten menschliche Umfrageantworten mit wissenschaftlicher Strenge reproduzieren.

Journal of Marketing
Arora, Chakraborty & Nishimura · 2025 · Vol. 89(2)

KI–Mensch-Hybride in der Marketingforschung

Die KI–Mensch-Hybride erzeugt informationsreiche, kohärente Daten, die rein menschliche Daten an Tiefe und Erkenntnisgewinn übertreffen, und erreicht menschliches Niveau bei der Themengenerierung. Die LLM-Hybride identifizierte 77 % der von menschlichen Analysten erkannten Themen.

DOI: 10.1177/00222429241276529
arXiv
Maier et al. · Oktober 2025 · arXiv:2510.08338

LLMs reproduzieren Kaufabsichten über semantische Ähnlichkeit

Getestet an 9.300 menschlichen Antworten aus 57 Körperpflege-Umfragen erreichte die Semantic Similarity Rating-Methode 90 % der menschlichen Test-Retest-Reliabilität. Die Verteilungsähnlichkeit zu echten Daten lag über 0,85 (Kolmogorov–Smirnov).

Auf arXiv lesen
Political Analysis
Argyle et al. · 2023 · Cambridge University Press

Out of One, Many: Sprachmodelle zur Simulation menschlicher Stichproben

Die wegweisende „Silicon-Samples“-Studie. Mit soziodemografischen Profilen konditioniertes GPT-3 emuliert akkurat die Antwortverteilungen über menschliche Untergruppen hinweg und reproduzierte echte Umfrageergebnisse über vielfältige Bevölkerungsgruppen.

DOI: 10.1017/pan.2023.2
Psychology & Marketing
Sarstedt, Adler, Rau & Schmitt · 2024 · Vol. 41(6)

Silicon Samples mit LLMs in der Konsumenten- und Marketingforschung

Etabliert formale akademische Leitlinien für Silicon-Sampling. Schlussfolgerung: synthetische Stichproben sind besonders vielversprechend in den vorgelagerten Phasen der Forschung — qualitative Vortests, Pilotstudien und Hypothesengenerierung.

DOI: 10.1002/mar.21982
METHODOLOGIE IN DER PRAXIS

Die Strenge kommt aus dem Design, nicht nur aus dem Modell

Yatabase Fast Research nutzt ein sequenziell-exploratives Mixed-Methods-Design (Creswell & Plano Clark) — das akademische Standardprotokoll für die Kombination qualitativer und quantitativer Phasen. Jeder Fast-Research-Lauf erzeugt drei methodologisch eigenständige Generierungen, alle verankert an einem peer-reviewten theoretischen Rahmen.

1
Synthetische Personas

Erzeugt gegen Ihren Kontext und a priori auf den Konstrukten des Rahmens bewertet. Was dem Archetyp wichtig wäre.

2
Qualitative Interviews

Offene Gespräche mit jeder Persona. Themen werden extrahiert — sowohl rahmenkonforme als auch emergente. Was synthetische Befragte sagen.

3
Bestätigende Umfrage

Entworfen aus dem Rahmen und den Themen aus Phase 2. Was synthetische Befragte messen.

Der Konvergenzbericht trianguliert alle drei. Wo sie übereinstimmen, erhalten Sie einen bestätigten Befund. Wo sie divergieren, haben Sie eine forschungswürdige Spannung aufgedeckt — genau das, wofür echte Mixed-Methods-Forschung gemacht ist.

EIN LIVE-BEFUND AUS DER PIPELINE

Die Intentions–Handlungs-Lücke bei der Migration von Remote-Arbeitern

Ein Yatabase-Fast-Research-Lauf untersuchte digitale Nomaden, die Coworking in Ubud erwägen — verankert am Push–Pull–Mooring-Modell der Migration. Fünf Konstrukte wurden über drei Methoden trianguliert.

2
Bestätigt
Push-Faktoren, Pull-Faktoren
2
Differenziert
Mooring-Faktoren, Migrationsabsicht
1
Spannung markiert
Migrationsverhalten
Die Spannung ist der Befund

Die Umfrage zeigte hohes Verhaltens-Commitment (Mittelwert 7,3/10). Die Interviews widersprachen deutlich (schwache Belege). Die Personas hatten es ebenfalls nicht vorhergesagt. Die Pipeline brachte eine klassische Intentions–Handlungs-Lücke ans Licht — ein Phänomen, dem Migrationsforscher ganze Karrieren widmen — durch rein methodologische Diskrepanz, ohne dass sie danach gesucht hätte.

Das ist es, was Triangulation über wirklich unabhängige Generierungen hinweg hervorbringt. Es ist die strukturelle Erwiderung auf „Sie haben einfach eine KI gefragt."

Plus: 4 von 4 in Interviews aufgetauchten Themen quantitativ validiert
Wellness-Integration
100% starke Zustimmung · 9,5/10
Naturnahe Arbeitsräume
100% starke Zustimmung · 9,6/10
Berufliche Wachstumschancen
92% starke Zustimmung · 8,7/10
Kulturelles Eintauchen
81% starke Zustimmung · 8,2/10

Themen, die in den Interviews aufkamen (außerhalb des Rahmens), wurden in der danach entworfenen Umfrage getestet. Jedes hielt im großen Maßstab stand — das sequenziell-explorative Design beweist seinen Wert.

Die Wissenschaft in Aktion erleben

Personas erstellen, eine Umfrage oder ein Interview durchführen und sehen, was synthetische Befragte enthüllen — in Minuten.