Wie funktioniert der Zensus? Geheimhaltung beim Zensus

Um das Grundrecht aller Bürgerinnen und Bürger auf informationelle Selbstbestimmung zu schützen und den Vorgaben des Bundesstatistikgesetzes Rechnung zu tragen, dürfen aus den Veröffentlichungen des Zensus keinerlei Rückschlüsse auf die Angaben von Einzelpersonen oder auf andere Einzelfälle möglich sein. Gleichzeitig sollen so viele allgemeine Erkenntnisse wie möglich aus den veröffentlichten Daten gezogen werden können. Dies wird durch den Einsatz eines sogenannten Geheimhaltungsverfahrens gewährleistet.

Geheimhaltungsverfahren werden im Zensus für alle Auswertungen, die auf demografischen Daten, Gebäude- und Wohnungsdaten, Haushaltsdaten und Familiendaten basieren, angewendet. Bei Daten, die aus einer Stichprobenerhebung hochgerechnet werden, wie zum Beispiel zu Erwerbstätigkeit sowie Schul- und Berufsbildung, ist kein Geheimhaltungsverfahren nötig. Ein Rückschluss auf Einzelangaben wird hier durch die Hochrechnung und anschließende Rundung auf ein Vielfaches von 10 oder Sperrung bei zu geringer Fallzahl unmittelbar verhindert. Die Bevölkerungszahlen werden für alle administrativen Gebietseinheiten (ohne demografische Untergliederung) mit dem unveränderten Originalwert ausgewiesen.

Beim Zensus 2011 wurde die statistische Geheimhaltung durch das Verfahren „Sichere Anonymisierung für Einzeldaten“ (SAFE) sichergestellt. Für den Zensus 2022 haben sich die Statistischen Ämter des Bundes und der Länder für einen Verfahrenswechsel entschieden: Die statistische Geheimhaltung erfolgt nun durch eine stochastische (also zufällige) Überlagerung auf Basis der sogenannten Cell-Key-Methode.

Die Cell-Key-Methode

Sowohl SAFE als auch die Cell-Key-Methode basieren darauf, dass einige Fallzahlen in den Tabellen gegenüber ihren Originalwerten leicht verändert ausgewiesen werden. Bei der Cell-Key-Methode werden im Vergleich zu "SAFE" jedoch nicht die Einzeldaten verändert, sondern leichte Änderungen am Originalergebnis erst bei der Erzeugung der Ergebnisse vorgenommen. Dabei wird einigen Ergebnissen oder Tabellenfeldern (= cell) fest ein kleiner "Überlagerungswert" zugewiesen (z. B. +2 oder -1). Anstelle des Originalergebnisses wird für diese Tabellenfelder die Summe aus Originalergebnis und "Überlagerungswert" veröffentlicht. Die Überlagerung der Ergebnisse erfolgt unter der Maßgabe, den Schutz der Einzelangaben sicherzustellen und die Aussagekraft der Originalergebnisse dabei möglichst unverändert zu lassen. Die Cell-Key-Methode bietet dabei im Vergleich zu "SAFE" eine im Mittel geringere Abweichung der veränderten Ergebnisse von ihren Originalwerten und ermöglicht eine noch höhere Flexibilität bei der Erstellung von Auswertungen.

Anwendung der Cell-Key-Methode auch auf Ergebnisse des Zensus 2011

Im Zuge des Relaunchs der Zensusdatenbank 2011 wurde die Cell-Key-Methode nachträglich auch auf die Ergebnisse des Zensus 2011 angewendet. Auf diese Weise ergibt sich die Möglichkeit, Vergleiche zwischen den Zensusergebnissen aus 2011 und dem Zensus 2022 durchzuführen, die auf Basis des identischen Geheimhaltungsverfahrens (also annährend ohne Bruch in der Methodik) erstellt wurden.

Einige der in der Zensusdatenbank 2011 verfügbaren Ergebnisse können aufgrund des Verfahrenswechsels von den bisherigen Veröffentlichungen zum Zensus 2011 leicht abweichen. Dadurch sind weder die Qualität bisher verfügbarer Publikationen noch die Qualität der in dieser Datenbank abrufbaren Ergebnisse beeinträchtigt.