Zensus Die Geheimhaltung mit der Cell-Key-Methode

Sicherstellung der statistischen Geheimhaltung im Zensus 2011

Um das Grundrecht aller Bürgerinnen und Bürger auf informationelle Selbstbestimmung zu schützen und den Vorgaben des Bundesstatistikgesetzes Rechnung zu tragen, dürfen aus den Veröffentlichungen des Zensus 2011 keinerlei Rückschlüsse auf die Angaben von Einzelpersonen oder auf andere Einzelfälle möglich sein. Dies wird durch den Einsatz eines sogenannten Geheimhaltungsverfahrens gewährleistet.

Ein neues Verfahren zur Sicherstellung der statistischen Geheimhaltung: Weshalb?

Beim Zensus 2011 wurde die statistische Geheimhaltung durch das Verfahren "SAFE" ("Sichere Anonymisierung für Einzeldaten") sichergestellt.
Für den Zensus 2022 haben sich die Statistischen Ämter des Bundes und der Länder für einen Verfahrenswechsel entschieden. Das neue Verfahren, die sogenannte Cell-Key-Methode, ermöglicht eine noch höhere Flexibilität bei der Erstellung von Auswertungen. Im Zuge des Relaunchs der Zensusdatenbank 2011 wurde dieses Verfahren nachträglich auch auf die Ergebnisse des Zensus 2011 angewendet. Somit sind die Ergebnisse aus 2011 auch mit den Ergebnissen aus dem Zensus 2022 vergleichbar.

Welche Auswirkungen hat die Cell-Key-Methode auf die Ergebnisse?

Sowohl "SAFE" als auch die Cell-Key-Methode basieren darauf, dass einige Fallzahlen in den Tabellen gegenüber ihren Originalwerten leicht verändert ausgewiesen werden. Die Cell-Key-Methode bietet im Vergleich zu "SAFE" eine im Mittel geringere Abweichung der veränderten Ergebnisse von ihren Originalwerten.
Die maximale absolute Abweichung vom Originalwert ist bei dieser Methode gering. Falls ein Originalwert exakt Null beträgt, so wird dieser stets unverändert ausgewiesen.

Einige der in der Zensusdatenbank 2011 verfügbaren Ergebnisse können aufgrund des Verfahrenswechsels von den bisherigen Veröffentlichungen zum Zensus 2011 leicht abweichen. Bitte beachten Sie: Weder die Qualität bisher verfügbarer Publikationen noch die Qualität der in dieser Datenbank abrufbaren Ergebnisse sind durch den Wechsel des Geheimhaltungsverfahrens beeinträchtigt.

Für welche Angaben wird die Cell-Key-Methode eingesetzt?

Die Cell-Key-Methode wird auf Auswertungen angewendet, die ausschließlich auf demografischen Daten, Gebäude- und Wohnungsdaten, Haushaltsdaten und Familiendaten basieren. Daten, die aus einer Stichprobenerhebung hochgerechnet werden, wie bspw. zu Erwerbstätigkeit sowie Schul- und Berufsbildung, müssen nicht geheim gehalten werden. Ein Rückschluss auf Einzelangaben wird hier durch die Hochrechnung und die anschließende Rundung auf ein Vielfaches von 10 unmittelbar verhindert.
Bitte beachten Sie: Die amtlichen Bevölkerungszahlen werden für alle administrativen Gebietseinheiten mit dem unveränderten Originalwert ausgewiesen.

Eine Besonderheit in der Darstellung

Bedingt durch die Anwendung der Cell-Key-Methode addieren sich die jeweiligen Einzelwerte einer Tabellenzeile oder -spalte nicht notwendigerweise zur ausgewiesenen Gesamtsumme.

Das folgende Beispiel veranschaulicht dies: Der in der ersten Tabellenspalte ausgewiesene Insgesamt-Wert über alle Altersklassen für die Ausprägung „Männlich“ beträgt 175. Werden die zugehörigen Tabellenfelder der ersten Zeile jedoch separat addiert, ergibt deren Summe 173 (=20+31+32+40+50). Der Insgesamt-Wert über die komplette Tabelle ist mit 371 ausgewiesen. Werden die Werte für die Ausprägungen „Männlich“ und „Weiblich“ jedoch separat addiert, ergibt deren Summe 372 (= 175 + 197). Auch bei einer Addition über die Insgesamt-Werte aller Altersklassen (47 + 56 + 71 + 86 + 109 = 369) sowie bei einer Addition über alle Einzelwerte der Tabelle (20 + 31 + 32 + 40 + 50 + 25 + 25 + 40 + 45 + 60 = 368) ergibt sich jeweils eine leichte Abweichung zum ausgewiesenen Insgesamt-Wert.

GeschlechtInsgesamtAlter (5 Klassen)
Unter 1818 bis 2930 bis 4950 bis 6465 und älter
AnzahlAnzahlAnzahlAnzahlAnzahlAnzahl
Männlich1752031324050
Weiblich1972525404560
Insgesamt37147567186109

Beispieltabelle: Fallzahlen nach Geschlecht und Alter (5 Klassen)

Bitte beachten Sie: Dieser Effekt ist eine direkte Folge der Cell-Key-Methode und sichert zusätzlich zur Vertraulichkeit der Einzelangaben eine möglichst hohe Datenqualität. Wenn Sie bei Ihrer Recherche großen Wert auf die Genauigkeit der Ergebnisse im Detail legen bzw. auch kleine Diskrepanzen zu den amtlichen Ergebnissen vermeiden möchten, sollten Sie die Ergebnisse möglichst direkt über die Zensusdatenbank abrufen. Eine eigenständige Bearbeitung und Berechnung, z. B. von Summen oder Differenzen von Einzelergebnissen, führt u. U. zu größeren Abweichungen von Originalergebnissen.

Welche Auswirkungen hat das Geheimhaltungsverfahren auf statistische Kennzahlen (z. B. Anteile)?

Viele interessante Kennzahlen zu einer Statistik basieren auf Fallzahlen. Dazu gehören, wie jetzt für den Zensus 2011 verfügbar, Anteilswerte. Diese Anteilswerte werden mittels der gering veränderten Fallzahlen berechnet. Somit können die jeweiligen Ergebnisse vom entsprechenden Originalwert leicht abweichen. Die jeweils angewandte Vorgehensweise verhindert Rückschlüsse auf Einzelangaben und stellt gleichzeitig eine möglichst hohe Ergebnisqualität sicher. Ein Korrekturmechanismus verhindert zudem, dass infolge der Berechnung der Kennzahlen anhand der veränderten Fallzahlen unplausible Ergebnisse ausgewiesen werden (z. B. Anteilswerte, die größer als 100 % sind). Auch hier gilt: Wenn Sie bei Ihrer Recherche kleinere Diskrepanzen zu den amtlichen Ergebnissen sowie unplausible Ergebnisse vermeiden möchten, sollten Sie die statistischen Kennzahlen möglichst direkt über die Zensusdatenbank abrufen. Eine eigenständige Bearbeitung und Berechnung führt unter Umständen zu größeren Abweichungen von Originalergebnissen.

Weshalb werden einige statistische Kennzahlen in Klammern ausgewiesen?

Bei statistischen Kennzahlen (z. B. Anteile) kann es insbesondere dann zu hohen prozentualen Abweichungen vom Originalwert kommen, wenn sehr kleine Fallzahlen der jeweiligen Maßzahl zugrunde liegen. In diesem Fall wird die entsprechende Kennzahl in Klammern ausgewiesen, um einen eingeschränkten Interpretationsgehalt zu kennzeichnen. Diese Qualitätsinformation entgeht Ihnen, wenn Sie Kennzahlen selbstständig berechnen. Auch deshalb der Hinweis: Wenn Sie bei einer Recherche großen Wert auf Genauigkeit der Ergebnisse auch im Detail legen bzw. auch kleine Diskrepanzen zu den amtlichen Ergebnissen vermeiden möchten, sollten Sie die Ergebnisse möglichst direkt über die Zensusdatenbank abrufen.

Weiterführende Informationen zum Geheimhaltungsverfahren

Detaillierte Informationen zur Methodik des eingesetzten Geheimhaltungsverfahrens erhalten Sie hier: Geheimhaltung in der Hochschulstatistik, Kapitel 4, Darstellung der stochastischen Überlagerung mit der Cell-Key-Methode S. 91ff., WISTA 06/2019