Deutsch (Deutschland) en-US

Regionaldaten

In den Daten des Nationalen Bildungspanels ist die Einbeziehung von räumlich-regionalen Informationen auf drei verschiedene Arten möglich:

 

1. Regionalangaben aus den Erhebungen

Während der Befragungen mit den Studienteilnehmenden wurden die in der nachfolgenden Tabelle aufgelisteten Ortsangaben erhoben. Bitte nutzen Sie die Variablensuche für weiterführende Informationen zu den einzelnen Variablen.

Bezeichnung Startkohorte Datensatz Variable
Geburtsort x x 3 4 5 6 pTarget t700101
Wohnort x x 3 4 5 6 pTarget t751001
  1 2 3 4 x x pParent p751001
Wohnorthistorie x x x x x 6 spResidence th21111
Zweitwohnsitz x x 3 4 x 6 pTarget t751011
Arbeitsstätte x x 3 4 5 6 spEmp ts23237
Institution (Panel Frame) x 2 3 4 x x CohortProfile tx80109
Institution (Episoden) x x 3 4 5 6 spSchool ts11202
  1 2 3 4 x x spParentSchool p723030
  x 2 x x x x pParent pb11610
  x x 3 4 x x pTarget tx44401
  x x x x 5 x pTarget tg15207
Erwerb der HZB* x x x x 5 x spSchool tg2232b
Ort der Maßnahme x x 3 4 5 x spVocPrep ts13105
Ort der Ausbildung x x 3 4 5 6 spVocTrain ts15207
Lehrer: Studienort x x 3 4 x x pEducator e537110
Lehrer: Ort Staatsexamen x x 3 4 x x pEducator e537170

* HZB: Hochschulzugangsberechtigung

Alle aufgelisteten Ortsangaben werden im Interviewverlauf erfasst und sind daher von den Befragten selbst berichtet. Die genaue Einheit ist hier der Ortsname; damit ist der Ort die kleinstmögliche verfügbare Regionaleinheit. Kleinere regionale Einheiten sind nur im Rahmen der Microm- und infas-Geodaten zugänglich.

Der Ortsname wird im Zuge der Datenaufbereitung für die Scientific-Use-Files in den Amtlichen Gemeindeschlüssel (AGS, 8-stellig, Stand 31.12.2013) rekodiert. Aus Datenschutzgründen kann der komplette Gemeindeschlüssel nicht direkt in den Daten zur Verfügung gestellt werden. Datennutzende können jedoch über die drei Datenzugangswege auf daraus abgeleitete Regionaleinheiten zugreifen.

Startkohorte Download RemoteNEPS On-Site
SC1 Bundesland Bundesland Bundesland
Regierungsbezirk
(Land-)Kreis
SC2 - SC4 -- Bundesland Bundesland
Regierungsbezirk
(Land-)Kreis
SC5 -- Bundesland
Regierungsbezirk*
(Land-)Kreis*
Bundesland
Regierungsbezirk
(Land-)Kreis
SC6 Bundesland Bundesland
Regierungsbezirk
(Land-)Kreis
Bundesland
Regierungsbezirk
(Land-)Kreis

* ausgenommen: Ort der Hochschule

Beachten Sie bitte bei allen Analysen mit Regionaldaten die Auflagen aus dem Datennutzungsvertrag (siehe § 2 Satz 5 und § 5), hier insbesondere die Hinweise zum Umgang mit der Bundeslandkennung.

 

Zuspielen eigener Regionalindikatoren

Wenn eigene bzw. externe Regionalindikatoren (z. B. aus der amtlichen Statistik) an die Daten des NEPS angespielt werden sollen, kann dies im Rahmen der oben genannten Verfügbarkeiten selbst vorgenommen werden. Dabei ist der Stand des verwendeten Amtlichen Gemeindeschlüssels zu berücksichtigen (31.12.2013), da dieser Schlüssel aufgrund von Gebietsreformen prinzipiell veränderlich ist. Um eigene Regionaldaten innerhalb von RemoteNEPS zu nutzen, müssen diese vorher in das geschützte System importiert werden (siehe dazu die Hinweise zum Umgang mit RemoteNEPS). Um Daten in der On-Site-Umgebung des Datensicherheitsraums am LIfBi zu nutzen, ist im Vorfeld eine Absprache mit dem Forschungsdatenzentrum (FDZ) zu treffen.

Sollen Regionalindikatoren anhand eines Schlüssels zugespielt werden, der in der Remote- oder der On-Site-Umgebung nicht verfügbar ist (z. B. die Kreisebene in den Startkohorten 2 bis 4 innerhalb von RemoteNEPS oder die Gemeindeebene in allen Startkohorten), so ist dies nur indirekt möglich. In diesem Fall übernimmt das FDZ das Matching der Daten, ohne dass der oder die Datennutzende selbst einen Zugriff auf den jeweiligen Schlüssel in den NEPS-Daten erlangt. Damit diese Daten unkompliziert und zügig zur Verfügung gestellt werden können, bittet das FDZ um Beachtung der folgenden Vorgaben:

  • Erzeugen Sie einen Datensatz im Stata-Format (alternativ: CSV-Datei).

  • Die erste Spalte dieses Datensatzes soll den Amtlichen Gemeindeschlüssel enthalten (oder Teile davon, z. B. die Kreiskennziffer). Verwenden Sie bitte ein numerisches Format (keine Stringvariable, auch nicht wegen einer führenden Null). Denken Sie daran, dass der verwendete Gemeindeschlüssel zeitabhängig ist und ggf. von Gebietsreformen betroffen ist. Derzeit wird für die NEPS-Daten der Schlüssel mit Stand vom 31.12.2013 verwendet; in älteren Releases von Scientific-Use-Files ist dies noch der Schlüssel aus dem Jahr 2006.

  • Das Format der weiteren Variablen kann beliebig gewählt werden (auch Textvariablen).

  • Verwenden Sie max. 8 Zeichen für die Variablennamen; keine Umlaute oder Sonderzeichen.

  • Achten Sie darauf, Variablen- und Wertelabel im Datensatz hinreichend zu definieren.

  • Sofern Sie in RemoteNEPS mit den Daten arbeiten wollen – gilt nicht für On-Site: Die im Datensatz enthaltenen Merkmale dürfen die regionale Einheit nicht eindeutig identifizieren (auch nicht in Kombination). Regionalindikatoren, durch die Gemeinden oder Kreise auch ohne Schlüssel eindeutig zu identifizieren sind, können nicht an die NEPS-Daten angespielt werden. Falls Sie unsicher sind, ob ein Zuspielen der eigenen Regionalindikatoren möglich ist: Sie können z. B. in Stata mit dem Befehl duplicates report varname1 varname2 ... prüfen, ob es sich um einen Schlüssel handelt (der Befehl gibt die Häufigkeit der Kombinationen aus, Unikate dürfen nicht vorkommen). Ist die Bedingung nicht zu erfüllen, auch nicht durch Reduktion bzw. Vergröberung der Daten, kann alternativ in der On-Site-Umgebung ohne diese Auflage mit den verknüpften Daten gearbeitet werden.

Der anzuspielende Datensatz sollte in dieser Form vorliegen (mit den fiktiven Merkmalen typ und status):

kreis typ status
1001 A 0
1002 B 0
1003 A 1
... ... ...
16077 C 0

 

Der aufbereitete Datensatz mit den Regionalindikatoren ist zusammen mit folgenden Informationen an das FDZ zu senden (fdz@lifbi.de):

  • Ihre Nutzernummer (nu..) und die Nummer des betreffenden Datennutzungsvertrags
  • die für das Zuspielen der Regionalindikatoren relevante(n) NEPS-Startkohorte(n)
  • den Ort bzw. Datenzugangsweg für die Arbeit mit den verknüpften Daten (siehe Tabelle oben)

Das FDZ prüft zunächst den übermittelten Datensatz mit den Regionalindikatoren. Ein Matching mit den NEPS-Daten kann nur erfolgen, wenn die datenschutzrechtlichen Bestimmungen gewährleistet sind. Bei Problemen mit dieser Vorgabe wird versucht, bilateral eine Lösung zu erarbeiten. Im Ergebnis wird der Datensatz mit den Regionalindikatoren um die ID der NEPS-Studienteilnehmenden angereichert und der hierfür verwendete Regionalschlüssel entfernt. Mit dem Matching vervielfacht sich die Anzahl der Zeilen im Datensatz, da alle Fälle aus derselben Regionaleinheit die Daten der entsprechenden Zeile zugespielt bekommen. Mit dem obigen Beispiel sähe das so aus:

ID_t wave typ status
402301 1 A 0
402301 2 A 0
402301 3 B 0
402302 1 B 0
402302 2 B 0
402303 1 A 1
402303 2 C 0
... ... ... ...

 

Der um die ID-Variable ergänzte Datensatz wird anschließend in einem Projektverzeichnis in der Remote- oder On-Site-Umgebung für die Analysen zugänglich gemacht. Anhand der ID-Variable ist es möglich, die Regionalindikatoren mit den Befragungs- und Kompetenzdaten der NEPS-Erhebungen zusammenzuspielen, z. B. über den in allen NEPS-Startkohorten enthaltenen Datensatz CohortProfile:

  
	. use CohortProfile.dta
	. merge 1:1 ID_t wave using "your_datafile.dta"

Aufgrund des Panelcharakters des NEPS ist zu beachten, dass zu einer Person in unterschiedlichen Wellen ggf. unterschiedliche Ortsangaben vorliegen. Aus diesem Grund wird für das Zuspielen von Regionalindikatoren die Variablenkombination ID_t & wave als Schlüssel benötigt. Beim Matching von Regionalindikatoren mit Episodendaten sind die Anforderungen noch etwas komplexer.

↑ nach oben

 

2. Georeferenzierung der Wohnadresse (Griddaten)

Im Kontext des LIfBi-Projekts NEPSGeoDaten (2021-2024) wurden sämtliche zu diesem Zeitpunkt bekannten Wohnorte der Studienteilnehmenden des NEPS (Startkohorten SC1 bis SC6) vom Erhebungsinstitut in eine Geokoordinate umgewandelt. Diese Georeferenzierung umfasst Adressinformationen von knapp 52.000 Personen. Die Geokoordinaten wurden anschließend auf ein einheitliches 100m X 100m Gitterzellenraster vergröbert (Lambert-Projektion – GeoGitter Inspire; © GeoBasis-DE / BKG, 2022) und dem LIfBi zur Verfügung gestellt. Die Aufbereitung dieser Griddaten für wissenschaftliche Nutzungszwecke beinhaltete auch die Anreicherung mit zusätzlichen Raumbezügen (u. a. Gemeinde- und Stadtteilschlüssel).

Die Gridinformationen mit 100m X 100m oder davon ableitbaren Rastergrößen wie 500m, 1km und 10km eröffnen einen weiteren Zugang zu kleinräumigen Bildungs- und Ungleichheitsanalysen auf Basis der NEPS-Daten. Sie können gemäß der oben beschriebenen Prozedur und unter den gleichen Bedingungen zur Zuspielung von eigenen Regionalindikatoren genutzt werden. Eine ausführliche Darstellung des Prozesses, der Datenstruktur und ausgewählter Verteilungen findet sich im NEPS Survey Paper No. 125.

(external) Helbig, M., Karwath, C., Koberg, T. & Ruland, M. (2025). NEPSGeoDaten: Anreicherung der im Panel verfolgten Bestandskohorten des NEPS mit umfangreichen Raumdaten. NEPS Survey Paper No. 125.

↑ nach oben

 

3. Räumliche Mikrodaten (Microm und infas geodaten)

Die Scientific-Use-Files des NEPS beinhalten bereits einige kleinräumige Regionalindikatoren der kommerziellen Anbieter Microm und infas geodaten (mittlerweile: infas 360). Diese Indikatoren sind ausschließlich in der On-Site-Umgebung im Datensicherheitsraum des LIfBi verfügbar. Weiterführende Informationen können der jeweiligen Dokumentation entnommen werden:

(external) Schönberger, K. & Koberg, T. (2016). Regionaldaten: Microm. Technical Report.
(external) Koberg, T. (2016). Regional data: infas geodaten. Technical Report.

Für die Zuordnung der Regionalmerkmale zu den Studienteilnehmenden wurden die aus dem Kontaktverlauf der Erhebungen bekannten Adressen verwendet, nicht die Selbstauskünfte der Befragten. Aus diesem Grund beziehen sich die Indikatoren auch auf kleinere regionale Einheiten als die Gemeinde (kleinste Einheit: Hausebene). Die Verknüpfung mit der NEPS-ID erfolgte durch das adressdatenhaltende Erhebungsinstitut. Aus Datenschutzgründen ist die tatsächliche Identität der Regionaleinheiten auch dem FDZ unbekannt. Daher können diese Daten auch nicht dafür genutzt werden, um andere Regionalmerkmale anzuspielen.

Für die Microm-Daten existiert ein systemfreier Identifikator für die Regionaleinheiten, um Personen mit Zuordnung zur gleichen Hausebene erkennen zu können. Genauere Auskünfte hierzu bietet die oben genannte Dokumentation.

↑ nach oben