Deutsch (Deutschland) en-US

Regionaldaten

In den Daten des Nationalen Bildungspanels stehen die in der nachfolgenden Tabelle aufgelisteten Ortsangaben zur Verfügung (bitte nutzen Sie den NEPSplorer, um mehr Informationen über diese Variablen zu erhalten):

Bezeichnung Startkohorte Datensatz Variable
Geburtsort     3 4 5 6 pTarget t700101
Wohnort     3 4 5 6 pTarget t751001
  1 2 3 4     pParent p751001
Wohnorthistorie           6 spResidence th21111
Zweitwohnsitz     3 4   6 pTarget t751011
Arbeitsstätte     3 4 5 6 spEmp ts23237
Institution (Panel Frame)   2 3 4     CohortProfile tx80109
Institution (Episoden)     3 4 5 6 spSchool ts11202
  1 2 3 4     spParentSchool p723030
    2           pParent pb11610
      3 4     pTarget tx44401
          5   pTarget tg15207
Erwerb der HZB         5   spSchool tg2232b
Ort der Maßnahme     3 4 5   spVocPrep ts13105
Ort der Ausbildung     3 4 5 6 spVocTrain ts15207
Lehrer: Studienort     3 4     pEducator e537110
Lehrer: Ort Staatsexamen     3 4     pEducator e537170

 

Alle diese Orte werden im Interviewverlauf erfasst und sind daher von den Befragten selbst berichtet. Die genaue erfasste Einheit ist hier der Ortsname, damit ist der Ort die kleinste mögliche verfügbare Regionaleinheit. Kleinere regionale Einheiten stehen nur im Rahmen der Microm- und infas Geodaten zur Verfügung (siehe unten).

Der Ortsname wird im Laufe der Datenaufbereitung für den Scientific Use File in den amtlichen Gemeindeschlüssel (AGS, 8-stellig, Stand 31.12.2013) rekodiert. Aus Datenschutzgründen kann allerdings der komplette Gemeindeschlüssel nicht direkt zur Verfügung gestellt werden. Datennutzende können über die drei Zugangswege auf folgende, daraus abgeleitete, regionale Einheiten zugreifen:

Startkohorte Download RemoteNEPS On-Site
SC1 Bundesland Bundesland Bundesland
Regierungsbezirk
(Land-)Kreis
SC2-SC4 -- Bundesland Bundesland
Regierungsbezirk
(Land-)Kreis
SC5 -- Bundesland
Regierungsbezirk*
(Land-)Kreis*
Bundesland
Regierungsbezirk
(Land-)Kreis
SC6 Bundesland Bundesland
Regierungsbezirk
(Land-)Kreis
Bundesland
Regierungsbezirk
(Land-)Kreis

* ausgenommen Ort der Hochschule  

 

Beachten Sie bitte bei allen Analysen mit Regionaldaten die Auflagen aus dem Datennutzungsvertrag (siehe § 2 Satz 5 und § 5), insbesondere, wie Sie mit Bundeslandangaben arbeiten dürfen.

Matching von eigenen Regionaldaten

Wenn Sie eigene bzw. externe Regionaldaten (z. B. aus der amtlichen Statistik) an die Daten des NEPS anspielen wollen, können Sie das im Rahmen der oben genannten Verfügbarkeiten selbst vornehmen. Bitte denken Sie daran, den Stand des verwendeten amtlichen Gemeindeschlüssels zu berücksichtigen (31.12.2013), da sich die Schlüssel aufgrund von Gebietsreformen ständig verändern. Um eigene Daten innerhalb von RemoteNEPS zu nutzen, müssen diese vorher in das System importiert werden (folgen Sie dazu bitte den Anweisungen hier). Um Daten On-Site zu nutzen, wenden Sie sich bitte vor Ort an einen Mitarbeiter des FDZ.

Möchten Sie Daten anhand eines Schlüssels anspielen, der Remote oder On-Site nicht vorhanden ist (z.B. auf Kreisebene in SC2-SC4 innerhalb von RemoteNEPS oder auf Gemeindeebene in allen Startkohorten), ist dies auch möglich. In diesem Fall übernimmt das FDZ das Matching der Daten für Sie, ohne dass Sie selbst Zugriff auf den jeweiligen Schlüssel erlangen müssen.

Damit wir diese Daten aber unkompliziert und zügig zur Verfügung stellen können, bitten wir um die Einhaltung der folgenden Vorgaben:

  1. Erzeugen Sie einen Datensatz im Stata Format (alternativ: csv).
  2. Die erste Spalte dieses Datensatzes sollte den amtlichen Gemeindeschlüssel enthalten (oder Teile davon, z.B. die Kreiskennziffer); als Format verwenden Sie bitte ein numerisches (keine Stringvariable, auch nicht wegen einer führenden Null). Beachten Sie bitte, dass der verwendete AGS zeitabhängig ist und ggf. von Gebietsreformen beeinträchtigt wird. Derzeit verwenden wir den Schlüssel mit Stand 31.12.2013; in älteren SUF-Releases ist dies noch der Schlüssel aus dem Jahr 2006.
  3. Das Format der weiteren Variablen kann beliebig gewählt werden (auch Textvariablen).
  4. Verwenden Sie max. 8 Zeichen für die Variablennamen; keine Umlaute oder Sonderzeichen
  5. Achten Sie darauf, Variablen- und Wertelabel ausreichend zu bezeichnen.
  6. Sofern Sie in RemoteNEPS mit den Daten arbeiten wollen (gilt nicht für On-Site): Die im Datensatz enthaltenen Merkmale dürfen die regionale Einheit nicht eindeutig identifizieren (auch nicht in Kombination). Bitte haben Sie Verständnis dafür, dass wir Regionaldaten, durch die Gemeinden oder Kreise auch ohne Schlüssel eindeutig identifiziert werden können, nicht anspielen können. Falls Sie unsicher sind, ob ein Anspielen ihrer Daten möglich ist: Sie können z.B. in Stata mit dem Befehl duplicates report varname1 varname2 ... prüfen, ob es sich hierbei um einen Schlüssel handelt (der Befehl gibt die Häufigkeit der Kombinationen aus, Unikate dürfen nicht vorkommen). Falls es für Sie nicht möglich ist, durch Reduktion der Daten diese Bedingung zu erfüllen, können Sie On-Site ohne diese Auflage arbeiten.

Ihr Datensatz sollte also in etwa die folgende Form haben (mit fiktiven Merkmalen typ und status):

kreis typ status
1001 A 0
1002 B 0
1003 A 1
... ... ...
16077 C 0

 

Bitte mailen Sie diesen Datensatz zusammen mit den folgenden Informationen an uns (fdz@lifbi.de;  falls Sie lieber eine andere Form des Datenaustausches bevorzugen, treten Sie bitte direkt mit uns in Kontakt):

  • Ihre Nutzernummer (nu..) und die Nummer Ihres Datennutzungsvertrages (DUA).
  • Für welche Startkohorte(n) Sie die Informationen benötigen.
  • An welche(n) Ort(e) Sie die Daten genau anspielen möchten (siehe Tabelle oben).

Das FDZ überprüft daraufhin die eingegangenen Daten. Bitte haben Sie Verständnis dafür, dass wir in ein Matching nicht vornehmen können, sofern wir die datenschutzrechtlichen Bestimmungen gefährdet sehen (auch wenn obige Bedingungen erfüllt sind). In diesem Fall werden wir versuchen, bilateral eine Lösung zu erarbeiten.

Als Ergebnis wird Ihr Datensatz mit der ID unserer Befragten angereichert und der Regionalschlüssel entfernt. Dementsprechend vervielfacht sich die Anzahl der Zeilen (alle Befragten aus derselben Region bekommen die Daten dieser Zeile). Aus obigen Beispiel wird also in etwa:

ID_t wave typ status
402301 1 A 0
402301 2 A 0
402301 3 B 0
402302 1 B 0
402302 2 B 0
402303 1 A 1
402303 2 C 0
... ... ... ...

 

Diesen Datensatz stellen wir Ihnen in einem Projektverzeichnis in unserem Remote- oder On-Site-System zur Verfügung. Sie können dann die Befragten-ID nutzen, um die Daten mit unseren zusammenzuspielen, z.B. an den CohortProfile Datensatz:

  
	. use CohortProfile.dta
	. merge 1:1 ID_t wave using "your_datafile.dta"


Beachten Sie bitte, dass zu einer Person ggf. in unterschiedlichen Wellen verschiedene Orte vorliegen können. Aus diesem Grund benötigen wir als Schlüssel die Variablenkombination ID_t wave (beim Anspielen an Episodendaten wird die Situation und auch der Schlüssel noch komplexer).

 

Mikrodaten (Microm und infas Geodaten)

Die Scientific-Use-Files des NEPS beinhalten bereits einige kleinräumige Regionalindikatoren der Firmen Microm und infas Geodaten. Mehr Informationen über deren Ausgestaltung entnehmen Sie bitte der jeweiligen Dokumentation (Microm hier, infas Geodaten hier). Diese Daten sind On-Site im Datensicherheitsraum des LIfBi zugänglich.

Im Unterschied zu den oben genannten Ortsdaten wurde für die Zuordnung allerdings die aus dem Kontaktverlauf bekannte tatsächliche Adresse verwendet. Daher beziehen sich die vorliegenden Regionalmerkmale auch auf kleinere regionale Einheiten als die Gemeinde (kleinste Einheit Hausebene). Allerdings ist uns die tatsächliche Identität der Ebene aber ebenfalls unbekannt, daher können diese nicht dazu genutzt werden, eigene Daten anzuspielen.
Zusätzlich ist vielleicht von Interesse, dass die Micromdaten einen systemfreien Identifikator für die Ebene enthalten. Auf diese Weise kann z.B. erkannt werden, welche Personen in der gleichen regionalen Hausebene wohnen. Genaueres hierzu kann der Micromdokumentation entnommen werden.