Deutsch (Deutschland) en-US

Matching von eigenen Regionaldaten

Wir bieten unseren Nutzern bereits verschiedene Regionaldaten innerhalb unserer Scientific Use Files an: Daten der Firma Microm und infas Geodaten. Grundsätzlich besteht aber auch die Möglichkeit, weitere, "eigene" Regionaldaten  (z.B. Daten aus der amtlichen Statistik), die Sie nicht in unserem Repertoire finden, an die Daten des NEPS  anzuspielen. Sie benötigen dazu Zugriff auf unser RemoteNEPS-System, da wir Regionaldaten ausschließlich unter geschützten Bedingungen anbieten. Denken Sie bitte bei allen Analysen mit Regionaldaten an die Auflagen aus dem Datennutzungsvertrag (insbesondere §2.5 und §5).

Matching in SC6

In der Startkohorte 6 finden Sie zu diesem Zweck Regionalschlüssel in unseren Remote Scientific Use Files. Es handelt sich bei diesem Schlüssel um die ersten 5 Stellen des amtlichen Gemeindeschlüssels (AGS); dies bezeichnet den administrativen (Land-)Kreis.
Diese regionale Verortung finden Sie zum  Geburts- und zum Wohnort der Befragten,  ggf. zum Zweitwohnsitz, zum Ort der Arbeisstätte, der Schule und der Ausbildungsstelle.  Bitte nutzen Sie unseren NEPSplorer, um mehr Informationen über diese Variablen zu erhalten.
Falls Sie in diesen Startkohorten Regionaldaten anspielen möchten, genügt ein Import ihrer Daten in unser System. Nutzen Sie hierfür die entsprechende  Funktionalität auf unserer Seite. Sie haben dann innerhalb des RemoteNEPS Systems Zugriff auf Ihre Daten und können die Verknüpfung selbst vornehmen.

Matching in SC1-5

In den Daten unserer Schulkohorten (Startkohorte 2,3,4), sowie in den Kohorten 1 und 5 sind keine Kreiskennziffern enthalten. Es ist Ihnen also nicht möglich, Ihre Daten selbst anzuspielen. Damit Sie trotzdem die Möglichkeit haben, mit Regionaldaten zu arbeiten, bieten wir an, die Verknüpfung für Sie zu übernehmen. Sie können dann auf den verknüpften Datensatz in unserem RemoteNEPS-System zugreifen. Damit wir diese Daten aber unkompliziert und zügig zur Verfügung stellen können, bitten wir um die Einhaltung der folgenden Vorgaben:

  1. Erzeugen Sie einen Datensatz ihrer Regionaldaten im Stata Format (alternativ: SPSS).
  2. Die erste Spalte dieses Datensatzes soll die Kreiskennziffer (1-5 Stelle des AGS) enthalten; als Format verwenden Sie bitte ein numerisches (keine Stringvariable, auch nicht wg. führender Null); benennen Sie die Variable "kreis". Beachten Sie bitte, dass der verwendete AGS zeitabhängig ist und ggf.  von Gebietsreformen beeinträchtigt wird. Derzeit verwenden wir in älteren SUF-Releases den Schlüssel aus dem Jahre 2006.  Es besteht aber auch die Möglichkeit, den Schlüssel von 2011 zu verwenden, sofern Sie mit der Unschäfe  einverstanden sind, dass für nach 2006 geteilte Kreise der bevölkerungsstärkere Teil gewählt wird  (Bsp. 2006: Landkreis Demmin (13052) vs. 2011: Landkreise Meckl. Seenplatte (13071) und Vorpommern-Greifswald (13075)). In neueren SUF-Releases verwenden wir den Schlüssel Stand 31.12.2013. Bitte halten Sie in der derzeitigen Übergangsphase auf jeden Fall vorher mit dem FDZ Rücksprache, welchen Stand der amtliche Gemeindeschlüssel in der jeweiligen Kohorte hat!
  3. Falls Sie Daten auf Regierungsbezirkebene (RB) bzw. Bundeslandebene (BL) anspielen wollen, gehen Sie gleich vor, nur nehmen nicht die ersten fünf Stellen des AGS sondern die ersten drei (RB) bzw. zwei (BL). Beachten Sie bitte,   dass sich im Falle von Bundesländern dadurch die folgende Kodierung  ergibt:
    01 Schleswig-Holstein 07 Rheinland-Pfalz 13 Mecklenburg-Vorpommern
    02 Freie und Hansestadt Hamburg 08 Baden-Württemberg 14 Freistaat Sachsen
    03 Niedersachsen 09 Freistaat Bayern 15 Sachsen-Anhalt
    04 Freie Hansestadt Bremen 10 Saarland 16 Freistaat Thüringen
    05 Nordrhein-Westfalen 11 Berlin
    06 Hessen 12 Brandenburg
  4. Dieser Variable folgen sollten wenige Merkmale, die den Kreis nicht eindeutig identifizieren (auch nicht in Kombination).  Bitte haben Sie Verständnis dafür, dass wir Regionaldaten, durch die Kreise auch ohne Kreiskennziffer eindeutig  identifiziert werden können, nicht anspielen können. Falls Sie unsicher sind, ob ein Anspielen ihrer Daten möglich ist: Sie können z.B. in Stata mit dem Befehl isid varname1 varname2 ... prüfen, ob es sich hierbei  um einen Schlüssel handelt (erhalten Sie eine Fehlermeldung, ist die Kombination der Variablen keine ID).
  5. Das Format der weiteren Variablen kann beliebig gewählt werden (auch Stringvariablen).
  6. Verwenden Sie max. 8 Zeichen für die Variablennamen; keine Umlaute oder Sonderzeichen; Kleinschreibung
  7. Achten Sie darauf, dass die Variablen ausreichend bezeichnet sind. Gleiches gilt u.U. für Wertelabels.

Das Ergebnis sollte dann in etwa die folgende Form haben (im Beispiel sind die Sie interessierenden die Variablen type und status):

kreis typ status ...
1001 A 0  
1002 B 0  
1003 A 1  
 ...      
 16077 C
0
 

Bitte mailen Sie diesen Datensatz zusammen mit den folgenden Informationen an uns (fdz@lifbi.de; falls Sie lieber eine andere Form des Datenaustausches bevorzugen, treten Sie bitte direkt mit uns in Kontakt):

  • Ihre Nutzernummer (nu..) und die Nutzernummer von evtl. an dem Vorhaben beteiligten Personen, die auch auf die Daten zugreifen sollen. Diese Personen benötigen natürlich ebenfalls Zugang zu unserem Remote-System
  • Für welche(n) Startkohorte(n) Sie die Informationen benötigen. Beachten Sie bitte, dass  dies nur für die Startkohorten 2,3,4 und 5 nötig ist. In Startkohorte 1 und 6 sind Kreiskennziffern enthalten, mit denen Sie selbst Daten matchen können.
  • In den Kohorten 2,3 und 4 erheben wir sowohl den Wohnort der Eltern der Befragten als  auch den Ort der Schule. Bitte teilen Sie uns mit, für welchen Ort Sie eine Verknüpfung wünschen. Der Wohnort der Eltern ist zwar individueller, liegt aber nur vor, sofern wir Elterninformationen erheben konnten (nur bei ca. 2/3 unserer Schüler der Fall).

Als Ergebnis wird Ihr Datensatz mit der ID unserer Befragten der entsprechenden Startkohorte(n) angereichert und die Kreiskennziffer entfernt. Dementsprechend vervielfacht sich die Anzahl der Zeilen (alle Befragten aus demselben Kreis bekommen die Daten dieser Zeile). Aus obigen Beispiel wird also in etwa:

ID_t wave typ status ...
402301
 1  A 0
402302  1  A 0
402303  1  A 0
402304  1  B 0
402305  1  B 0
402306  1  A 1
402307  1  C 0
402308  1  C 0
402309  1  C 0
 ...      


Diesen Datensatz stellen wir Ihnen in einem Projektverzeichnis in unserem Remote-System zur Verfügung. Sie können dann die Befragten-ID nutzen, um die Daten mit unseren zusammenzuspielen, z.B. an den CohortProfile Datensatz:
. use CohortProfile.dta
. merge 1:1 ID_t wave using "your_datafile.dta"

Beachten Sie bitte, dass zu einer Person ggf. in unterschiedlichen Wellen verschiedene Wohnorte vorliegen können. Aus diesem Grund benötigen wir als Schlüssel die Variablenkombination ID_t wave.