Deutsch (Deutschland) en-US

Datentools für Stata

Das relativ vielseitige Datenformat Statas ermöglicht es, die Scientific Use Files (SUFs) des NEPS mit einfachen Mitteln um zusätzliche Informationen anzureichern. Um diese angereicherten Informationen für die Nutzer möglichst einfach darstellbar zu machen, stellt das Forschungsdatenzentrum ein Paket mit Zusatzprogrammen für Stata („ado Dateien“) zu Verfügung.

Mehrsprachige Datensätze

Die vom FDZ zu Verfügung gestellten Datensätze stehen mit mehrsprachigen (derzeit: deutschen und englischen) Werte- und Variablenlabels zu Verfügung. Stata-Nutzer können über Statas label language Kommando unmittelbar im Deratensatz umgestellt werden.

. label language
Language for variable and value labels


Available languages:
de
en


Currently set is: . label language de
To select different language: . label language <name>
(more output omitted)
. label language en

Daten-Signaturen

Bei der Veröffentlichung wird für jeden Stata-Datensatz eine Signatur erzeugt, die im Datensatz gespeichert wird. Stata-Nutzer können mit dem Stata-Kommando datasignature confirm prüfen, ob der Datensatz seit der Veröffentlichung modifiziert wurde:

. datasignature confirm
(data unchanged since 05aug2013 15:52)

NEPStools

Wie bereits erwähnt stellt das FDZ einige Stata-Programme als Stata-Paket zu Verfügung.

Installation und Update

Das Paket kann über Statas internen Installationsmechanismus installiert werden:

. net install nepstools, from(http://nocrypt.neps-data.de/stata)

Ein Update sollte von Zeit zu Zeit durchgeführt werden, weil das Programmpaket regelmäßig aktualisiert wird:

adoupdate nepstools , update

Sollte Ihnen Statas regulärer Installationsmechanismus nicht zu Verfügung stehen, können Sie das Paket alternativ manuell als ZIP-Datei herunterladen.

Es ist zu empfehlen, diese Seite und die für jedes zu Verfügung gestellte Programm vorhandenen Stata-Hilfeseite vor der Benutzung aufmerksam zu lesen („help <Programm>“),

nepsuse – vereinfachtes Öffnen von NEPS-SUF-Datensätzen

Dieses Programm vereinfacht das Öffnen von NEPS-SUF-Datensätzen, indem es dem Nutzer das Zusammensetzten des Dateinamens aus seinen Bestandteilen (Startkohorte, Versionsnummer, Zugangsweg) abnimmt. Die entsprechenden Parameter können dabei entweder direkt als Option beim Aufruf angegeben werden, oder zur Widerverwendung als globale Makros abgespeichert vorliegen.

Die Stata-Syntax

. use "/Pfad/zur/Datei/SC6_pTarget_D_6-0-1.dta"
. * ... beliebige Analysebefehle ...*
. use "/Pfad/zur/Datei/SC6_Methods_D_6-0-1.dta" , clear
. * ... weitere Analysebefehle ...*

kann somit im Idealfall abgekürzt werden zu:

. global NEPSuse_cohort SC6
. global NEPSuse_level D
. global NEPSuse_version 6.0.1
. nepsuse "pTarget"
. * ... beliebige Analysebefehle ...*
. nepsuse "Methods" , clear
. * ... weitere Analysebefehle ...*

Details zur Verwendung enthält die mitgelieferte Stata-Hilfeseite.

nepsmiss – Rekodierung von fehlenden Werten

Dieses Programm rekodiert die in NEPS-SUFs standardmäßig numerisch ausgelieferten Fehlwerte (-97, -98, etc.) in Statas „Extended Missings“ (.a, .b, etc.). Im Gegensatz zu Statas internen Kommandos mvencode und mvdecode werden auch Wertelabels korrekt umgeschrieben, und eine Standardliste mit den NEPS-Fehlwerten ist bereits vordefiniert.

. nepsmiss t731454
Recoded 9450 values in total

Dieser Prozess kann mit der Option reverse rückgängig gemacht werden:

. nepsmiss t731454 , reverse
Recoded 9450 values in total

Es ist zu empfehlen, nach der Aufbereitung der Daten und vor Beginn einer Analyse im Arbeitsdatensatz alle Missings mit nepsmiss umzukodieren (nepsmiss _all).

Beispieldatensatz vor und nach der Anwendung von nepsmiss:

ID_t wave t731454
8010851 2 -97
8012254 1 -54
8002388 2 -98
8012254 2 5
8002388 1 1
ID_t wave t731454
8010851 2 .b
8012254 1 .c
8002388 2 .a
8012254 2 5
8002388 1 1

infoquery – Darstellung angereicherter Metadaten

Wie Sie möglicherweise bereits wissen, werden NEPS SUFs mit erweiterten Metadaten angereichert. Sie sind in Stata-Datensätzen als characteristics gespeichert. Das Programm infoquery ist dafür gedacht, diese Attribute unmittelbar in Statas Dialogmodus anzuzeigen.

. label language en
. infoquery t514001
---------------------------------------------------------------------------
query result for variable t514001:

t514001[NEPS_instname]:

zufrie1

t514001[NEPS_sufname]:
t514001

t514001[NEPS_questiontext_en]:
[ITEMBAT] I would like to begin by asking you a few questions about how
satisfied you are with various aspects of your life. Please answer using a
scale of 0 to 10 „0“ means that you are totally and utterly dissatisfied;
„10“ means that you are entirely satisfied. You can indicate your opinion
using the numbers „1“ to „9“.

t514001[NEPS_variablequestion_en]:
How satisfied are you currently with your life in general?
---------------------------------------------------------------------------

charren – Umbennenung von Variablen zu ihren Instrument-Variablennamen

Im Zuge der Datenaufbereitung für die NEPS-SUFs werden die ursprünglich im jeweiligen Befragungsinstrument verwendeten Variablennamen in SUF-Variablennamen umbenannt. Möglicherweise kann es aber – insbesondere für Datennutzer, die bspw. als NEPS-Mitarbeiter bereits an die ursprünglichen Namen gewöhnt sind – wünschenswert sein, diesen Aufbereitungsschritt rückgängig zu machen. Das Programm charren ermöglicht dies auf möglichst schnellem Wege auf Basis der in den Stata-Datensätzen gespeicherten Metadaten.

. charren t514001 , to(NEPS_instname) verbose
Info: will rename t514001 to zufrie1

Dabei ist auch eine Rückwärtssuche möglich: Selbst wenn dem Anwender nur ein Instrumentname bekannt ist, wird das Programm zuverlässig die entsprechende SUF-Variable identifizieren und sie entsprechend umbenennen.

. charren zufrie1 , to(NEPS_instname) verbose
Info:
zufrie1 is not a variable name in current dataset; searching for
zufrie1 in specified search space
Info: will rename t514001 to zufrie1