SPSS Tutorium I
Timo Gnambs
Inhalt
- Dateneingabe
- Transformationen
- Syntax
- Deskriptive Statistik
Variablenansicht
- Konventionen für Variablennamen
- Typ
- Beschriftung (120 Zeichen)
- Werte (60 Zeichen)
- Nutzerdefinierte fehlende Werte
- Skalenniveau
- Data -> Define Variable properties
[any material that should appear in print but not on the slide]
Konventionen für Variablennamen
- Alphanumerische Zeichen und @ . # _ $
- 64 Zeichen (vor SPSS 12: 8 Zeichen)
- Reservierte Schlüselwörter:
ALL, NE, EQ, TO, LE, LT, BY, OR, GT, AND, NOT, GE, WITH
- Gross- und Kleinschreibung (seit SPSS 12)
Beispiel: Fragebogen & Datensatz
Datenbereinigung
- Fehlerhafter Wertebereich
- Logische Inkonsistenz
- Außergewöhnliche Kombinationen
Fehlerquellen minimieren
- Dezimalzahlen vermeiden (z.B. eine Körpergrösse von 1.76m als 176cm eingeben)
- Bipolare Skalen mit positiven und negativen Werten auf aussschliesslich positive Werte transformieren
- Umpolung von Items nicht während der Dateneingabe sondern danach in SPSS
Frequencies
Skewness & Kurtosis
- Skewness (Schiefe): positiv bei linksteilen (rechtsschiefen) Verteilungen
- Kurtosis (Exzess): negativ bei breiteren Verteilungen
|
 |
Übung II: Frequencies
-
Erstellen Sie für die Variablen MOTIV1 bis MOTIV4 Häufigkeitstabellen, keine Grafiken, keine Statistiken.
- Prüfen Sie die Variable LOT01 bis LOT10 auf ungültige Werte.
- Prüfen Sie die Variablen INCOME und WORKTIME auf mögliche Eingabefehler.
- Sind die Variablen HEIGHT und WEIGHT normalverteilt (verwenden Sie dazu Skewness & Kurtosis)?
Schematisches Vorgehen
- Rohdatendatei
- Transformationsdatei
- Fertigdatendatei
Vorteile der Syntax
- Einfachere Datentransfromationen
- Sich häufig wiederholende Anweisungen
- Zusätzliche Optionen
- Dokumentation
Verwendungsmöglichkeiten der Syntax
- Automatisch generierte Anweisungen
- Modifikation automatisch generierter Anweisungen
- Freies Programmieren
-
Demo zur Syntax
Kommentare
- COMMENT Ein Kommentar.
- * Ein Kommentar.
- /* Ein Kommentar */
Syntaxregeln
FREQUENCIES VARIABLES=sex /STATISTICS=MODE.
- Jede Anweisung steht in einer neuen Zeile und endet mit einem Punkt.
- Anweisungen können über mehrere Zeile gehen (aber ohne Leerzeilen).
- Nicht mehr als 80 Zeichen.
- Als Dezimalstelle wird der Punkt verwendet.
Daten rekodieren
- Transform -> Recode
- Transform -> Visual Bender
- Transform -> Rank
- Transform -> Autorecode
Schlüsselwörter
| Schlüsselwort |
Bedeutung |
| THRU |
Spezifiziert einen ganzen Wertebereich |
| LOWEST |
Der niedrigste Wert |
| HIGHEST |
Der höchste Wert |
| MISSING |
Alle (nutzer- und systemdefinierte) fehlenden Werte |
| SYSMIS |
Systemdefinierte fehlende Werte |
| ELSE |
Alle anderen Werte |
Übung III: Rekodieren
- Polen Sie die Items LOT3, LOT4 und LOT8 um.
- Unterteilen Sie die Variable AGE in vier gleich grosse Gruppen.
Werte zählen
- Transform -> Count
COUNT motivcnt = motiv1, motiv2, motiv3, motiv4 (1).
COUNT miscnt = lot01 TO lot10 (MISSING).
COUNT poor = lot01 TO lot10 (LOWEST THRU 3).
Berechnen von neuen Variablen
Arithmetische Funktionen
- ABS(x): Der Absolutbetrag von x
- LN(x): Der natürliche Logarithmus von x
- MOD(x,y): Modulo; der Rest der Division x / y (wobei y nicht 0 sein)
- RND(x): Rundet x zur nächsten ganzen Zahl (ab .5 wird aufgerundet)
- SQRT(x): Die Quadratwurzel aus x
- TRUNC(x): Der Betrag von x ohne Nachkommastellen
Statistische Funktionen
- MAX(x1, x2,…): Der grösste Wert der Argumente.
- MEAN(x1, x2,…): Der Mittelwert der Argumente.
- MIN(x1, x2,…): Der kleinste Wert der Argumente.
- NVALID(x1, x2,…): Die Anzahl der gültigen Argumente (die also keine Missing Values enthalten).
- SD(x1, x2,…): Die Standardabweichung der Argumente.
- SUM(x1, x2,…): Die Summe der Argumente.
- VARIANCE(x1, x2,…): Die Varianz der Argumente.
Funktionen für fehlende Werte
- NMISS(x1, x2,…): Anzahl der fehlenden Werte in den Argumenten
- MISSING(x): Gibt 1 zurück, wenn x einen fehlenden Wert darstellt
- SYSMIS(x): Gibt 1 zurück, wenn x ein System-definierter fehlender Wert ist
Weitere Funktionen
- Datumsfunktionen
- Funktionen für Zeichenketten
- Logische Funktionen
- Statistische Verteilungsfunktionen
- siehe SPSS Hilfe
Beispiele mit der COMPUTE-Anweisung
COMPUTE wehe = RND(weight/height).
COMPUTE score = SUM.6(lot1 TO lot10).
COMPUTE mini = MIN(meth1, meth2, meth3, meth4).
COMPUTE noprof = MISSING(profession).
Vergleichsoperatoren
| Operator |
Bedeutung |
| = |
gleich |
| ~= |
ungleich |
| <= |
kleiner oder gleich |
| < |
kleiner |
| >= |
grösser oder gleich |
| > |
grösser |
Schleifen
DO REPEAT
Platzhalter1 = Variablenliste1
/Platzhalter2 = Variablenliste2.
Anweisungen
END REPEAT.
Übung IV: Syntax
- Berechnen Sie den Mittelwert von LOT01 bis LOT10 für jede Person.
- Bilden Sie eine neue Gruppierungsvariable, bei der alle akademischen Berufen mit 1 und alle übrigen mit 2 kodiert sind.
- Wieviele Motive haben die Versuchspersonen mit der UID 16, 21 und 29 angegeben? Geben Sie das Resultat im Output aus.
- Speichern Sie in den neuen Variablen SQT01 bis SQT10 die Wurzel aus LOT01 bis LOT10.
Deskriptive Statistik
- Analyze -> Descriptive Statistics -> Frequencies
- Analyze -> Descriptive Statistics -> Descriptives
-
Analyze -> Reports -> Case Summaries oder
Analyze -> Compare Means -> Means
- Analyze -> Descriptive Statistics -> Explore
- Analyze -> Descriptive Statistics -> Crosstabs
Varianzhomogenität
- Levene-Test (Modifikation von Brown & Forsythe)
- Spread vs. Level Diagramm
- Datentransformation: Power = 1 - Slope
Exponent für Transformationen
| Exponent (Power) |
Transformation |
| 3 |
Kubisch |
| 2 |
Quadratisch |
| 1 |
Untransformiert |
| 1/2 |
Quadratwurzel |
| 0 |
Natrül. Logarithmus |
| -1/2 |
1 / Quadratwurzel |
| -1 |
Reziprok |
Normalverteilung
- QQ-Diagramm (Normalverteilungsdiagramm)
- Trendbereinigtes QQ-Diagramm
- Kurtosis & Skewness
- Kolmogorov-Smirnov-Test
- Shapiro-Wilks-Test