Multivariate Statistik
De Gruyter Oldenbourg (Verlag)
978-3-486-58595-7 (ISBN)
Geboren 1946 in Leipzig 1966 Studium der Mathematik an der FU Berlin. Nach dem Studium war er Assistent an der TU Berlin. Die Promotion zum Dr. rer. nat. erfolgte 1974, die Habilitation im Fach Statistik 1978 an der FU Berlin. Mitte 1980 bis Anfang 1983 war er in verschiedenen Firmen und Einrichtungen tätig; dazu gehörten die GfK in Nürnberg und die BfA. Seit 1983 ist er Professor für Statistik, zunächst an der Universität Essen, seit 1990 an der Universität Hamburg. Seine Forschungstätigkeit hat als einen Schwerpunkt die Zeitreihenanalyse. Ein zweiter ist das weit gefasste Gebiet der angewandten statistischen Methoden. Zu diesen Bereichen hat Professor Schlittgen zahlreiche Artikel in wissenschatlichen Zeitschriften veröffentlicht. Im Rahmen der Lehre führt er seit seiner Assistentenzeit Lehrveranstaltungen im Grund- und Hauptstudium durch. Dabei hat er im Laufe der Zeit Veranstaltungen zu allen Gebieten der Statistik gehalten. Aus den Lehrveranstaltungen sind verschiedene Lehrbücher entstanden.
1;Vorwort;6
2;Inhaltsverzeichnis;8
3;I Daten und ihre Beschreibung;14
3.1;1 Einführung;16
3.1.1;1.1 Fragestellungen;16
3.1.2;1.2 Datensituation;21
3.1.3;1.3 Literatur und Software;22
3.2;2 Kontinuierliche Variablen;24
3.2.1;2.1 Der p-dimensionale Beobachtungsraum;24
3.2.2;2.2 Spaltenorientierte Aspekte;48
3.2.3;2.3 Literatur und Software;50
3.3;3 Kategoriale Variablen;52
3.3.1;3.1 Erhebungsaspekte;52
3.3.2;3.2 Univariate Randverteilungen;53
3.3.3;3.3 Bivariate Verteilungen;56
3.3.4;3.4 Höherdimensionale Kontingenztafeln;67
3.3.5;3.5 Kodierung nicht metrischer Variablen;69
3.3.6;3.6 Weitere Aspekte, Literatur und Software;71
3.4;4 Abstände und Disparitäten;74
3.4.1;4.1 Abstände bei metrischen Variablen;74
3.4.2;4.2 Ähnlichkeits- und Disparitätsmaße;77
3.4.3;4.3 Literatur;86
4;II Verteilungen;88
4.1;5 Verteilungsmodelle für multivariate Daten;90
4.1.1;5.1 Univariate Verteilungen;90
4.1.2;5.2 TheoretischeMomente;92
4.1.3;5.3 Erhebungsmodelle für kategoriale Variablen;96
4.1.4;5.4 Verteilungsmodelle für stetige Variablen;100
4.1.5;5.5 Ein Verteilungsmodell für gemischte Variablen;107
4.1.6;5.6 Weitere Aspekte und Literatur;108
4.2;6 Inferenz für Verteilungen und ihre Parameter;110
4.2.1;6.1 Schätzen der Lage und Dispersion;110
4.2.2;6.2 Parametertests bei Normalverteilung;121
4.2.3;6.3 Überprüfung der multivariaten Normalverteilung;129
4.2.4;6.4 Likelihood-Quotienten- und Wald-Tests;132
4.2.5;6.5 Inferenz in zwei- und dreidimensionalen Kontingenztafeln;132
4.2.6;6.6 Fehlende Werte;149
4.2.7;6.7 Weitere Aspekte, Literatur und Software;157
5;III Abhängigkeiten;162
5.1;7 Regression;164
5.1.1;7.1 Lineare Regression;164
5.1.2;7.2 Multivariate multiple Regression;188
5.1.3;7.3 Hauptkomponenten- und PLS-Regression;193
5.1.4;7.4 Weitere Aspekte, Literatur und Software;205
5.2;8 Kategoriale Responsevariablen;208
5.2.1;8.1 Gewichtete Kleinste Quadrate-Methode;208
5.2.2;8.2 Logistische Regression;216
5.2.3;8.3 Weitere Aspekte, Literatur und Software;237
5.3;9 Conjoint-Analyse;240
5.3.1;9.1 Traditionelle Conjoint-Analyse;240
5.3.2;9.2 Auswahlbasierte Conjoint-Analyse;253
5.3.3;9.3 Zur praktischen Durchführung einer Conjoint-Analyse;265
5.3.4;9.4 Weiteren Aspekte, Literatur und Software;268
6;IV Zusammenhänge;272
6.1;10 Hauptkomponentenanalyse;274
6.1.1;10.1 Zweidimensionale Datensätze;274
6.1.2;10.2 p-dimensionale Datensätze;278
6.1.3;10.3 Hauptkomponentenanalyse von Korrelationsmatrizen;283
6.1.4;10.4 Ausreißer und robuste Hauptkomponentenanalyse;286
6.1.5;10.5 Theoretische Hauptkomponenten;289
6.1.6;10.6 Zur Durchführung einer Hauptkomponentenanalyse;290
6.1.7;10.7 Weitere Aspekte, Literatur und Software;291
6.2;11 Grafische Darstellungen;292
6.2.1;11.1 Biplots;292
6.2.2;11.2 Korrespondenzanalyse;297
6.2.3;11.3 Projection Pursuit;304
6.2.4;11.4 Multidimensionale Skalierung;308
6.2.5;11.5 Weitere Aspekte, Literatur und Software;324
6.3;12 Kanonische Korrelation;328
6.3.1;12.1 Kanonische Korrelation und kanonische;328
6.3.2;Variablen;328
6.3.3;12.2 Tests auf Unabhängigkeit;335
6.3.4;12.3 Weitere Aspekte, Literatur und Software;339
6.4;13 LoglineareModelle;340
6.4.1;13.1 LoglineareModelle für zweidimensionale Tafeln;340
6.4.2;13.2 LoglineareModelle für dreidimensionale Tafeln;345
6.4.3;13.3 Höherdimensionale Tafeln;348
6.4.4;13.4 Literatur und Software;351
7;V Gruppierungen;352
7.1;14 Diskriminanzanalyse;354
7.1.1;14.1 LineareDiskriminanzanalyse;356
7.1.2;14.2 Maximum-Likelihood-Diskrimination;369
7.1.3;14.3 Klassifikation;376
7.1.4;14.4 Zur Durchführung einer Diskriminanzanalyse;398
7.1.5;14.5 Weitere Aspekte, Literatur und Software;398
7.2;15 Clusteranalyse;404
7.2.1;15.1 Finden von Clustern;405
7.2.2;15.2 Modellbasierte Clusterbildung;426
7.2.3;15.3 Clusterweise Regression;435
7.2.4;15.4 Zur Durchführung einer Clusteranalyse;438
7.2.5;15.5 Weitere Aspekte, Literatur und Software;439
8;VI Strukturgleichungsmodelle;444
8.1;
Teil I Daten und ihre Beschreibung (S. 1)
1 Einführung
1.1 Fragestellungen
In den Beobachtungswissenschaften wie Psychologie, Sozial- und Wirtschaftswissenschaften ist es eher die Regel, dass Daten in multivariater Form anfallen. Nur ausnahmsweise werden Untersuchungen mit lediglich einer Variablen durchgeführt. Der bei Benninghaus (1991) auszugsweise angegebene Fragebogen zu Merkmale und Auswirkung beruflicher Tätigkeit 1993 hat zum Beispiel 175 einzelne Fragen, die zuentsprechend vielen Variablen führen. Auch in den Naturwissenschaften werden bei großen Untersuchungen meist die Werte von mehr als einer Variablen gemessen bzw. erfasst.
Die statistischen Methoden zur Analyse solcher Daten werden unter dem Sammelbegriff multivariate statistische Methoden geführt. Es ist einsichtig, dass die Fragestellungen bei so vielen Variablen sehr verschieden sein können. Dementsprechend ist die multivariate Statistik kein einheitliches, gut zu strukturierendes Gebiet. Um dies zu verdeutlichen, seien einige charakteristische Fragestellungen betrachtet.
Beispiel 1.1.1 Seekrankheit
In einer Untersuchung zur Seekrankheit wurdeauf 22 Überfahrten einer Fähre die durchschnittliche Schiffsbewegung sowie die Befindlichkeit der Passagiere ermittelt, vgl. Lawther &,Grif.n (1986). Die Bewegungsvariablen sind in der Abbildung 1.1.1 illustriert.
Die Befindlichkeitsvariablen wurden einmal mittels einer so genannten Rating-Skala erhoben und dann wurde der Anteil der Passagiere festgehalten, die sich erbrechenmussten. Zudemwurde die Fahrtdauer notiert. Genauer wurden folgende Variablen erhoben:
X1 = Beschleunigung in Längsrichtung
X6 = Gieren (Schwanken)
X2 = Beschleunigung in Querrichtung
X7 = Anzahl der Passagiere
X3 = Beschleunigung in Höhenrichtung
X8 = Dauer
X4 = Rollen
X9 = Krankheitsrating
X5 = Stampfen
X10 = Erbrechen ( % )
Hier interessiert natürlich, wie stark die beiden Befindlichkeitsvariablen von den einzelnen Bewegungsvariablen und von der Fahrtdauer abhängen. Dies ist eine Frage der multivariatenmultiplen Regression.
Weiter wird man wissen wollen, wie die verschiedenen Bewegungsrichtungen zusammenhängen. Das legt zunächst einmal eine Exploration der gemeinsamen Verteilungen der Bewegungskomponenten nahe. Weitergehend kann man untersuchen, ob es Gruppen von Bewegungsvariablen gibt, die weitgehend das Gleiche messen. Dazu bietet sich eine Faktorenanalyse an.
Beispiel 1.1.2 Cheddar-Käse
Während ein Käse reift, finden verschiedene chemische Prozesse statt, die den Geschmack des abschließenden Produktes bestimmen. Dieser Datensatz enthält Konzentrationen der verschiedenen Chemikalien in 30 Proben gereiften Cheddar-Käse sowie Geschmack, ein subjektives Maß des Geschmacks für jede Probe. Letzteres wurde über eine Kombination der Scores einiger Verkoster bestimmt.
Die Variablen Essig und H2S sind logarithmisch transformierte Werte der Konzentration der Essigsäure beziehungsweise des Wasserstoffsulfads. Die Variable Lactat ist nicht transformiert worden. Die Daten stamen aus Moore &, McCabe (1993).
Beispiel 1.1.7 Verkauf von Rosen
Eine Reisegewerblerin für das Feilbieten von Blumen und kunstgewerblichen Gegenständen will anhand ihrer bisherigen Erfahrungen ihreweitere Tätigkeit planen. Verkauft hatte sie bisher ausschließlich Baccara-Rosen in vier Speiserestaurants an drei Wochentagen. Sie besuchte die Lokale jeweils zweimal.
Festgehalten wurde außerdem, wie die Wetterbedingungen gewesen waren und ob der Verkauf in den einzelnen Restaurants zufriedenstellend verlaufen war, d.h. ob mehr als zwei Rosen pro Besuch verkauft worden waren. Die Datenmatrix umfasst 192 Abende, siehe Recke (1979). Von Interesse ist hier erstens, die Daten in übersichtlicher Form darzust
Erscheint lt. Verlag | 6.5.2009 |
---|---|
Reihe/Serie | Lehr- und Handbücher der Statistik |
Verlagsort | Berlin/München/Boston |
Sprache | deutsch |
Maße | 170 x 240 mm |
Gewicht | 1215 g |
Themenwelt | Mathematik / Informatik ► Mathematik ► Finanz- / Wirtschaftsmathematik |
Mathematik / Informatik ► Mathematik ► Statistik | |
Wirtschaft ► Volkswirtschaftslehre ► Ökonometrie | |
Schlagworte | Analyse • Ausführung • Behandlung • Buch • Business & Economics • Business mathematics • Cluster • Clusteranalyse • Conjointanalyse • Conjoint measurement • Daten • Diskriminanzanalyse • Economics • Faktorenanalyse • Führung • Gerichte • Hauptkomponentenanalyse • /IV • Kanon • Komponente • Komponenten • Komponentenanalyse • Konzept • Krimi • Lehrbuch • Levante • Marketing • Master Data Services • Mathematics • Mathematik • Mathematik & Statistik für Ökonomen • Measurement • Metho • Methoden • Multidimensionale Skalierung • multivariat • Multivariate Analyse • multivariate Statistik • NS-PRESSEANWEISUNGEN • Pfadanalyse • Register • Regressionsanalyse • Standard • Statistik • Statistik für Okonomen • Statistik für Ökonomen • Statistik für Ökonomen • Statistik; Handbuch/Lehrbuch (Sozial-/Wirtschaftswissen) • Verfahren • Verständlichkeit • Werte • Wirtschaft • Wirtschaftswissenschaften |
ISBN-10 | 3-486-58595-9 / 3486585959 |
ISBN-13 | 978-3-486-58595-7 / 9783486585957 |
Zustand | Neuware |
Haben Sie eine Frage zum Produkt? |
aus dem Bereich