Das deutsche Gesundheitswesen: Eine Cluster- und Faktorenanalyse der medizinischen Versorgung in Landkreisen und kreisfreien Städten (eBook)
38 Seiten
Bachelor + Master Publishing (Verlag)
978-3-86341-736-9 (ISBN)
Jens Schröder, B.Sc. in Wirtschaftsinformatik, wurde 1977 in Sulingen geboren. Nach langjähriger Tätigkeit als IT-Führungskraft in einer Bank und einem Automobilzulieferer in den USA hat er umfassende Erfahrungen im Bereich des Business Analytics und als
Jens Schröder, B.Sc. in Wirtschaftsinformatik, wurde 1977 in Sulingen geboren. Nach langjähriger Tätigkeit als IT-Führungskraft in einer Bank und einem Automobilzulieferer in den USA hat er umfassende Erfahrungen im Bereich des Business Analytics und als Entscheidungsträger im IT-Management sammeln können. Neben seinem aufbauenden Masterstudium, vertiefte er seine Kenntnisse als Research Project Assistant im Forschungsprojekt GoOLAP.info der TU Berlin. Dieses Werk des Autors entstand im Rahmen des Aufbaustudiums und vertiefte sein Verständnis der multivariaten Datenanalyse.
Textprobe: Kapitel 4.1, Clusterstrategie: In der Praxis haben neben den hierarchisch-agglomerativen Verfahren, die partitionierten Verfahren (k-Means) eine große Bedeutung in der Wirtschaftswissenschaft gewonnen. Die hierarchisch-agglomerativen Verfahren neigen zu einer Ein-Clusterlösung und bieten hierzu verschiedene Methoden an. Voraussetzung ist, dass Merkmale metrisch skaliert vorliegen, da hier mit Proximitätsmaßen und/oder Varianzen die Distanzen unter den Objekten berechnet werden. Die partitionierten Verfahren versuchen die Lösungen der hierarchisch-agglomerativen Verfahren, durch die Neuberechnung der Clusterzentren, zu optimieren. Zur Clusteranalyse dieser Arbeit wurde in folgenden Schritten vorgegangen: Zuerst werden mittels Single-Linkage-Verfahren mögliche Ausreißer entdeckt und aus dem Datensatz eliminiert (Kapitel 4.2). Die Single-Linkage-Methode fasst Objekte mit der kleinsten Distanz zusammen. Dadurch, dass es immer den nächstgelegenen Nachbarn zu einem größeren Cluster zusammenführt (Kettenbildung), ist das Verfahren anfällig gegenüber Ausreißern. Das aber wiederum kann durch Beobachten eines sprunghaften Anstiegs des Fusionskoeffizienten dazu genutzt werden, um Ausreißer ausfindig zu machen. Nach dem die Ausreißer eliminiert und die z-Werte neu berechnet wurden, wird im nächsten Schritt das Ward-Verfahren ausgewählt. Das Ward-Verfahren fordert u.a. standardisierte metrisch skalierte, nicht dichotome, Merkmale, da anhand des geringsten Zuwachses des Heterogenitätsmaß, auch Fehlerquadratsumme (SSQ), Objekte oder Cluster, die die Streuung im Cluster am wenigsten erhöhen, zu einem Cluster zusammengeführt werden. Somit bleibt die Streuung innerhalb der Cluster gering (Homogenität) und unter den Clustern groß (Heterogenität). Die Fehlerquadratsumme wiederum beschreibt die Heterogenität der Partition, die sich im Kern aus der Summe der quadratisch euklidischen Abstände zwischen den Objekten bildet, das beim Ward-Verfahren als Distanzmaß gilt. Das Verfahren wird daher zu den Varianz-Methoden gezählt und ist bestrebt, gleich große Cluster zu bilden. Im ersten Schritt des Ward-Verfahrens wird die optimale Partition, also die Anzahl der Cluster, ermittelt (Kapitel 4.3) um im zweiten Schritt die Startpartition und die Clusterzentren für das partitionierte Verfahren (k-Means) zu erzeugen. Als letzter Schritt der Clusteranalyse erfolgt die Erzeugung der finalen Partition mittels k-Means-Verfahren. Das k-Means-Verfahren ist eine partitionierte Methode und zählt zu den iterativen Minimaldistanz-Verfahren, die versucht, die Clusterzentren, die Zentroide in ihrer Lage, (hier gegenüber dem Ward-Verfahren) zu verbessern. Dadurch werden Objekte zwischen den Clustern verschoben, um so die Gesamtgüte einer vorhandenen Clusterlösung, in diesem Fall des Ward-Verfahrens, zu optimieren. Als Gütemaß der Clusterlösungen zählt das eta-quadrat, ein Homogenitätsmaß. Es ergibt sich aus dem erklärten Teil der Gesamtvarianz der Partition zur Gesamtstreuung der Clustermerkmale in einer bestimmten Fusionsstufe und gibt an, zu wie viel Prozentpunkten sich die Streuung der Clusterlösung erklären lässt. 4.2, Ausreißer finden und eliminieren: Ausreißer werden mittels Single-Linkage-Verfahren durch den größten Sprung des Koeffizienten der letzten Fusionsstufen identifiziert, unter Berücksichtigung, dass die zuletzt fusionierten Objekte noch zu keinem weiteren Cluster fusionierten. Werden Ausreißerobjekte gefunden, werden entweder diese mit in die Clusteranalyse inkludiert oder die Objekte werden eliminiert. Bei der Inklusion der Ausreißer besteht die Gefahr, dass Cluster nicht homogen gebildet werden, beziehungsweise sie durch Ausreißer eine ungewollte Gewichtung erhalten. Bei der zweiten Variante müssen die standardisierten Merkmale (z-Werte) wegen der Abhängigkeit zum Mittelwert des Merkmals, neu berechnet werden. In meiner Arbeit werden die Ausreißer eliminiert und somit die z-Werte neu berechnet, um bei der ersten Clusterstufe möglichst homogene Cluster zu bilden. Zum Ergebnis: Die Ausreißer werden mit Hilfe der Fusionstabelle (Tabelle 21 im Anhang C) aus den noch vorhandenen 405 Datensätzen ermittelt und deren Verlauf, übersichtshalber, über die letzten zehn Fusionsstufen mittels Screeplot grafisch dargestellt (Abbildung 1). Als Koeffizient dient hier das quadratisch euklidische Distanzmaß als Unähnlichkeitsmaß, wobei auch das einfache euklidische Distanzmaß hier zum selben Resultat hinsichtlich der Ausreißer führen würde. Eine Identifikation mittels Dendogramm wird wegen dessen ungenauen und normierten Darstellung nicht in Betracht gezogen. In den letzten zehn Fusionsstufen wird der größte Sprung (delta_f) des Koeffizienten (df oder Fusionskoeffizienten) zwischen der 398 und 399 Fusionsstufe (f) beobachtet. Waren hier vorher geringe Sprünge zwischen 0,2 bis 0,4 oder weniger beobachtet worden, wird nun ein Sprung von 1,206 beobachtet, was einen relativen Anstieg zur vorigen Stufe um 16,62 % bedeutet. Die Abbildung macht dieses noch einmal durch den Anstieg des Fusionskoeffizienten der letzten sechs Fusionsstufen (cf) von 6 und weniger deutlich.
Erscheint lt. Verlag | 1.7.2013 |
---|---|
Zusatzinfo | 26 Abb. |
Sprache | deutsch |
Themenwelt | Medizin / Pharmazie ► Pflege |
Wirtschaft | |
Schlagworte | Clusteranalyse • Data-Mining • Krankenhaus • Medizinische Versorgung • multivariate Statistik • Pflege • Reha |
ISBN-10 | 3-86341-736-4 / 3863417364 |
ISBN-13 | 978-3-86341-736-9 / 9783863417369 |
Informationen gemäß Produktsicherheitsverordnung (GPSR) | |
Haben Sie eine Frage zum Produkt? |
Größe: 7,3 MB
Digital Rights Management: ohne DRM
Dieses eBook enthält kein DRM oder Kopierschutz. Eine Weitergabe an Dritte ist jedoch rechtlich nicht zulässig, weil Sie beim Kauf nur die Rechte an der persönlichen Nutzung erwerben.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich