Nicht aus der Schweiz? Besuchen Sie lehmanns.de
Praxisbuch Unsupervised Learning -  Ankur A. Patel

Praxisbuch Unsupervised Learning (eBook)

Machine-Learning-Anwendungen für ungelabelte Daten mit Python programmieren
eBook Download: PDF
2020 | 1. Auflage
358 Seiten
O'Reilly Verlag
978-3-96088-876-5 (ISBN)
Systemvoraussetzungen
39,90 inkl. MwSt
(CHF 38,95)
Der eBook-Verkauf erfolgt durch die Lehmanns Media GmbH (Berlin) zum Preis in Euro inkl. MwSt.
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Entdecken Sie Muster in Daten, die für den Menschen nicht erkennbar sind Unsupervised Learning könnte der Schlüssel zu einer umfassenderen künstlichen Intelligenz sein Voller praktischer Techniken für die Arbeit mit ungelabelten Daten, verständlich geschrieben und mit unkomplizierten Python-Beispielen Verwendet Scikit-learn, TensorFlow und Keras Ein Großteil der weltweit verfügbaren Daten ist ungelabelt. Auf diese nicht klassifizierten Daten lassen sich die Techniken des Supervised Learning, die im Machine Learning viel genutzt werden, nicht anwenden. Dagegen kann das Unsupervised Learning - auch unüberwachtes Lernen genannt - für ungelabelte Datensätze eingesetzt werden, um aussagekräftige Muster zu entdecken, die tief in den Daten verborgen sind - Muster, die für den Menschen fast unmöglich zu entdecken sind. Wie Data Scientists Unsupervised Learning für ihre Daten nutzen können, zeigt Ankur Patel in diesem Buch anhand konkreter Beispiele, die sich schnell und effektiv umsetzen lassen. Sie erfahren, wie Sie schwer zu findende Muster in Daten herausarbeiten und dadurch z.B. tiefere Einblicke in Geschäftsprozesse gewinnen. Sie lernen auch, wie Sie Anomalien erkennen, automatisches Feature Engineering durchführen oder synthetische Datensätze generieren.

Ankur A. Patel ist Vice President Data Science bei 7Park Data, einem Portfolio-Unternehmen von Vista Equity Partners. Bei 7Park Data verwenden Ankur und sein Data-Science-Team alternative Daten, um Datenprodukte für Hedge-Fonds und Unternehmen sowie Machine Learning als Service (MLaaS) für Geschäftskunden zu entwickeln.

Ankur A. Patel ist Vice President Data Science bei 7Park Data, einem Portfolio-Unternehmen von Vista Equity Partners. Bei 7Park Data verwenden Ankur und sein Data-Science-Team alternative Daten, um Datenprodukte für Hedge-Fonds und Unternehmen sowie Machine Learning als Service (MLaaS) für Geschäftskunden zu entwickeln.

Inhalt 5
Einleitung 13
Teil I: Grundlagen des Unsupervised Learning 23
Kapitel 1: Unsupervised Learning im Ökosystem des maschinellen Lernens 25
Grundbegriffe des maschinellen Lernens 25
Regelbasiertes vs. maschinelles Lernen 26
Supervised vs. Unsupervised 1
Ein genauerer Blick auf überwachte Algorithmen 33
Unüberwachte Algorithmen unter der Lupe 39
Reinforcement Learning mithilfe von Unsupervised Learning 48
Semi-supervised Learning 49
Erfolgreiche Anwendungen von Unsupervised Learning 49
Zusammenfassung 51
Kapitel 2: Durchgehendes Projekt zum maschinellen Lernen 53
Die Umgebung einrichten 53
Die Daten im Überblick 56
Datenvorbereitung 57
Modellvorbereitung 64
Modelle des maschinellen Lernens (Teil 1) 66
Kennzahlen bewerten 69
Modelle des maschinellen Lernens (Teil 2) 75
Bewertung der vier Modelle mit dem Testset 84
Ensembles 88
Endgültige Modellauswahl 91
Produktionspipeline 92
Zusammenfassung 93
Teil II: Unsupervised Learning mit Scikit-learn 95
Kapitel 3: Dimensionsreduktion 97
Die Motivation zur Dimensionsreduktion 97
Algorithmen zur Dimensionsreduktion 101
Hauptkomponentenanalyse 102
Singulärwertzerlegung 111
Zufallsprojektion 113
Isomap 115
Multidimensionale Skalierung 116
Lokal lineare Einbettung 117
Stochastische Nachbarschaftseinbettung mit Student-t-Verteilung 118
Andere Methoden zur Dimensionsreduktion 120
Zusammenfassung 122
Kapitel 4: Anomalieerkennung 125
Kreditkartenbetrugserkennung 126
Anomalieerkennung mit normaler PCA 129
Anomalieerkennung mit sparse PCA 134
Anomalieerkennung mit Kernel-PCA 137
Anomalieerkennung mit gaußscher Zufallsprojektion 139
Anomalieerkennung mit sparse Zufallsprojektion 141
Nicht lineare Anomalieerkennung 142
Anomalieerkennung mit Dictionary Learning 143
Anomalieerkennung mit Unabhängigkeitsanalyse 145
Betrugserkennung auf dem Testset 146
Zusammenfassung 151
Kapitel 5: Clustering 153
Das MNIST-Ziffern-Dataset 154
Clustering-Algorithmen 155
k-Means-Algorithmus 156
Hierarchisches Clustering 163
DBSCAN 169
Zusammenfassung 173
Kapitel 6: Gruppensegmentierung 175
Lending-Club-Daten 175
Güte der Cluster 182
k-Means-Anwendung 184
Anwendung mit hierarchischem Clustering 186
Anwendung mit HDBSCAN 190
Zusammenfassung 192
Teil III: Unsupervised Learning mit TensorFlow und Keras 193
Kapitel 7: Autoencoder 195
Neuronale Netze 196
Autoencoder: der Encoder und der Decoder 199
Untervollständige Autoencoder 200
Übervollständige Autoencoder 201
Dichte vs. sparsame Autoencoder 201
Autoencoder zur Rauschunterdrückung 202
Variational Autoencoder 202
Zusammenfassung 203
Kapitel 8: Praktische Autoencoder 205
Datenvorbereitung 205
Die Bestandteile eines Autoencoders 208
Aktivierungsfunktionen 208
Unser erster Autoencoder 209
Zweischichtiger untervollständiger Autoencoder mit linearer Aktivierungsfunktion 216
Nicht linearer Autoencoder 222
Übervollständiger Autoencoder mit linearer Aktivierung 224
Übervollständiger Autoencoder mit linearer Aktivierung und Drop-out 227
Sparse übervollständiger Autoencoder mit linearer Aktivierung 229
Sparse übervollständiger Autoencoder mit linearer Aktivierung und Drop-out 231
Mit verrauschten Datasets arbeiten 233
Rauschreduzierender Autoencoder 233
Zusammenfassung 241
Kapitel 9: Semi-supervised Learning 243
Datenvorbereitung 243
Supervised Modelle 246
Unsupervised Modelle 248
Semi-supervised Modelle 250
Die Leistung von supervised und unsupervised Modellen 253
Zusammenfassung 253
Teil IV: Deep Unsupervised Learning mit TensorFlow und Keras 255
Kapitel 10: Empfehlungsdienste mit beschränkten Boltzmann-Maschinen 257
Boltzmann-Maschinen 257
Empfehlungsdienste 259
MovieLens-Dataset 260
Matrixfaktorisierung 266
Kollaboratives Filtern mit RBMs 269
Zusammenfassung 275
Kapitel 11: Featureerkennung mit Deep Belief Networks 277
Deep Belief Networks im Detail 277
MNIST-Bildklassifizierung 278
Beschränkte Boltzmann-Maschinen 279
Die drei RBMs für das DBN trainieren 284
Das vollständige DBN 289
Wie Unsupervised Learning das Supervised Learning unterstützt 294
Bildklassifizierung mit LightGBM 299
Zusammenfassung 302
Kapitel 12: Generative Adversarial Networks 303
GANs – das Konzept 303
Deep Convolutional GANs 304
Convolutional Neural Networks 305
Noch einmal: DCGANs 309
MNIST-DCGAN in Aktion 314
Zusammenfassung 316
Kapitel 13: Zeitreihen-Clustering 319
EKG-Daten 320
Ansatz für Zeitreihen-Clustering 320
Zeitreihen-Clustering mit k-Shape auf ECGFiveDays 321
Zeitreihen-Clustering mit k-Shape auf ECG5000 327
Zeitreihen-Clustering mit k-Means auf ECG5000 332
Zeitreihen-Clustering mit hierarchischem DBSCAN auf ECG5000 333
Die Zeitreihen-Clustering-Algorithmen vergleichen 334
Zusammenfassung 340
Kapitel 14: Zum Schluss 341
Supervised Learning 342
Unsupervised Learning 342
Reinforcement Learning 344
Die vielversprechendsten Bereiche des Unsupervised Learning 345
Die Zukunft des Unsupervised Learning 346
Schlusswort 348
Index 349

Erscheint lt. Verlag 15.4.2020
Übersetzer Frank Langenau
Verlagsort Heidelberg
Sprache deutsch
Themenwelt Mathematik / Informatik Informatik Programmiersprachen / -werkzeuge
Schlagworte AI • Algorithmen • Artificial Intelligence • Data Science • Gans • Keras • KI • Künstliche Intelligenz • Maschinelles Lernen • ML • nicht gelabelt • supervised learning • tensorflow • überwachtes Lernen • unlabeled data • Unsupervised Learning
ISBN-10 3-96088-876-7 / 3960888767
ISBN-13 978-3-96088-876-5 / 9783960888765
Haben Sie eine Frage zum Produkt?
PDFPDF (Wasserzeichen)
Größe: 6,6 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.

Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Das umfassende Handbuch

von Johannes Ernesti; Peter Kaiser

eBook Download (2023)
Rheinwerk Computing (Verlag)
CHF 30,70
Das Handbuch für Webentwickler

von Philip Ackermann

eBook Download (2023)
Rheinwerk Computing (Verlag)
CHF 34,10
Deterministische und randomisierte Algorithmen

von Volker Turau; Christoph Weyer

eBook Download (2024)
De Gruyter (Verlag)
CHF 63,45