Data Lakes For Dummies (eBook)
384 Seiten
Wiley (Verlag)
978-1-119-78617-7 (ISBN)
Alan Simon is the managing principal of Thinking Helmet, Inc., the author of 32 books on business technology, and a consultant who's worked with enterprise and government organizations. His professional focus is business intelligence, analytics, and data warehousing. He also teaches university courses in his specialty areas.
Introduction 1
Part 1: Getting Started with Data Lakes 5
Chapter 1: Jumping into the Data Lake 7
Chapter 2: Planning Your Day (and the Next Decade) at the Data Lake 25
Chapter 3: Break Out the Life Vests: Tackling Data Lake Challenges 49
Part 2: Building the Docks, Avoiding the Rocks 65
Chapter 4: Imprinting Your Data Lake on a Reference Architecture 67
Chapter 5: Anybody Hungry? Ingesting and Storing Raw Data in Your Bronze Zone 97
Chapter 6: Your Data Lake's Water Treatment Plant: The Silver Zone 121
Chapter 7: Bottling Your Data Lake Water in the Gold Zone 139
Chapter 8: Playing in the Sandbox 151
Chapter 9: Fishing in the Data Lake 159
Chapter 10: Rowing End-to-End across the Data Lake 169
Part 3: Evaporating the Data Lake into the Cloud 187
Chapter 11: A Cloudy Day at the Data Lake 189
Chapter 12: Building Data Lakes in Amazon Web Services 199
Chapter 13: Building Data Lakes in Microsoft Azure 217
Part 4: Cleaning Up the Polluted Data Lake 243
Chapter 14: Figuring Out If You Have a Data Swamp Instead of a Data Lake 245
Chapter 15: Defining Your Data Lake Remediation Strategy 259
Chapter 16: Refilling Your Data Lake 283
Part 5: Making Trips to the Data Lake a Tradition 297
Chapter 17: Checking Your GPS: The Data Lake Road Map 299
Chapter 18: Booking Future Trips to the Data Lake 325
Part 6: The Part of Tens 333
Chapter 19: Top Ten Reasons to Invest in Building a Data Lake 335
Chapter 20: Ten Places to Get Help for Your Data Lake 341
Chapter 21: Ten Differences between a Data Warehouse and a Data Lake 345
Index 351
Erscheint lt. Verlag | 11.6.2021 |
---|---|
Sprache | englisch |
Themenwelt | Mathematik / Informatik ► Mathematik ► Statistik |
Mathematik / Informatik ► Mathematik ► Wahrscheinlichkeit / Kombinatorik | |
Schlagworte | Data Analysis • Data Lake • Datenanalyse • Statistics • Statistik |
ISBN-10 | 1-119-78617-7 / 1119786177 |
ISBN-13 | 978-1-119-78617-7 / 9781119786177 |
Haben Sie eine Frage zum Produkt? |
Größe: 14,9 MB
Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine
Geräteliste und zusätzliche Hinweise
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich