Exploratory Data Mining and Data Cleaning (eBook)
224 Seiten
John Wiley & Sons (Verlag)
978-0-471-45864-7 (ISBN)
database management.
* Presents a technical treatment of data quality including
process, metrics, tools and algorithms.
* Focuses on developing an evolving modeling strategy through an
iterative data exploration loop and incorporation of domain
knowledge.
* Addresses methods of detecting, quantifying and correcting data
quality issues that can have a significant impact on findings and
decisions, using commercially available tools as well as new
algorithmic approaches.
* Uses case studies to illustrate applications in real life
scenarios.
* Highlights new approaches and methodologies, such as the
DataSphere space partitioning and summary based analysis
techniques.
Exploratory Data Mining and Data Cleaning will serve as an
important reference for serious data analysts who need to analyze
large amounts of unfamiliar data, managers of operations databases,
and students in undergraduate or graduate level courses dealing
with large scale data analys is and data mining.
TAMRAPARNI DASU, PhD, and THEODORE JOHNSON, PhD, are both members of the technical staff at AT&T Labs-Research in Florham Park, New Jersey.
"Statisticians not conversant with today's statistical take on DQ
should read this book...and be stimulated to do important
research in DQ." (Journal of the American Statistical
Association, March 2006)
"...uniquely integrates several approaches for data cleaning
and exploration..." (Journal of Statistical Computation
& Simulation, April 2004)
"...provides a uniquely integrated approach...for serious data
analysts everywhere..." (Zentralblatt Math, Vol. 1027,
2004)
Erscheint lt. Verlag | 1.8.2003 |
---|---|
Reihe/Serie | Wiley Series in Probability and Statistics | Wiley Series in Probability and Statistics |
Sprache | englisch |
Themenwelt | Mathematik / Informatik ► Informatik ► Datenbanken |
Mathematik / Informatik ► Mathematik ► Statistik | |
Mathematik / Informatik ► Mathematik ► Wahrscheinlichkeit / Kombinatorik | |
Technik | |
Schlagworte | Computer Science • Database & Data Warehousing Technologies • Data Mining • Data Mining Statistics • Datenbanken u. Data Warehousing • Informatik • Statistics • Statistik • Wirtschaftsinformatik |
ISBN-10 | 0-471-45864-3 / 0471458643 |
ISBN-13 | 978-0-471-45864-7 / 9780471458647 |
Haben Sie eine Frage zum Produkt? |
Größe: 1,3 MB
Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine
Geräteliste und zusätzliche Hinweise
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich