R - kurz & gut (eBook)
230 Seiten
O'Reilly Verlag
978-3-96010-472-8 (ISBN)
Jörg Staudemeyer ist IT-Consultant im Ruhestand, aber weiterhin aktiv als Berater und Autor. Während seiner langjährigen Beratertätigkeit im Kontext kommerzieller Großprojekte hatte er Gelegenheit, Erfahrungen in diversen Bereichen der Informationstechnik, insbesondere aber im Java-Umfeld zu sammeln. Ralf C. Staudemeyer ist Professor für IT-Sicherheit an der Hochschule Schmalkalden. Er verfügt über langjährige internationale Erfahrung in Forschung, Lehre und Anwendung. Seine Forschungsschwerpunkte liegen in den Bereichen Computernetzwerke, Maschinelles Lernen, IT-Sicherheit und Datenschutz.
Jörg Staudemeyer ist IT-Consultant im Ruhestand, aber weiterhin aktiv als Berater und Autor. Während seiner langjährigen Beratertätigkeit im Kontext kommerzieller Großprojekte hatte er Gelegenheit, Erfahrungen in diversen Bereichen der Informationstechnik, insbesondere aber im Java-Umfeld zu sammeln. Ralf C. Staudemeyer ist Professor für IT-Sicherheit an der Hochschule Schmalkalden. Er verfügt über langjährige internationale Erfahrung in Forschung, Lehre und Anwendung. Seine Forschungsschwerpunkte liegen in den Bereichen Computernetzwerke, Maschinelles Lernen, IT-Sicherheit und Datenschutz.
Vorwort
In Zeiten von Big Data, künstlicher Intelligenz und selbstlernenden Systemen ist die Verarbeitung großer Datenmengen ein Thema, dessen Bedeutung in vielen Branchen der Wirtschaft und vielen Forschungsbereichen in der letzten Zeit enorm zugenommen hat. Für diesen Zweck gibt es verschiedene teure kommerzielle Anwendungspakete wie SPSS und SAS, aber auch eine ganze Reihe von Produkten, die von Entwicklergemeinschaften entwickelte und unter freien Lizenzen verbreitet werden. Unter Letzteren hat eine Open-Source-Anwendung namens R besondere Popularität erreicht. R ist eine spezialisierte Programmiersprache und Arbeitsumgebung, die als (nicht vollständig kompatible) Implementierung einer Sprachdefinition namens S1 entstanden ist und deren Syntax und Funktionsumfang besonders auf die Erfordernisse der numerischen und grafischen Datenanalyse abgestimmt ist. Sie wird als Teil des GNU-Projekts (https://www.gnu.org/) entwickelt und dementsprechend unter der liberalen GNU General Public License (GPL) (https://www.gnu.org/licenses/) verbreitet.
R – kurz & gut hat das Ziel, Sie schnell und effizient mit R vertraut zu machen und Ihnen die prinzipielle Funktionsweise sowie die Möglichkeiten, die diese Programmiersprache bietet, zu vermitteln. Dies ist aber weder ein Statistiklehrbuch, das Ihnen Techniken und Algorithmen für die Auswertung von Datensätzen erklären will, noch eine umfassende Sprachdokumentation. Für Ersteres gibt es ein breites Angebot an Literatur, mit deren Hilfe Sie das statistische Grundwissen unabhängig von der verwendeten Software erlangen können, und für Letzteres verfügt R über umfassende und aktuelle Dokumentationen mit allen Details zu den umfangreichen in R enthaltenen Funktionen und den unzähligen Erweiterungspaketen.
So einfach die Sprache R auf den ersten Blick erscheint, so komplex ist sie doch, sobald man sich mit den inneren Details auseinandersetzt. Wir haben versucht, die Zusammenhänge zwar etwas vereinfacht, aber auch umfassend genug darstellen, dass man die Sprache sinnvoll anwenden und ihre Features effektiv nutzen kann.
Das Buch richtet sich also in erster Linie an Menschen, die sich zumindest schon mit statistischen Grundbegriffen auskennen, die am besten auch schon Erfahrungen mit der Programmierung in anderen Programmiersprachen gemacht haben – und die möglichst schnell mit R produktiv arbeiten möchten.
Der Text basiert auf der bei der Erstellung des Buchs aktuellen R-Version 4.2.0 namens »Vigorous Calisthenics«. Da die Sprache mit ihren elementaren Funktionen bereits sehr stabil ist, sollte die Anwendung des hier Dargestellten auf spätere Versionen in der Regel kein Problem sein. Es ist aber durchaus möglich, dass in der Version, die Sie verwenden, bereits neue Funktionen oder zusätzliche Funktionsparameter eingeführt worden sind, die in dieser Auflage des Buchs noch nicht erwähnt sind.
R – kurz & gut ist folgendermaßen gegliedert:
- Kapitel 1, Arbeiten mit R, führt Sie in die praktische Arbeit mit R ein und zeigt, wie Sie die Anwendung auf Ihrem Rechner installieren, welche Tools zur Verfügung stehen und wie Sie die Arbeitsumgebung nutzen.
- Kapitel 2, Grundlagen der Sprache R, zeigt, wie R grundsätzlich funktioniert: Wie ist ein Programm aufgebaut, aus welchen Arten von Konstrukten wird es zusammengesetzt, wie werden Daten abgebildet?
- Kapitel 3, Elementare Datentypen, stellt Ihnen die Basisdatentypen vor, mit denen Sie es in jedem R-Programm zu tun haben, und zeigt, was man in ihnen speichern kann, wie sie erzeugt und wie sie verwendet werden.
- Kapitel 4, Vektoren und Listen, beschreibt Vektoren als grundlegende Datenstruktur und erläutert Ihnen, wozu sie dienen, wie sie angelegt werden und was man mit ihnen alles machen kann.
- Kapitel 5, Variablen, zeigt, wie Sie in R Objekte als Variablen ablegen und wie Umgebungen funktionieren.
- Kapitel 6, Erweiterte Datenstrukturen, stellt verschiedene häufig genutzte Datenstrukturen vor, die auf der Basis von Vektoren gebildet werden, und zeigt, wie und wozu sie verwendet werden.
- Kapitel 7, Funktionen, erklärt, wie Funktionen definiert und verwendet werden, wie sie als Operatoren genutzt werden können und wie man mit ihrer Hilfe objektorientiert programmiert.
- Kapitel 8, Programmsteuerung, behandelt verschiedene Konstrukte und Funktionen, mit denen Sie Verzweigungen und Schleifen programmieren und Fehler behandeln können.
Das Buch ist mit zwei Anhängen zum Nachschlagen versehen.
- Anhang A, Funktionsübersicht: Eine gegliederte Übersicht aller Operatoren und der wichtigsten Funktionen, die im R-Basispaket mitgeliefert werden.
- Anhang B, Übersicht der Standardpakete: Eine Übersicht über die zur Basisinstallation gehörenden Pakete.
Weitere Informationen
Zu R stehen sehr umfangreiche Informationen zur Verfügung, die jeden denkbaren Winkel ausleuchten, aber überwiegend englischsprachig und nicht immer sehr übersichtlich sind.
Hilfefunktion
In der Praxis außerordentlich nützlich sind die im Interpreter eingebauten Hilfefunktionen, die direkt aus der Konsole – wie auch aus den entsprechenden Menüanwahlen der Entwicklungsumgebungen – heraus aufgerufen werden können.
Wie Sie die Hilfefunktionen nutzen, erfahren Sie in Kapitel 1, Abschnitt »Interaktive Hilfe« auf Seite 23.
Webseiten
Weitere wichtige Informationsquellen sind natürlich die sehr ausführlichen und detaillierten, aber nicht immer einfach verständlichen Handbücher des GNU-R-Projekts unter https://cran.r-project.org/manuals.html sowie die FAQs unter https://cran.r-project.org/doc/FAQ/R-FAQ.html.
Daneben gibt es zahlreiche weitere Adressen, die ergänzende Informationen bieten, darunter:
- https://www.rdocumentation.org/ ist eine Suchmaschine für alle Dokumentationen der im CRAN und im Bioconductor-Projekt verfügbaren Basis- und Erweiterungspakete.
- Unter https://rstudio.com/resources/cheatsheets/ finden Sie einige hilfreiche Kurzübersichten, die von den Herstellern der Entwicklungsumgebung RStudio zur Verfügung gestellt werden.
Literatur
Im Buchhandel finden Sie zahlreiche englisch- und auch deutschsprachige Bücher, in denen die Arbeit mit R mehr oder weniger verständlich beschrieben wird. Die meisten von ihnen legen allerdings – was naheliegt – den Schwerpunkt auf den Aufbau, die Auswertung und die Darstellung statistischer Daten und betrachten die Programmiersprache eher als Hilfsmittel für diesen Zweck.
Auch O’Reilly hat einiges an Literatur zu bieten, darunter:
- R für Data Science von Hadley Wickham und Garrett Grolemund, O’Reilly 2017 (https://oreilly.de/produkt/r-fuer-data-science/)
- Statistik mit R von Joachim Zuckarelli, O’Reilly 2017 (https://oreilly.de/produkt/statistik-mit-r/)
- R in a Nutshell (deutsch) von Joseph Adler, O’Reilly Verlag 2010 (https://oreilly.de/produkt/r-in-a-nutshell/)
Wenn Sie den Innereien von R ganz tief auf den Grund gehen wollen, empfiehlt sich das folgende englischsprachige Buch:
- Advanced R (2nd Edition) von Hadley Wickham, CRC Press 2019 (auch kostenlos online verfügbar unter https://adv-r.hadley.nz/)
Hinweise zur Benutzung des Buchs
Typografische Konventionen
In diesem Buch werden bestimmte Regeln für die Nutzung von Schriftarten angewendet.
Kursiv
Neue Begriffe, URLs, E-Mail-Adressen sowie Dateinamen und -pfade.
Konstante Breite
Programmlistings sowie innerhalb von Absätzen Verweise auf programmiersprachliche Elemente wie Variablen- und Funktionsnamen, Datentypen, Umgebungsvariablen und Schlüsselwörter.
Konstante Breite, fett
Befehle und sonstige Textteile, die vom Anwender wörtlich eingegeben werden, sowie Hervorhebungen innerhalb von Listings.
Konstante Breite, kursiv
Text, der in einem konkreten Programm durch einen spezifischen Wert zu ersetzen ist.
Hinweise, Tipps und Warnungen
Die...
Erscheint lt. Verlag | 1.6.2022 |
---|---|
Reihe/Serie | kurz & gut |
O'Reilly`s kurz & gut | O'Reilly`s kurz & gut |
Verlagsort | Heidelberg |
Sprache | deutsch |
Themenwelt | Mathematik / Informatik ► Informatik ► Programmiersprachen / -werkzeuge |
Schlagworte | Big Data • Data Mining • Data Science • Datenanalyse • Einführung • ggplot2 • R-Code • RStudio • Statistik • Statistikumgebung R • statistisch • tidyr • Wahrscheinlichkeit |
ISBN-10 | 3-96010-472-3 / 3960104723 |
ISBN-13 | 978-3-96010-472-8 / 9783960104728 |
Informationen gemäß Produktsicherheitsverordnung (GPSR) | |
Haben Sie eine Frage zum Produkt? |
Größe: 1,7 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich