Kompendium semantische Netze (eBook)
X, 197 Seiten
Springer Berlin (Verlag)
978-3-642-04315-4 (ISBN)
Semantische Technologien werden als die zukünftige Form menschlichen Wissens gehandelt. Gleichzeitig haftet ihnen etwas von einer Geheimwissenschaft an. Dieses Kompendium bietet eine - auch für Einsteiger verständliche - Einführung in das Thema. Es präsentiert verschiedene semantische Techniken, von automatischen Text-Mining-Verfahren bis hin zu komplexen Ontologien. Leser werden anhand von Beispielen in die Lage versetzt, selbst zu beurteilen, was semantische Technologien leisten. Im praktischen Teil lernen sie, semantische Netze zu modellieren.
Klaus Reichenberger ist Mitgründer und Geschäftsführer der intelligent views gmbh, wo er neben Vertrieb und Marketing den Bereich Knowledge Engineering verantwortet. In den letzten Jahren hat er bei intelligent views ein Team von Knowledge-Engineers aufgebaut, das einmalige Erfahrung in der praktischen Umsetzung semantischer Technologie versammelt: von der Modellierung semantischer Netze und Konfiguration intelligenter Applikationen bis zur Verknüpfung von Ontologien mit Suchmaschinen, Text-Mining-Techniken und user generated semantics.
Klaus Reichenberger hat über 12 Jahre Erfahrung in den Gebieten Semantik und Wissensmanagement und ist einer der führenden Experten in semantischer Modellierung. Sein persönlicher Schwerpunkt liegt im Thema 'business semantics' - wie bringe ich semantische Technologie ins Unternehmen und seine Prozesse hinein, welchen Nutzen kann ich damit stiften?
Vor der Gründung von intelligent views forschte Klaus Reichenberger bei der Fraunhofer Gesellschaft in den Bereichen Visualisierung und Wissensrepräsentation. Er ist Autor zahlreicher Publikationen und Vorträge zum Thema Wissensmanagement und Semantik.
Klaus Reichenberger ist Mitgründer und Geschäftsführer der intelligent views gmbh, wo er neben Vertrieb und Marketing den Bereich Knowledge Engineering verantwortet. In den letzten Jahren hat er bei intelligent views ein Team von Knowledge-Engineers aufgebaut, das einmalige Erfahrung in der praktischen Umsetzung semantischer Technologie versammelt: von der Modellierung semantischer Netze und Konfiguration intelligenter Applikationen bis zur Verknüpfung von Ontologien mit Suchmaschinen, Text-Mining-Techniken und user generated semantics.Klaus Reichenberger hat über 12 Jahre Erfahrung in den Gebieten Semantik und Wissensmanagement und ist einer der führenden Experten in semantischer Modellierung. Sein persönlicher Schwerpunkt liegt im Thema „business semantics“ – wie bringe ich semantische Technologie ins Unternehmen und seine Prozesse hinein, welchen Nutzen kann ich damit stiften?Vor der Gründung von intelligent views forschte Klaus Reichenberger bei der Fraunhofer Gesellschaft in den Bereichen Visualisierung und Wissensrepräsentation. Er ist Autor zahlreicher Publikationen und Vorträge zum Thema Wissensmanagement und Semantik.
Inhaltsverzeichnis 6
1 Warum dieses Buch? 10
1.1 Was erwartet Sie in diesem Buch? 10
2 Grundlagen semantischer Netze 12
2.1 Objekte 12
2.2 Eigenschaften 13
2.3 Kernideen und Grundstze semantischer Modellierung 15
2.3.1 Der Grundsatz der Objektidentitat 16
2.3.2 Die Trennung von Objekt und Benennung 18
2.3.3 Redundanzfreiheit durch Ableitungen 19
2.4 Basisleistungen Verstehen der Nutzerfrage 19
2.5 Basisleistungen Themenraum 21
2.6 Andere Ordnungssysteme Thesauri und Taxonomien 22
2.7 Semantische Netze in der Unternehmens-IT-Landschaft 23
2.8 Semantic Web vs. semantische Netze im Unternehmen 25
2.9 Leichtgewichtige und schwergewichtige Netze 26
2.10 Zusammenfassung Grundlagen semantischer Netze 27
Literatur 28
3 Tagging und assoziative Netze 29
3.1 Tagging 29
3.2 Automatisch generierte assoziative Netze 30
3.2.1 Grundprinzip Cluster-Analyse 31
3.2.2 Statistisches Text-Mining -- Kookkurrenzen 35
3.3 Nutzungsmglichkeiten und Bewertung 35
3.4 Zusammenfassung -- Tagging und assoziative Netze 36
Literatur 37
4 Ausbaustufe Themennetz 38
4.1 Kernideen von Themennetzen 38
4.2 Nutzungsmglichkeiten 39
4.3 Aufbau und Quellen 42
4.3.1 Text-Mining: Cluster-Analyse 43
4.3.2 Halbstrukturierte Quellen 44
4.3.3 Auswertung der Endnutzer-Interaktionen und -Suchen 45
4.3.4 Enduser-Tagging und -Editing 46
4.3.5 Knowledge-Engineering 47
4.3.6 Kombinationen 47
4.4 Der Aufwand fr den Aufbau eines Themennetzes 48
4.5 Zusammenfassung -- Themennetze 49
Literatur 49
5 Ausbaustufe Faktennetz 51
5.1 Kernideen von Faktennetzen 51
5.1.1 Vereinheitlichung 53
5.1.2 Die Ober-/Unterbegriffsrelation 54
5.1.3 Vererbung 56
5.2 Nutzungsmglichkeiten 57
5.2.1 Strukturierte Abfragen 57
5.2.2 Anwendung von strukturierten Abfragen 59
5.2.3 Spezifische Sichten 60
5.2.4 Navigationsbaume und Reports 60
5.2.5 Ähnlichkeitsermittlung 62
5.2.6 Exkurs -- Semantische Netze und Datenbanken 65
5.3 Aufbau und Quellen 66
5.3.1 Text-Mining: gezieltes Parsing 67
5.3.2 Strukturierte Quellen im Unternehmen 68
5.3.3 Knowledge-Engineering 70
5.4 Zusammenfassung -- Faktennetze 70
Literatur 70
6 Expertensysteme und Ontologien 72
6.1 Komplexittsfaktoren 72
6.2 Detailgrad des Modells 72
6.2.1 Funktionale Detaillierung 74
6.2.2 Zeitabhängige Aussagen 75
6.2.3 Differenzierte Aussagen 76
6.2.4 Komplexe Aussagen 77
6.3 Allgemeingltigkeit des Modells 78
6.3.1 Dynamik modellieren 81
6.3.2 Komplexere Instrumente 82
6.3.3 Description logic 83
6.3.4 Komplexere Instrumente -- upper ontologies 85
6.4 Aufbau und Quellen 87
6.5 Zusammenfassung -- Expertensysteme und Ontologien 87
Literatur 87
7 Bewertung und Kombination der Ausbaustufen 89
7.1 Kosten und Nutzen im Vergleich 89
7.2 Kombinationen 92
7.2.1 Zusammenwirken von Themen und Fakten 92
7.2.2 Beimischungen von Expertensystem-Anteilen 94
Literatur 94
8 Projekt- und Anwendungsbeispiele 95
8.1 Typische Einsatzszenarien fr semantische Netze 95
8.2 Welche Ausbaustufe brauche ich? 99
8.3 Projektbeispiel Pressearchiv 100
8.4 Projektbeispiel Technologie-Atlas 102
8.5 Projektbeispiel SAP Research Net 104
8.6 Projektbeispiel Reklamationen und Qualittssicherung 107
8.7 Projektbeispiel Vorentwicklung 109
8.8 Nutzung semantischer Technologie in der Industrie 111
Literatur 114
9 Knowledge-Engineering 116
9.1 Die Wahl des Ausgangspunkts 116
9.2 Iteratives Vorgehen 117
9.3 Die Interaktion mit Fachexperten 119
9.4 Dokumentation der Modellierungsentscheidungen 121
9.5 Konsistenzprfungen des Modells 121
9.6 Grundlagen der Aufwandsabschtzung 122
9.7 Die Werkzeuge 123
9.8 Exkurs: Textbasiertes versus unabhngiges Editing 124
9.9 Zusammenfassung Knowledge-Engineering 125
Literatur 126
10 Erschlieung von Dokumenten 127
10.1 Suchmaschinen und ihre semantische Lcke 127
10.2 Ebenen der Interpretation 129
10.2.1 Die Interpretation der Nutzerfrage 130
10.3 Makrotechniken 132
10.3.1 Semantisch angereicherte Volltextsuche 132
10.3.2 Automatische Klassifikation mit Cluster-Analyse 135
10.4 Mikrotechniken 137
10.5 Kombinationen und Varianten 139
10.5.1 Der Zeitpunkt der Anwendung 139
10.5.2 Prakoordination versus Postkoordination 140
10.6 Vertiefung Texterschlieung 142
10.7 Zusammenfassung -- Erschlieung von Dokumenten 142
Literatur 143
11 Modellierungsdetails 144
11.1 Begriffe und Individuen 144
11.2 Die Ober-/Unterbegriffsrelation 147
11.3 Rollen 150
11.4 Charakteristika von Relationen 151
11.5 Die Rolle der Benennungen 153
11.5.1 Kunstbegriffe zur Gruppierung 154
11.5.2 Ausfaktorisieren von Eigenschaften durch Kunstbegriffe 156
11.6 Mehrstellige Relationen 156
11.7 Metamodelle und Mehrsprachigkeit 160
11.8 Zusammenfassung -- Modellierungsdetails 162
Literatur 163
12 Unsicheres Wissen 164
12.1 Unsicherheit, systematisch betrachtet 164
12.2 Umgang mit fehlerbehafteter Information 165
12.3 Der Anspruch auf Vollstndigkeit 166
12.4 Formale Definitionen und unvollstndiges Wissen 168
12.5 Ungenauigkeit und Robustheit 169
12.6 Modelle unterschiedlicher Granularitt 170
12.7 Przision im Schema 174
12.8 Unsicherheit bei Ableitungen 175
12.8.1 Kontextfreiheit und Ableitungen 177
12.8.2 Ableitungen auf Begriffshierarchien 180
12.9 Ausnahmen und Negativaussagen 183
12.10 Zusammenfassung -- unsicheres Wissen 184
Literatur 185
13 bungen 186
13.1 Übung 1: ein einfaches Automobilnetz 186
13.2 Übung 2: ein kleines Geo-Modell 186
13.3 Übung 3: Ableitungen 187
13.4 Übung 4: Kombinationen 188
13.5 Übung 5: Übersetzung einer MindMap 188
13.6 Übung 6: Vertriebsmandate 189
13.7 Auflsung Übung 1 190
13.8 Auflsung Übung 2 191
13.9 Auflsung Übung 3 193
13.10 Mgliche Lsungen Übung 4 195
13.11 Mgliche Lsung Übung 5 196
13.12 Mgliche Lsung Übung 6 198
Glossar 201
Danksagung 206
Register 207
"Kapitel 3 Tagging und assoziative Netze (S. 21-22)
3.1 Tagging
Lassen Sie uns in die Übersicht über die verschiedenen Grade der semantischen Informationserschließung mit einer Vorstufe semantischer Netze einsteigen, dem Tagging von Informationen. Tags sind Schlagworte, mit denen beliebige Objekte charakterisiert werden können. Tags sind nichts grundsätzlich Neues, wir kennen sie als Teil einer klassischen Kombination aus jeder Bibliothek.
Hier sind die Bücher nach einer Aufstellungssystematik in Regale (= in Ordner) eingeordnet, daneben aber auch in einem Schlagwortkatalog verzeichnet (= mit Tags versehen). Diese Schlagworte werden entweder vom Verlag vorgeschlagen oder von einem Mitarbeiter der Bibliothek vergeben, der das Buch gelesen oder mindesten überflogen hat; als Dienstleistung für die Nutzer der Bibliothek. Die Praxis der Verschlagwortung bzw. des Tagging erleichtert das Finden relevanter Informationen ungemein; besonders zwingend natürlich dort, wo die Gegenstände, die gefunden werden sollen, sich anderen Techniken wie etwa der Volltextsuche verweigern.
Das ist z.B. der Fall bei einer der ersten und immer noch populärsten Anwendungen des Tagging, der Web-Bilddatenbank flickr,2 hier wird eine sehr große Sammlung von Bildern erst dadurch handhabbar gemacht, dass diese getagged sind. Das Neue am Tagging gegenüber dem Schlagwortkatalog der Bibliothek ist der dezentrale Charakter – nicht ein Redaktionsteam vergibt die Tags, sondern alle Nutzer einer Community.
Entsprechend setzt das Tagging in der Frage der Qualität auf der Prinzip der wisdom of crowds (auch crowdsourcing): worauf sich eine Mehrheit von Nutzern bei der Vergabe von Tags einigen kann, ist bestimmt auch für eine Mehrheit von Nutzern bei der Suche gut. Dieser Ansatz hat allerdings seine Grenzen. Welche das sind, zeigt uns am besten ein Beispiel: Wie bei den Verzeichnisstrukturen im letzten Abschnitt gelingt es auch dem Tagging i.d.R. nicht Objektidentität herzustellen, wenn auch aus anderen Gründen: Hier nämlich finden Synonyme wie Coffee Makers und Coffee Machines, hier finden Einzahl, Mehrzahl und Schreibfehler nicht zueinander.
Die Folgen sind ähnlich: Ein Nutzer steigt vielleicht mit dem Begriff Coffee Machine ein und weiß nicht, dass ihm wertvolle Dokumente entgehen, die aber mit Coffee Maker getagged sind. Dokumente mit Tags wie Coffee Makers (Plural) oder Coffe (Schreibfehler) sind wie falsch eingeordnete Bücher in einer Bibliothek – sie werden höchstens durch Zufall wiedergefunden. Dieses Problem ist untrennbar mit dem Ansatz verbunden, sich das Instrumentarium der Erschließung durch die Nutzer aufbauen zu lassen. Dann wären für unseren Nutzer noch Beziehungen (z.B. zwischen Coffee und Coffee Machine) hilfreich, denen er aufWunsch nachgehen könnte. Und schließlich würde eine Gruppierung der Tags, etwa in Getränke, Komponenten und Maschinentypen die Übersichtlichkeit und Eindeutigkeit erhöhen. Beides sind Instrumente, die uns das Tagging nicht ohne weiteres bieten kann."
Erscheint lt. Verlag | 17.5.2010 |
---|---|
Reihe/Serie | X.media.press | X.media.press |
Zusatzinfo | X, 197 S. 80 Abb. |
Verlagsort | Berlin |
Sprache | deutsch |
Themenwelt | Kunst / Musik / Theater ► Design / Innenarchitektur / Mode |
Mathematik / Informatik ► Informatik ► Software Entwicklung | |
Wirtschaft ► Betriebswirtschaft / Management ► Wirtschaftsinformatik | |
Schlagworte | Cluster-Analyse • description logic • Editing • Knowledge Engineering • Modellierung • semantic web • Semantische Netze • Suchmaschinenmarketing (SEM) • Tagging • Technologie • Text-Mining • Upper Ontologies |
ISBN-10 | 3-642-04315-1 / 3642043151 |
ISBN-13 | 978-3-642-04315-4 / 9783642043154 |
Haben Sie eine Frage zum Produkt? |
Größe: 8,0 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich