Text-zu-Bild-Generatoren wie DALL-E 2. Einsatz, Risiken und Systemgrenzen von "kreativer" künstlicher Intelligenz (eBook)
39 Seiten
GRIN Verlag
978-3-346-75207-9 (ISBN)
H1: Aktuelle Text-zu-Bild-Generatoren sind in der Lage, Bilder in einer Qualität zu generieren, wie Menschen es in der Fotografie und der Bildkunst können. H2: Text-zu-Bild-Generatoren sind durch ihren Trainingsdatensatz begrenzt und können keine Werke erstellen, für die sie nicht mit genügend Referenzen trainiert wurden.
Menschen haben ein starkes visuelles Vorstellungsvermögen. Wenn Menschen über sensorische Charakteristiken nachdenken, vermitteln sie sie selbst über Bilder, die sie sich in ihrem Bewusstsein vorstellen. Dieses Vorstellungsvermögen spielt eine wichtige Rolle dabei, Erinnerungen zu verarbeiten und Zusammenhänge herzustellen. Bildverarbeitungstechnologien, die in Computerspielen oder Anwendungen wie Photoshop eingesetzt werden, haben in den letzten Jahren stark von der Maschine-Learning-Technologie profitiert. Einer der neuen Felder ist die Synthese von Bildmaterial durch Text-zu-Bild-Generatoren. Die Grundlagen hierfür legten Godfellow et al. 2014, indem sie neuralen Netzwerken beibrachten, sich selbst zu trainieren. Dafür trainierten sie zwei Modelle. Beide Modelle wurden mit Bildern aus einem Datensatz trainiert. Allerdings sollte das erste Modell, das Generative Model, daraus neue Bilder kreieren und das zweite Modell, das Discriminative Model, feststellen, ob das erste Modell die Bilder aus dem Datensatz nur kopiert oder tatsächlich ein neues Bild generiert hat. Im statistisch besten Sinne gab das zweite Modell die Wahrscheinlichkeit, ob die Ausgabe ein neues Bild ist, mit einem Koeffizienten an. So wurde der Weg zu einem Bildgenerator, der neue Bilder generiert, die es zuvor so noch nicht gegeben hatte, zu einem Spiel mit zwei Spielern.
Erscheint lt. Verlag | 21.10.2022 |
---|---|
Verlagsort | München |
Sprache | deutsch |
Themenwelt | Mathematik / Informatik ► Informatik ► Netzwerke |
Informatik ► Theorie / Studium ► Künstliche Intelligenz / Robotik | |
Schlagworte | DALL-E 2 • KI • Prompts • T2I • Text to Image • text zu bild generatoren |
ISBN-10 | 3-346-75207-0 / 3346752070 |
ISBN-13 | 978-3-346-75207-9 / 9783346752079 |
Haben Sie eine Frage zum Produkt? |
Größe: 2,4 MB
Digital Rights Management: ohne DRM
Dieses eBook enthält kein DRM oder Kopierschutz. Eine Weitergabe an Dritte ist jedoch rechtlich nicht zulässig, weil Sie beim Kauf nur die Rechte an der persönlichen Nutzung erwerben.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich