Nicht aus der Schweiz? Besuchen Sie lehmanns.de
Deep Learning-basierte Vorhersage der Sprachqualität - Gabriel Mittag

Deep Learning-basierte Vorhersage der Sprachqualität

(Autor)

Buch | Hardcover
XIV, 174 Seiten
2025
Springer International Publishing (Verlag)
978-3-031-38586-5 (ISBN)
CHF 153,95 inkl. MwSt
  • Noch nicht erschienen - erscheint am 14.02.2025
  • Versandkostenfrei
  • Auch auf Rechnung
  • Artikel merken

Dieses Buch zeigt, wie man die neuesten Methoden des maschinellen Lernens (Deep Learning) für die Vorhersage der Sprachqualität einsetzen kann. Der Autor zeigt, wie die jüngsten Fortschritte im Bereich des maschinellen Lernens für die Aufgabe der Sprachqualitätsvorhersage genutzt werden können und bietet eine eingehende Analyse der Eignung verschiedener Deep-Learning-Architekturen für diese Aufgabe. Der Autor zeigt dann, wie das resultierende Modell herkömmliche Sprachqualitätsmodelle übertrifft und zusätzliche Informationen über die Ursache einer Qualitätsbeeinträchtigung durch die Vorhersage der Sprachqualitätsdimensionen Rauschen, Färbung, Diskontinuität und Lautheit liefert.

lt;p>Gabriel Mittag erhielt seinen B.Sc. und M.Sc. in Elektrotechnik und Elektronik an der Technischen Universität Berlin. Während seines Masterstudiums verbrachte er zwei Semester an der RMIT University in Melbourne, Australien und beschäftigte sich vor allem mit biomedizinischer und Sprachsignalverarbeitung. Ab 2016 war er als wissenschaftlicher Mitarbeiter am Quality and Usability Lab der TU Berlin tätig und promovierte dort über die maschinelle lernbasierte Vorhersage von Sprachqualität. Im Mai 2021 begann Gabriel Mittag als Machine Learning Scientist bei Microsoft in Redmond, WA, USA.

1.Einführung.- 2. Qualitätsbewertung der übertragenen Sprache - 3. Neuronale Netzwerkarchitekturen für die Vorhersage der Sprachqualität - 4. Doppelendige Sprachqualitätsvorhersage mit Siamesischen Netzen.- 5. Vorhersage von Sprachqualitätsdimensionen mit Multi-Task-Lernen - 6. Bias-Aware Loss für das Training aus mehreren Datensätzen.- 7. NISQA - Ein einseitiges Sprachqualitätsmodell.- 8. Schlussfolgerungen.- A. Datensatz-Zustandstabellen.- B. Dimensionshistogramme für Trainings- und Validierungsdatensätze.- Referenzen.

Erscheinungsdatum
Zusatzinfo XIV, 174 S. 59 Abb., 54 Abb. in Farbe.
Verlagsort Cham
Sprache deutsch
Original-Titel Deep Learning Based Speech Quality Prediction
Maße 155 x 235 mm
Themenwelt Technik Elektrotechnik / Energietechnik
Schlagworte Deep learning • Maschinelles Lernen • Qualität der Dienstleistung • Qualität der Erfahrung • Sprachqualität
ISBN-10 3-031-38586-1 / 3031385861
ISBN-13 978-3-031-38586-5 / 9783031385865
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich
Wegweiser für Elektrofachkräfte

von Gerhard Kiefer; Herbert Schmolke; Karsten Callondann

Buch | Hardcover (2024)
VDE VERLAG
CHF 67,20