Technisch erm?glichte Erl?uterung der Sprecher Eigenschaften

?berblick

Das Sprachsignal ist eine reichhaltige Informationsquelle, die nicht nur linguistische, sondern auch so genannte para- oder au?ersprachliche Inhalte vermittelt, die die Identit?t, das Geschlecht, den emotionalen oder kognitiven Zustand, das Alter und die Gesundheit eines Sprechers offenbaren. Diese Merkmale sind Gegenstand zahlreicher Untersuchungen in der Phonetik, aber aufgrund der hohen Komplexit?t der zugrundeliegenden Dimensionen sind sie oft auf stark kontrollierte Datens?tze beschr?nkt, die nicht generalisiert sind. Praktisches Wissen über die Phonetik von Sprechereigenschaften ist auch für Sprachtherapeuten, Schauspieler oder ?ffentliche Redner unverzichtbar. W?hrend die Sprachtechnologie in der Lage ist, die komplexen Signale, die den Sprechcharakteristika zugrunde liegen, zu klassifizieren und sogar zu entflechten, stellt die Disziplin bisher keine interpretierbaren Modelle zur Verfügung, die phonetischen Experten beim Wissenstransfer an nicht fachkundige Sprecher helfen. Unser Projekt wird daher die M?glichkeit untersuchen, technische L?sungen zu entwickeln, um die Generierung von Erkl?rungen innerhalb der Sprechwissenschaft zu unterstützen. Konkret argumentieren wir, dass die phonetische Realisierung einer Dimension der phonetischen Variation viel besser bestimmt werden kann, wenn zwei Sprechproben generiert werden, die den gleichen sprachlichen Inhalt enthalten und sich nur in der Auspr?gung eines einzigen Merkmals unterscheiden. Diese Erkl?rungen sollten es Sprechern letztlich erm?glichen, die interessierenden paralinguistischen Dimensionen entweder zu identifizieren oder zu imitieren.

Key Facts

Laufzeit:
01/2021 - 12/2025
Gef?rdert durch:
DFG

Detailinformationen

Projektleitung

contact-box image

Prof. Dr. Reinhold H?b-Umbach

Nachrichtentechnik (NT) / Heinz Nixdorf Institut

Zur Person