Sie sind hier

E-Book

Grundfrequenzparameter bei Sprechen in Ruhe und unter Lärmbelastung: Untersuchungen zur mittleren Sprechstimmlage und ihrer Variabilität

Autor	Karen Masthoff
Verlag	Books on Demand
Erscheinungsjahr	2016
Seitenanzahl	200 Seiten
ISBN	9783741279089
Format	ePUB
Kopierschutz	Wasserzeichen
Geräte	PC/MAC/eReader/Tablet
Preis	5,49 EUR

In der forensischen Sprechererkennung spielen bei der Stimmenanalyse und beim Stimmenvergleich neben auditiv wahrnehmbaren auch verschiedene quantifizierbare phonetische Parameter eine Rolle, darunter Formantfrequenzen, Artikulations- und Silbenrate oder auch die mittlere Sprechstimmlage. Letztere, in der wissenschaftlichen Literatur auch als mittlere Grundfrequenz bezeichnet, gilt in der forensischen Sprechererkennung als sprecherspezifisches Merkmal. Dabei ist jedoch zu berücksichtigen, dass die Ausprägung bzw. Lage der mittleren Grundfrequenz von verschiedenen Faktoren beeinflusst wird, wodurch die Aussagekraft von Grundfrequenzparametern entsprechend relativiert wird.

Die Autorin hat ein Studium der Phonetik und Anglistik an der Universität Trier absolviert. Diese Arbeit wurde im Jahr 2016 vom Fachbereich II: Sprach-, Literatur- und Medienwissenschaften der Universität Trier als Dissertation angenommen.

Kaufen Sie hier:

Horizontale Tabs

Leseprobe

3 Versuchsaufbau

In Kapitel 3 wird dargestellt, welche Ausgangsbedingungen und welcher Versuchsablauf für das Experiment in der vorliegenden Arbeit gegeben sind. Zunächst wird das Ausgangsmaterial vorgestellt, im Anschluss daran werden die technischen Voraussetzungen und der Versuchsablauf erklärt und zum Schluss wird die zur Exktraktion der mittleren F0 und der Standardabweichung angewendete Messmethode beschrieben.

3.1 Ausgangsmaterial

Zur Untersuchung der aus dem theoretischen Teil entwickelten Arbeitshypothesen wurden von 31 männlichen Versuchspersonen, mit uneingeschränktem Hörvermögen, im Alter zwischen 20-25 Jahren, Polizeischüler der Landespolizeischule Rheinland-Pfalz, Sprechproben aufgezeichnet. Im weiteren Verlauf der Arbeit sind diese Sprechproben mit den laufenden Nummern 1-31 gekennzeichnet. Im Einzelnen lagen von jedem der 31 Sprecher insgesamt zwölf Proben nach folgendem Muster vor:

Tabelle 3 Übersicht über erstellte Sprechproben

Lesen (Text s. Anhang)

Spontansprache (s. Anhang)

Modalmodus

Lombardmodus:
Stimmengewirr 70dB

Lombardmodus:
Stimmengewirr 80dB

Lombardmodus:
Fahrgeräusche 70dB

Lombardmodus:
Fahrgeräusche 80dB

Lombardmodus:
Weißes Rauschen 60dB

Quelle: Eigene Erstellung.

Tabelle 3 zeigt eine Übersicht über die jeweils erstellten Sprechproben für die einzelnen Versuchspersonen. Für Lesen und Spontansprache liegen für jede VP jeweils eine Modalprobe und insgesamt fünf Lombardproben vor. Insgesamt gibt es für jede VP also 12 einzelne Sprechproben.

Die Dauer der Leseproben schwankte unter den Vpn zwischen 90120 Sekunden, die der Spontanproben je nach Netto-Sprachanteil zwischen 90-130 Sekunden. Nach French entspricht dies damit einer für eine zuverlässige Messung der Grundfrequenz ausreichenden Dauer94. Das vorzutragende Material bestand aus einer Bildergeschichte ("Vater und Sohn") für das spontane Sprechen und aus einem Märchen für den Lesetext.

3.2 Technische Voraussetzungen

Die Sprechproben wurden mit einem SONY Stereo-Kondensator-Ansteckmikrofon Modell ECM-T145 unter der Verwendung einer externen Soundkarte Creative, Modell 80300, digital im windows.wav-Format mit 44,1 kHz-Abtastrate, 16-bit-Quantisierung bei manueller Aussteuerung über Adobe Audition 1.5 auf einem Laptop-Computer aufgezeichnet. Die Lombard-Bedingung wurde hergestellt, indem den Vpn das jeweilige Störgeräusch über einen ohrumschließenden, offenen Kopfhörer der Marke SENNHEISER, HD 250 von einem weiteren Laptop unter Verwendung einer weiteren Soundkarte des o.a. Modells und Adobe Audition 1.5 eingespielt wurde. Die zur Simulation des Lombard-Einflusses verwendeten Störschälle (Fahrgeräusch und Stimmengewirr) wurden mit einem ROLAND R-05 wav/mp3-Rekorder gleichfalls mit 44,1 kHz-Abtastrate sowie 16-bit-Quantisierung im windows.wav-Format aufgezeichnet. Dabei wurde das Fahrgeräusch während einer Autobahnfahrt in einem Ford Mondeo, Baujahr 2001, mit 2,0-Liter Ottomotor bei konstant 120 km/h aufgenommen, das Stimmengewirr im Einkaufszentrum „Trier-Galerie“ zu einer, in der Regel hochfrequentierten, Tageszeit zwischen 12.00-13.00 Uhr im Bereich der Gastronomie aufgezeichnet.

Abbildung 2 10 Sekunden des Fahrgeräuschs im Breitbandsonagramm

Quelle: Erstellung mit PRAAT.

Abbildung 3 10 Sekunden des Fahrgeräuschs im Schmalbandsonagramm

Quelle: Erstellung mit PRAAT.

Abbildung 4 10 Sekunden des Stimmengewirrs im Breitbandsonagramm

Quelle: Erstellung mit PRAAT.

Abbildung 5 10 Sekunden des Stimmengewirrs im Schmalbandsonagramm

Quelle: Erstellung mit PRAAT.

Die Abbildungen 2 - 5 lassen erkennen, dass das Fahrgeräusch in Bezug auf seinen zeitlichen Verlauf und seine Frequenzstruktur deutlich konstanter und homogener ausfällt als das Stimmengewirr. Oszillographisch und sonagraphisch zeigen sich die typischen Merkmale der Grundschallform „Rauschen“, wobei die Hauptenergie im Bereich unterhalb von 300 Hz vorhanden ist. Das Stimmengewirr offenbart hingegen eine größere Varianz sowohl über die Zeit als auch die Frequenz. Auffällig sind die wiederkehrenden harmonischen Anteile, die sich aus den vorhandenen Hintergrundstimmen ergeben.

Das Weiße Rauschen wurde mit Hilfe von Adobe Audition 1.5 mit einer Bandbreite von 20 kHz generiert. Die verschiedenen Intensitätsstufen des Fahrgeräuschs und des Stimmengewirrs (70 und 80 dB) wurden realisiert, indem mit Hilfe eines Schallpegelmessers NTI XL295 der Lautstärkeregler am Laptop so eingestellt wurde, dass in ca. einem Zentimeter Abstand von der Kopfhörermembran die entsprechenden Pegel vorhanden waren. Anhand von Vorversuchen mit zwei normal hörenden Versuchspersonen96 und unter Berücksichtigung der in der Literatur häufig verwendeten Schallpegel wurde die Entscheidung getroffen, das Fahrgeräusch und das Stimmengewirr auf 70 und 80 dB einzustellen. 70 Dezibel empfanden die beiden Vpn als störend, 80 dB als unangenehm, noch höhere Pegel an der Grenze des Zumutbaren. Die Anwendung höherer Pegel wurde daher unterlassen, da die Vpn den Störschällen ja auch über einen längeren Zeitraum (s.o.) ausgesetzt werden sollten. Das Weiße Rauschen wurde mit einem Pegel von 60 dB realisiert, um die Messergebnisse der diesbezüglichen Sprechproben mit denen aus Meinerz (2010) vergleichbar zu machen und um diese gegebenenfalls statistisch ergänzen zu können.

3.3 Ablauf der Sprechprobenabnahme

Den Versuchspersonen waren die Hintergründe des Experiments und die Fragestellungen vorab nicht bekannt. Erst nach Abschluss der Sprechprobenabnahmen wurden sie dahingehend informiert. Jede Versuchsperson wurde zunächst in den Ablauf der Sprechprobenabnahme und in die zu leistende Aufgabe eingewiesen. Tabelle 4 zeigt die chronologische Abfolge und die Dauer (ca.) der einzelnen Abschnitte, die sich auf insgesamt ca. 25 Minuten Sprechzeit für die Sprechprobe insgesamt summieren.

Zwischen den einzelnen Schritten lag jeweils eine Pause von ca. 3060 Sekunden, in der die jeweilige Aufzeichnung gespeichert und die Materialien gewechselt wurden. Die Pause sollte den Versuchspersonen gleichzeitig zur kurzen Regeneration dienen. Inklusive der Pausen ergibt sich damit eine Gesamtdauer der Sprechprobenabnahme von ca. 30 Minuten. Um einen Gewöhnungseffekt an die Aufnahmesituation bzw. das vorzutragende Material zu vermeiden, wurde den Versuchspersonen für jede einzelne Aufnahmebedingung neues Bild- bzw. Lesematerial vorgelegt. Aufgrund der Erkenntnisse aus den Vorversuchen wurde der Ablauf der Probenabnahme in Bezug auf die Art des Störschalls so strukturiert, dass zunächst das Fahrgeräusch und dann das Stimmengewirr angewendet wurden. Die Vpn aus den Vorversuchen gaben an, dass sie das Stimmengewirr als belastender als das Fahrgeräusch empfanden. Daher wurde die Reihenfolge der Einspielung der Störgeräusche nach dem Prinzip der Steigerung festgelegt.

Tabelle 4 Dauer der Erhebung der einzelnen Sprechproben

Schritte

Zeitliche Dauer (ca.)

Einweisung der Versuchspersonen in den Ablauf und die zu verwendenden Materialien, Versorgung mit Mikrofon und Kopfhörern

3 min.

Anlesen zur individuellen Anfangsaussteuerung der Aufnahme Aufzeichnung

1 min.

Aufzeichnung Modalprobe: Lesen

2 min.

Aufzeichnung Modalprobe: Spontan

2 min.

Aufzeichnung Lombardprobe: Lesen (Fahr-geräusche: 70 dB)

2 min.

Aufzeichnung Lombardprobe: Spontan (Fahr-geräusche: 70 dB)

2 min.

Aufzeichnung Lombardprobe : Spontan (Fahr-geräusche: 80 dB)

2 min.

Aufzeichnung Lombardprobe: Lesen (Fahr-geräusche: 80 dB)

2 min.

Aufzeichnung Lombardprobe: Spontan (Stimmengewirr: 70 dB)

2 min.

Aufzeichnung Lombardprobe: Lesen (Stimmengewirr: 70 dB)

2 min.

Aufzeichnung Lombardprobe: Spontan (Stimmengewirr: 80 dB)

2 min.

Aufzeichnung Lombardprobe: Lesen (Stimmengewirr: 80 dB)

2...

Blick ins Buch

Weitere E-Books zum Thema: Literatur - Sprache - Literaturwissenschaft

Romanische Sprachgeschichte / Histoire linguistique de la Romania. 2. Teilband

- Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK)ISSN 23/2 Format: PDF

Gehard Ernst is Professor emeritus at the Universität Regensburg, Germany. Martin-Dietrich Glessgen is Professor at the Universität Zürich, Switzerland. Christian Schmitt…

Romanische Sprachgeschichte / Histoire linguistique de la Romania. 2. Teilband

- Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK)ISSN 23/2 Format: PDF

Gehard Ernst is Professor emeritus at the Universität Regensburg, Germany. Martin-Dietrich Glessgen is Professor at the Universität Zürich, Switzerland. Christian Schmitt…

Instrumente in Kunst und Wissenschaft

Zur Architektonik kultureller Grenzen im 17. Jahrhundert Format: PDF

This volume presents a collection of original papers at the intersection of philosophy, the history of science, cultural and theatrical studies. Based on a series of case studies on the 17th…

Instrumente in Kunst und Wissenschaft

Zur Architektonik kultureller Grenzen im 17. Jahrhundert Format: PDF

This volume presents a collection of original papers at the intersection of philosophy, the history of science, cultural and theatrical studies. Based on a series of case studies on the 17th…

Instrumente in Kunst und Wissenschaft

Zur Architektonik kultureller Grenzen im 17. Jahrhundert Format: PDF

This volume presents a collection of original papers at the intersection of philosophy, the history of science, cultural and theatrical studies. Based on a series of case studies on the 17th…

Perspektiven für die Publikumszeitschrift

Format: PDF

Namhafte Autoren aus Praxis und Wissenschaft liefern hier erstmalig die umfangreiche Darstellung und Analyse der Perspektiven von Publikumszeitschriften im heutigen Wettbewerbsumfeld:…

Perspektiven für die Publikumszeitschrift

Format: PDF

Namhafte Autoren aus Praxis und Wissenschaft liefern hier erstmalig die umfangreiche Darstellung und Analyse der Perspektiven von Publikumszeitschriften im heutigen Wettbewerbsumfeld:…

Perspektiven für die Publikumszeitschrift

Format: PDF

Namhafte Autoren aus Praxis und Wissenschaft liefern hier erstmalig die umfangreiche Darstellung und Analyse der Perspektiven von Publikumszeitschriften im heutigen Wettbewerbsumfeld:…

Perspektiven für die Publikumszeitschrift

Format: PDF

Namhafte Autoren aus Praxis und Wissenschaft liefern hier erstmalig die umfangreiche Darstellung und Analyse der Perspektiven von Publikumszeitschriften im heutigen Wettbewerbsumfeld:…

Das 18. Jahrhundert

Zeitalter der Aufklärung Format: PDF

Akademie Studienbücher - Literaturwissenschaft - Diskussion von Epochenbegriff und Epochengrenzen - Autor, Markt und Publikum: Strukturwandel der literarischen Öffentlichkeit - Die…

Weitere Zeitschriften

Archiv und Wirtschaft

"Archiv und Wirtschaft" ist die viermal jährlich erscheinende Verbandszeitschrift der Vereinigung der Wirtschaftsarchivarinnen und Wirtschaftsarchivare e. V. (VdW), in der seit 1967 rund 2.500 ...

Beiträge zur Namenforschung

Beiträge zur Namenforschung. Neue Folge ist eine internationale fachübergreifende Zeitschrift für Namenforschung. In den Artikeln werden Probleme der Ortsnamen- wie Personenamenforschung und der ...

Berufsstart Bewerbung

»Berufsstart Bewerbung« erscheint jährlich zum Wintersemester im November mit einer Auflage von 50.000 Exemplaren und ermöglicht Unternehmen sich bei Studenten und Absolventen mit einer ...

cards Karten cartes

Die führende Zeitschrift für Zahlungsverkehr und Payments – international und branchenübergreifend, erscheint seit 1990 monatlich (viermal als Fachmagazin, achtmal als ...

DER PRAKTIKER

Technische Fachzeitschrift aus der Praxis für die Praxis in allen Bereichen des Handwerks und der Industrie. “der praktiker“ ist die Fachzeitschrift für alle Bereiche der fügetechnischen ...

Der Steuerzahler

Der Steuerzahler ist das monatliche Wirtschafts- und Mitgliedermagazin des Bundes der Steuerzahler und erreicht mit fast 230.000 Abonnenten einen weitesten Leserkreis von 1 ...

Deutsche Hockey Zeitung

Informiert über das nationale und internationale Hockey. Die Deutsche Hockeyzeitung ist Ihr kompetenter Partner für Ihren Auftritt im Hockeymarkt. Sie ist die einzige bundesweite Hockeyzeitung ...

DGIP-intern

Mitteilungen der Deutschen Gesellschaft für Individualpsychologie e.V. (DGIP) für ihre Mitglieder Die Mitglieder der DGIP erhalten viermal jährlich das Mitteilungsblatt „DGIP-intern“ ...

Die Medizinischen Fachangestellten

Prüfungs- und Praxiswissen für Zahnmedizinische Fachangestellte Mehr Erfolg in der Ausbildung, sicher in alle Prüfungen gehen, im Beruf jeden Tag überzeugen: „Die Zahnmedizinische ...

EineWelt

Lebendige Reportagen, spannende Interviews, interessante Meldungen, informative Hintergrundberichte. Lesen Sie in der Zeitschrift „EineWelt“, was Menschen in Mission und Kirche bewegt Man kann ...