Sie sind hier
E-Book

Grundfrequenzparameter bei Sprechen in Ruhe und unter Lärmbelastung: Untersuchungen zur mittleren Sprechstimmlage und ihrer Variabilität

AutorKaren Masthoff
VerlagBooks on Demand
Erscheinungsjahr2016
Seitenanzahl200 Seiten
ISBN9783741279089
FormatePUB
KopierschutzWasserzeichen
GerätePC/MAC/eReader/Tablet
Preis5,49 EUR
In der forensischen Sprechererkennung spielen bei der Stimmenanalyse und beim Stimmenvergleich neben auditiv wahrnehmbaren auch verschiedene quantifizierbare phonetische Parameter eine Rolle, darunter Formantfrequenzen, Artikulations- und Silbenrate oder auch die mittlere Sprechstimmlage. Letztere, in der wissenschaftlichen Literatur auch als mittlere Grundfrequenz bezeichnet, gilt in der forensischen Sprechererkennung als sprecherspezifisches Merkmal. Dabei ist jedoch zu berücksichtigen, dass die Ausprägung bzw. Lage der mittleren Grundfrequenz von verschiedenen Faktoren beeinflusst wird, wodurch die Aussagekraft von Grundfrequenzparametern entsprechend relativiert wird.

Die Autorin hat ein Studium der Phonetik und Anglistik an der Universität Trier absolviert. Diese Arbeit wurde im Jahr 2016 vom Fachbereich II: Sprach-, Literatur- und Medienwissenschaften der Universität Trier als Dissertation angenommen.

Kaufen Sie hier:

Horizontale Tabs

Leseprobe

3 Versuchsaufbau


In Kapitel 3 wird dargestellt, welche Ausgangsbedingungen und welcher Versuchsablauf für das Experiment in der vorliegenden Arbeit gegeben sind. Zunächst wird das Ausgangsmaterial vorgestellt, im Anschluss daran werden die technischen Voraussetzungen und der Versuchsablauf erklärt und zum Schluss wird die zur Exktraktion der mittleren F0 und der Standardabweichung angewendete Messmethode beschrieben.

3.1 Ausgangsmaterial


Zur Untersuchung der aus dem theoretischen Teil entwickelten Arbeitshypothesen wurden von 31 männlichen Versuchspersonen, mit uneingeschränktem Hörvermögen, im Alter zwischen 20-25 Jahren, Polizeischüler der Landespolizeischule Rheinland-Pfalz, Sprechproben aufgezeichnet. Im weiteren Verlauf der Arbeit sind diese Sprechproben mit den laufenden Nummern 1-31 gekennzeichnet. Im Einzelnen lagen von jedem der 31 Sprecher insgesamt zwölf Proben nach folgendem Muster vor:

Tabelle 3 Übersicht über erstellte Sprechproben

Lesen (Text s. Anhang)Spontansprache (s. Anhang)
ModalmodusModalmodus
Lombardmodus:
Stimmengewirr 70dB
Lombardmodus:
Stimmengewirr 70dB
Lombardmodus:
Stimmengewirr 80dB
Lombardmodus:
Stimmengewirr 80dB
Lombardmodus:
Fahrgeräusche 70dB
Lombardmodus:
Fahrgeräusche 70dB
Lombardmodus:
Fahrgeräusche 80dB
Lombardmodus:
Fahrgeräusche 80dB
Lombardmodus:
Weißes Rauschen 60dB
Lombardmodus:
Weißes Rauschen 60dB

Quelle: Eigene Erstellung.

Tabelle 3 zeigt eine Übersicht über die jeweils erstellten Sprechproben für die einzelnen Versuchspersonen. Für Lesen und Spontansprache liegen für jede VP jeweils eine Modalprobe und insgesamt fünf Lombardproben vor. Insgesamt gibt es für jede VP also 12 einzelne Sprechproben.

Die Dauer der Leseproben schwankte unter den Vpn zwischen 90120 Sekunden, die der Spontanproben je nach Netto-Sprachanteil zwischen 90-130 Sekunden. Nach French entspricht dies damit einer für eine zuverlässige Messung der Grundfrequenz ausreichenden Dauer94. Das vorzutragende Material bestand aus einer Bildergeschichte ("Vater und Sohn") für das spontane Sprechen und aus einem Märchen für den Lesetext.

3.2 Technische Voraussetzungen


Die Sprechproben wurden mit einem SONY Stereo-Kondensator-Ansteckmikrofon Modell ECM-T145 unter der Verwendung einer externen Soundkarte Creative, Modell 80300, digital im windows.wav-Format mit 44,1 kHz-Abtastrate, 16-bit-Quantisierung bei manueller Aussteuerung über Adobe Audition 1.5 auf einem Laptop-Computer aufgezeichnet. Die Lombard-Bedingung wurde hergestellt, indem den Vpn das jeweilige Störgeräusch über einen ohrumschließenden, offenen Kopfhörer der Marke SENNHEISER, HD 250 von einem weiteren Laptop unter Verwendung einer weiteren Soundkarte des o.a. Modells und Adobe Audition 1.5 eingespielt wurde. Die zur Simulation des Lombard-Einflusses verwendeten Störschälle (Fahrgeräusch und Stimmengewirr) wurden mit einem ROLAND R-05 wav/mp3-Rekorder gleichfalls mit 44,1 kHz-Abtastrate sowie 16-bit-Quantisierung im windows.wav-Format aufgezeichnet. Dabei wurde das Fahrgeräusch während einer Autobahnfahrt in einem Ford Mondeo, Baujahr 2001, mit 2,0-Liter Ottomotor bei konstant 120 km/h aufgenommen, das Stimmengewirr im Einkaufszentrum „Trier-Galerie“ zu einer, in der Regel hochfrequentierten, Tageszeit zwischen 12.00-13.00 Uhr im Bereich der Gastronomie aufgezeichnet.

Abbildung 2 10 Sekunden des Fahrgeräuschs im Breitbandsonagramm

Quelle: Erstellung mit PRAAT.

Abbildung 3 10 Sekunden des Fahrgeräuschs im Schmalbandsonagramm

Quelle: Erstellung mit PRAAT.

Abbildung 4 10 Sekunden des Stimmengewirrs im Breitbandsonagramm

Quelle: Erstellung mit PRAAT.

Abbildung 5 10 Sekunden des Stimmengewirrs im Schmalbandsonagramm

Quelle: Erstellung mit PRAAT.

Die Abbildungen 2 - 5 lassen erkennen, dass das Fahrgeräusch in Bezug auf seinen zeitlichen Verlauf und seine Frequenzstruktur deutlich konstanter und homogener ausfällt als das Stimmengewirr. Oszillographisch und sonagraphisch zeigen sich die typischen Merkmale der Grundschallform „Rauschen“, wobei die Hauptenergie im Bereich unterhalb von 300 Hz vorhanden ist. Das Stimmengewirr offenbart hingegen eine größere Varianz sowohl über die Zeit als auch die Frequenz. Auffällig sind die wiederkehrenden harmonischen Anteile, die sich aus den vorhandenen Hintergrundstimmen ergeben.

Das Weiße Rauschen wurde mit Hilfe von Adobe Audition 1.5 mit einer Bandbreite von 20 kHz generiert. Die verschiedenen Intensitätsstufen des Fahrgeräuschs und des Stimmengewirrs (70 und 80 dB) wurden realisiert, indem mit Hilfe eines Schallpegelmessers NTI XL295 der Lautstärkeregler am Laptop so eingestellt wurde, dass in ca. einem Zentimeter Abstand von der Kopfhörermembran die entsprechenden Pegel vorhanden waren. Anhand von Vorversuchen mit zwei normal hörenden Versuchspersonen96 und unter Berücksichtigung der in der Literatur häufig verwendeten Schallpegel wurde die Entscheidung getroffen, das Fahrgeräusch und das Stimmengewirr auf 70 und 80 dB einzustellen. 70 Dezibel empfanden die beiden Vpn als störend, 80 dB als unangenehm, noch höhere Pegel an der Grenze des Zumutbaren. Die Anwendung höherer Pegel wurde daher unterlassen, da die Vpn den Störschällen ja auch über einen längeren Zeitraum (s.o.) ausgesetzt werden sollten. Das Weiße Rauschen wurde mit einem Pegel von 60 dB realisiert, um die Messergebnisse der diesbezüglichen Sprechproben mit denen aus Meinerz (2010) vergleichbar zu machen und um diese gegebenenfalls statistisch ergänzen zu können.

3.3 Ablauf der Sprechprobenabnahme


Den Versuchspersonen waren die Hintergründe des Experiments und die Fragestellungen vorab nicht bekannt. Erst nach Abschluss der Sprechprobenabnahmen wurden sie dahingehend informiert. Jede Versuchsperson wurde zunächst in den Ablauf der Sprechprobenabnahme und in die zu leistende Aufgabe eingewiesen. Tabelle 4 zeigt die chronologische Abfolge und die Dauer (ca.) der einzelnen Abschnitte, die sich auf insgesamt ca. 25 Minuten Sprechzeit für die Sprechprobe insgesamt summieren.

Zwischen den einzelnen Schritten lag jeweils eine Pause von ca. 3060 Sekunden, in der die jeweilige Aufzeichnung gespeichert und die Materialien gewechselt wurden. Die Pause sollte den Versuchspersonen gleichzeitig zur kurzen Regeneration dienen. Inklusive der Pausen ergibt sich damit eine Gesamtdauer der Sprechprobenabnahme von ca. 30 Minuten. Um einen Gewöhnungseffekt an die Aufnahmesituation bzw. das vorzutragende Material zu vermeiden, wurde den Versuchspersonen für jede einzelne Aufnahmebedingung neues Bild- bzw. Lesematerial vorgelegt. Aufgrund der Erkenntnisse aus den Vorversuchen wurde der Ablauf der Probenabnahme in Bezug auf die Art des Störschalls so strukturiert, dass zunächst das Fahrgeräusch und dann das Stimmengewirr angewendet wurden. Die Vpn aus den Vorversuchen gaben an, dass sie das Stimmengewirr als belastender als das Fahrgeräusch empfanden. Daher wurde die Reihenfolge der Einspielung der Störgeräusche nach dem Prinzip der Steigerung festgelegt.

Tabelle 4 Dauer der Erhebung der einzelnen Sprechproben

SchritteZeitliche Dauer (ca.)
Einweisung der Versuchspersonen in den Ablauf und die zu verwendenden Materialien, Versorgung mit Mikrofon und Kopfhörern3 min.
Anlesen zur individuellen Anfangsaussteuerung der Aufnahme Aufzeichnung1 min.
Aufzeichnung Modalprobe: Lesen2 min.
Aufzeichnung Modalprobe: Spontan2 min.
Aufzeichnung Lombardprobe: Lesen (Fahr-geräusche: 70 dB)2 min.
Aufzeichnung Lombardprobe: Spontan (Fahr-geräusche: 70 dB)2 min.
Aufzeichnung Lombardprobe : Spontan (Fahr-geräusche: 80 dB)2 min.
Aufzeichnung Lombardprobe: Lesen (Fahr-geräusche: 80 dB)2 min.
Aufzeichnung Lombardprobe: Spontan (Stimmengewirr: 70 dB)2 min.
Aufzeichnung Lombardprobe: Lesen (Stimmengewirr: 70 dB)2 min.
Aufzeichnung Lombardprobe: Spontan (Stimmengewirr: 80 dB)2 min.
Aufzeichnung Lombardprobe: Lesen (Stimmengewirr: 80 dB)2...
Blick ins Buch

Weitere E-Books zum Thema: Literatur - Sprache - Literaturwissenschaft

Instrumente in Kunst und Wissenschaft

E-Book Instrumente in Kunst und Wissenschaft
Zur Architektonik kultureller Grenzen im 17. Jahrhundert Format: PDF

This volume presents a collection of original papers at the intersection of philosophy, the history of science, cultural and theatrical studies. Based on a series of case studies on the 17th…

Instrumente in Kunst und Wissenschaft

E-Book Instrumente in Kunst und Wissenschaft
Zur Architektonik kultureller Grenzen im 17. Jahrhundert Format: PDF

This volume presents a collection of original papers at the intersection of philosophy, the history of science, cultural and theatrical studies. Based on a series of case studies on the 17th…

Instrumente in Kunst und Wissenschaft

E-Book Instrumente in Kunst und Wissenschaft
Zur Architektonik kultureller Grenzen im 17. Jahrhundert Format: PDF

This volume presents a collection of original papers at the intersection of philosophy, the history of science, cultural and theatrical studies. Based on a series of case studies on the 17th…

Das 18. Jahrhundert

E-Book Das 18. Jahrhundert
Zeitalter der Aufklärung Format: PDF

Akademie Studienbücher - Literaturwissenschaft - Diskussion von Epochenbegriff und Epochengrenzen - Autor, Markt und Publikum: Strukturwandel der literarischen Öffentlichkeit - Die…

Weitere Zeitschriften

ARCH+.

ARCH+.

ARCH+ ist eine unabhängige, konzeptuelle Zeitschrift für Architektur und Urbanismus. Der Name ist zugleich Programm: mehr als Architektur. Jedes vierteljährlich erscheinende Heft beleuchtet ...

Ärzte Zeitung

Ärzte Zeitung

Zielgruppe:  Niedergelassene Allgemeinmediziner, Praktiker und Internisten. Charakteristik:  Die Ärzte Zeitung liefert 3 x pro Woche bundesweit an niedergelassene Mediziner ...

aufstieg

aufstieg

Zeitschrift der NaturFreunde in Württemberg Die Natur ist unser Lebensraum: Ort für Erholung und Bewegung, zum Erleben und Forschen; sie ist ein schützenswertes Gut. Wir sind aktiv in der Natur ...

crescendo

crescendo

Die Zeitschrift für Blas- und Spielleutemusik in NRW - Informationen aus dem Volksmusikerbund NRW - Berichte aus 23 Kreisverbänden mit über 1000 Blasorchestern, Spielmanns- und Fanfarenzügen - ...

DHS

DHS

Die Flugzeuge der NVA Neben unser F-40 Reihe, soll mit der DHS die Geschichte der "anderen" deutschen Luftwaffe, den Luftstreitkräften der Nationalen Volksarmee (NVA-LSK) der ehemaligen DDR ...

ea evangelische aspekte

ea evangelische aspekte

evangelische Beiträge zum Leben in Kirche und Gesellschaft Die Evangelische Akademikerschaft in Deutschland ist Herausgeberin der Zeitschrift evangelische aspekte Sie erscheint viermal im Jahr. In ...