top of page
Image by Paul Esch-Laurent

Background

Schall, Akustik & das menschliche Gehör

Soundscape - comevis
00:0000:00

Wissenswertes und Grundlegendes über Akustik und unser Gehör

Kapitel 1

Was ist Luftschall?

Kapitel 1

Grundlegend versetzt schwingende (also sich um einen Ruhepunkt wiederholt bewegende) Materie ihr Umgebungsmedium (z.B. Luft) in Bewegung. Das kann beispielsweise durch eine angeschlagene Gitarrensaite, die menschlichen Stimmbänder oder auch eine Lautsprechermembran geschehen. Für die Schwingung, also die Auslenkung aus der Ruhelage, und damit die Schallerzeugung muss Energie aufgewendet werden. Wenn sich die Schwingungen über das Umgebungsmedium bis zu unserem Trommelfell ausbreiten und dieses ebenfalls in Schwingung versetzt, wird Schall für uns hörbar. Ein Hören im Vakuum, also in einem Raum, in dem es kein Umgebungsmedium gibt, ist daher nicht möglich.

Eine sich ausbreitende Schwingung kommt dadurch zustande, dass ein Materien-Teilchen (z.B. ein Luftmolekül) ein benachbartes in Schwingung versetzt. Obwohl diese Bewegung eines einzelnen Moleküls nur minimal ist, ergibt sich eine sehr schnelle Bewegungsfortpflanzung der Schwingung und man spricht von einer (Schall-)Welle. Die Schallgeschwindigkeit, also die Ausbreitungsgeschwindigkeit, beträgt in der Luft 344 m/s.

Bei Wellen unterscheidet man zwischen Longitudinal- und Transversalwellen. Während Longitudinalwellen (Längswellen) in ihrer Ausbreitungsrichtung schwingen (z.B. Luftschall), schwingen Transversalwellen (Querwellen) senkrecht zu ihrer Ausbreitungsrichtung, wie z.B. beim Schwingen eines Seils. In Flüssigkeiten und Gasen breitet sich Schall lediglich in Form von Longitudinalwellen aus. In Festkörpern kann sich Schall in Form von Longitudinalwellen und Transversalwellen ausbreiten. Wenn man sich den akustischen Prozess einer Gitarre genauer anschaut, wird klar, wie sich die für die Übertragung von Luftschall relevanten Longitudinalwellen im Raum verhalten: Wird eine Saite angeschlagen, versetzt der schwingende Körper die ihn umgebenden Luftmoleküle in Bewegung. Diese setzen wiederum ihre benachbarten Moleküle in Bewegung und es kommt zu Luftmolekülverdichtungen (Überdruck) sowie -verdünnungen (Unterdruck). Schall ist also nichts anderes als eine sich ausbreitende, dem atmosphärischen Luftdruck überlagerte Druckschwankung, oder in anderen Worten eine mechanische, sich im elastischen Medium ausbreitende Schwingung (Auslenkung aus der Ruhelage).

wellen.png

Verschiedene Schallparameter lösen beim Menschen spezifische Empfindungen aus. Die Amplitude ist verantwortlich für die wahrgenommene Lautstärke des Schallereignisses. Die Frequenz gibt die Höhe eines Tons wieder. Der Mensch kann etwa einen Bereich zwischen 20 Hz und 20000 Hz hören. Die Frequenzspektrum definiert die Klangfarbe, denn jedes Schallereignis ist eine Überlagerung vieler Sinusschwingungen unterschiedlicher Frequenz, Phase und Amplitude. Mehr dazu in Kapitel 2.

Kapitel 2

Überlagerung von Schwingungen

Kapitel 2

Überlagern sich mehrere Schwingungen, so kann es zu akustischen Phänomenen kommen, z.B. zur Interferenz oder Schwebung.

Interferenzen

Interferenzentreten bei der Überlagerung von Schwingungen gleicher Frequenz auf. Hierbei kommt es auf die Phasenlage der beiden Signale an, sodass zwischen der konstruktiven und der destruktiven Interferenz zu unterscheiden ist: Die konstruktive Interferenz ergibt sich dann, wenn sich zwei Signale von gleicher Frequenz phasengleich überlagern. Man spricht dann auch von einem Phasenunterschied von 0 Grad. Weil sich bei einer Überlagerung von zwei Signalen die Auslenkungswerte addieren, kommt es bei der Phasengleichheit von zwei Signalen gleicher Amplitude zu einer Welle mit verdoppelter Schalldruckamplitude. Bei der Überlagerung zweier gegenphasiger Wellen (Phasenunterschied 180 Grad) kommt es bei gleicher Frequenz und Amplitude zur vollständigen Auslöschung des Signals, sodass man in diesem Fall von einer destruktiven Interferenz spricht.

interferenzen.png

Schwebungen

 

Schwebungen treten in Erscheinung, wenn sich mehrere Schallereignisse nur minimal in ihrer Frequenz unterscheiden. Dadurch verschieben sich die Wellen kontinuierlich zueinander und es kommt zu einem periodischen Wechsel zwischen konstruktiver und destruktiver Interferenz. Es gibt also Momente, in denen sich die Signale „in Phase“ verstärken oder „gegenphasig“ auslöschen. Wir nehmen dies als Lautstärkenschwankung wahr. Wenn sich also ein 400Hz-Signal und ein 405Hz-Signal überlagern, beträgt die Schwebungsfrequenz 5 Hz.

Schwebung.png

Eine praktische Anwendung findet die Schwebung beim Stimmen einer Gitarre. Hier kann man die Stimmung der Saiten vergleichen: Wenn man beide Saiten im verstimmten Zustand anschlägt ist die Schwebungsfrequenz hoch, man hört eine schnelle Lautstärkenschwankung. Je näher sich beim Stimmen der Saiten deren Stimmungen angleichen, desto langsamer werden die Schwankungen, da die Schwebungsfrequenz abnimmt.

Komplexe Schwingungen

 

Komplexe Schwingungen entstehen durch die Überlagerung von Wellen unterschiedlicher Frequenz, die somit keinen Phasenbezug zueinander aufweisen und als inkoheränt oder nicht-korrelierend bezeichnet werden (anders als Interferenzen und Schwebungen, die Wellen betreffen, die einen konkreten Phasenbezug zueinander haben). Bei Addierung der einzelnen Auslenkungen kommt es nicht zu Interferenzen, sondern zu einer komplexen Wellenform. Weil jedes Schallereignis eine Überlagerung vieler Sinusschwingungen unterschiedlicher Frequenz, Phase und Amplitude ist, kann eine Schwingung in ihre einzelnen Sinusschwingungen zerlegt werden. Dies geschieht mit der diskreten Fourier-Transformation, die als Ergebnis Aufschluss über das Frequenzspektrum und damit über die Klangfarbe gibt. Als einfache Beispiele lassen sich hier schrille oder scharfe Klangfarben nennen, die also viele hohe Frequenzen aufweisen, oder eine dumpfe Klangfarbe, die auf wenige hohe Frequenzen hinweist.

 

Unterschied zwischen Tonhöhe und Klangfarbe

Nicht nur bei einer Sinusschwingung, sondern auch bei einer sich wiederholenden, also periodisch auftretenden komplexen Schwingung gibt die Periodendauer die Zeit an, die die Schwingung benötigt, bevor sie sich wiederholt, und der Kehrwert daraus ist die als Tonhöhe wahrgenommene Grundfrequenz der komplexen Schwingung. Die anderen Einzelfrequenzen bilden die Obertöne, die die Klangfarbe bestimmen. Bei einer nicht-periodischen Schwingung mit einer sehr unregelmäßigen Wellenform (z.B. ein Beckenschlag) kann es also vorkommen, dass keine Tonhöhe wahrnehmbar, sondern nur die durch die Oberfrequenzen entstehende Klangfarbe definierbar ist.

 

Unterschied zwischen Klang und Geräusch

Der Unterschied zwischen Klang und Geräusch liegt darin, dass ein Klang aus einer periodischen Schwingung besteht, sodass eine Grundfrequenz erfasst werden kann und ihm damit eine Tonhöhe zugeordnet werden kann. Die Frequenzen der einzelnen Sinusschwingungen sind bei einem Klang ganzzahlige Vielfache der Grundfrequenz - die Sinustöne bilden also eine harmonische Teiltonreihe. In der Praxis sind bei einem Klang die Sinusfrequenzen unterschiedlich stark ausgeprägt. Im Frequenzspektrum enthalten die Bereiche zwischen diesen harmonischen Teiltönen nicht selten geräuschartige Frequenzanteile mit kontinuierlichem Spektrum, z.B. Anschlaggeräusche eines Musikinstruments.

Im Gegensatz zu Klängen sind Geräusche nicht-periodische Schwingungen, denen mangels Grundfrequenz oft keine Tonhöhe zugeordnet werden kann. Die Schwingung besteht aus Frequenzen in einem kontinuierlichem Spektrum, zwischen denen kein mathematischer Zusammenhang besteht, sodass sich keine Teiltonreihe aus den einzelnen Frequenzen ergibt.

Kapitel 3

Schallausbreitung im Raum

Kapitel 3

Wie wir unsere Umgebung, also die Klänge, Geräuschen, Stimmen oder auch Musik, wahrnehmen, wird maßgeblich von den räumlichen Gegebenheiten beeinflusst. Schall kann sich im Raum nicht ungehindert ausbreiten, sondern wird an Wänden und anderen schallharten Hindernissen bzw. Objekten mehrfach reflektiert und verliert dabei an Lautstärke. Dem Direktschall folgen die sogenannten Early Reflexions, von denen es meistens sechs gibt, nämlich für jede Wand- bzw. Boden- oder Deckenfläche eine. Jede Reflexion ruft wiederum viele weitere Reflexionen hervor. Diese in ihrer Anzahl schnell zunehmenden, dichten Reflexionen bildet den Nachhall, der aufgrund ständiger Energieabsorptionen an Reflexionsflächen abnimmt bis er schließlich verstummt. Angegeben wird die Nachhallzeit oftmals als RT60-Wert (RT = Reverb Time), der die Zeit angibt, bis wann der Nachhall um 60dB abnimmt (meist bezogen auf eine Frequenz von 1000 Hz). Die Nachhallzeit kann zur bestmöglichen Genauigkeit gemessen oder, wenn dies nicht möglich ist, mithilfe von Formeln nach Eiring und Sabine berechnet werden.

In der Akustik wird zwischen Direktschall (Schall, der direkt von der Schallquelle abgestrahlt wird) und Diffusschall (Schall, der sich aus der Gesamtheit der Reflexionen ergibt) unterschieden. Im Freifeld kommt meist nur der Direktschall vor, während im Raum der Direktschall mit zunehmendem Abstand von der Schallquelle nach dem Abstandsgesetz abnimmt, während der Diffusschall überall ungefähr gleich laut ist. Je weiter wir also von einer Schallquelle im Raum entfernt sind, desto höher ist der Diffusschallanteil im Verhältnis zum Direktschall. Die Distanz, in der Direkt- und Diffusschall gleich laut sind, wird als Hallradius bezeichnet, der abhängig von der Frequenz ist.

Durch Reflexionsvorgänge kommt es im Raum zu verschiedenen Phänomenen. An Wänden kommt es bei Reflexionen aller Frequenzen zu einem Druckstau, der im Bassbereich am größten ist. Daher ist das Frequenzbild in Wandnähe meistens basslastig. Ein anderes Phänomen sind stehende Wellen, die üblicherweise zwischen zwei parallelen Wänden auftreten, wenn sich die Reflexion gleichphasig mit der einfallenden Schallwelle überlagert. Weil dabei ortsfeste Druckmaxima und -minima zustande kommen, können Töne an bestimmten Punkten im Raum nicht korrekt wahrgenommen oder gemessen werden. Dies ist vor allem bei tiefen Frequenzen problematisch, weil hier der räumliche Abstand zwischen Druckmaxima und Druckminima groß ist und der Schall lange nachklingt. Für hohe Frequenzen sind stehende Wellen hingegen unproblematisch. Ein drittes Phänomen ist das Flatterecho, das zwischen zwei parallelen, meist mindestens acht Meter voneinander entfernten Wänden entstehen kann, und dafür sorgt, dass wir hören können, wie der Schall mehrmals hin- und her reflektiert wird. Mit dem Kammfiltereffekt soll hier noch ein weiteres Phänomen Erwähnung finden, das bei der Schallausbreitung auftreten kann und daherrührt, dass es zwischen dem Direktsignal und seiner Reflexion zu einer Interferenz kommt, bei der manche Frequenzen ausgelöscht und andere verstärkt werden können.

Kapitel 4

Psychoakustik & Hörphysiologie

Kapitel 4

Das auditorische System

Das menschliche Ohr ist ein feinfühliger und empfindlicher Druckempfänger und kann in die Bereiche Außenohr, Mittelohr und Innenohr eingeteilt werden. Der Schall gelangt durch das Außenohr, also die Ohrmuschel und den äußeren Gehörgang zum Trommelfell, das das Außenohr vom Mittelohr trennt und aus Schutzgründen durch den äußeren Gehörgang in das innere des Schädels verlagert ist. Das Trommelfell ist eine dünne Membran aus faserigem Gewebe, die durch den Schalldruck in Schwingung versetzt wird. Im Mittelohr überträgt ein Hebelsystem aus den drei Gehörknöchelchen Hammer, Amboss und Steigbügel die Schwingung an das ovale Fenster und passt die Kraft des Schalldrucks an die Empfindlichkeit des Innenohrs an. Hier können der Hammer- und Steigbügelmuskel den Schalldruck ab ca. 70 bis 80 dB(SPL) um 6 bis 10 dB dämpfen. Um einen Druckausgleich zu ermöglichen, verbindet die Eustachische Röhre das Mittelohr mit der Mundhöhle. Im Innenohr befindet sich neben den Bodengängen (Gleichgewichtsorgan) die Gehörschnecke, ein schneckenförmiger Hohlraum im Felsbein, der aus drei mit Flüssigkeit gefüllten Kammern besteht: Vorhoftreppe, Schneckengang und Paukentreppe. Zwischen Schneckengang und Paukentreppe befindet sich die Basilarmembran, die das Corti-Organ trägt. Die darin befindlichen Haarzellen werden bei unterschiedlichen Frequenzen an unterschiedlichen Stellen besonders stark angeregt und in Resonanz versetzt. Das Ohr zerlegt hier sozusagen die komplexe Schwingung in unterschiedliche Einzelfrequenzen und überträgt diese Informationen über spezifische Hörnervfasern an das Gehirn.

 

Musik und Klang löst beim Menschen Emotionen aus, weckt Erinnerungen, regt uns an oder wirkt beruhigend zugunsten unseres allgemeinen Wohlbefindens. Was genau im Gehirn bei der klanglichen Rezeption passiert, wird schon lange wissenschaftlich untersucht. Nachdem der Hörnerv einen Schalleindruck zunächst an den Hirnstamm weitergeleitet hat, gelangt er von dort in den auditorischen Cortex. Doch er ist nicht der einzige Bereich, der bei der Schallwahrnehmung eine Rolle spielt: Die Involvierung eines der beiden Sprachzentren (Broca-Areal), motorischer und visueller Areale, des limbischen System zur Emotionsverarbeitung und des Belohnungssystems zeigt: Klang und Musik verbindet unsere Gehirnareale. Es kommt zur Ausschüttung von Endorphinen, also körpereigenen Glückshormonen, und des Neurotransmitters Dopamin, der im Gehirn von großer Bedeutung für das Belohnungssystem ist, sowie zu einer Abnahme des Stresshormons Cortisol. Gemeinsames Musizieren erhöht zudem die Ausschüttung des Bindungshormons Oxytocin. Neben diesen positiven chemischen Effekten haben Klang und Musik dank der Neuroplastizität auch strukturellen Einfluss auf unser Gehirn, denn auditive Reize sorgen für eine Neuverschaltung von Nervenzellen, sodass Hirnareale besser miteinander vernetzt sind, und regen die Ausprägung des Corpus Callosums, also der Verbindung zwischen den Hirnhälften, an.

 

Richtungshören

Damit sich der Mensch in seiner Umgebung zurechtfinden kann, kann er Schallquellen sehr genau orten. Das Richtungshören ist ein komplexer Vorgang, der sich aus der Analyse dreier Parameter zusammensetzt: interaurale Zeitdifferenzen, interaurale Schalldruckdifferenzen und die Klangfarbe.

Interaurale Zeitdifferenzen beschreiben zeitliche Unterschiede, wann ein Signal zuerst auf das eine Ohr und dann auf das andere trifft. Dafür vergleicht das Gehirn die Phase zwischen dem linken und dem rechten Ohr sowie die Hüllkurven der Schwingungen, also den Lautstärkenverlauf. Dieser Mechanismus alleine würde die Gefahr einer Fehlortung bergen, da man ein und derselben Zeitdifferenz immer zwei mögliche Winkel zuordnen kann (z.B. -45° und -135°). Eine vertikale Positionsortung ist nicht möglich – man kann also nicht unterscheiden, ob eine Schallquelle von oben oder von unten auf die Ohren treffen. Das Gehirn kann also nur einen zweideutigen horizontalen Winkel errechnen.

 

Interaurale Schalldruckdifferenzen werden vom Gehirn erkannt und können Aufschluss darüber geben, auf welches Ohr das Signal zuerst getroffen ist, weil dort ein erhöhter Schalldruck vorkommt. Bei Schallwellen von einer Frequenz ab 1,6 kHz werden Abschattungen relevant, die der Kopf erzeugt: Kommt ein Schallsignal von links, kann sich der Schall ab dieser Frequenz nicht mehr vollständig um den Kopf herumbeugen, sodass bei diesem seitlichen Einfall der Schalldruckunterschied deutlich wahrgenommen werden kann. Genauso wie bei der oben beschriebenen Analyse der interauralen Zeitdifferenzen ist über diese Methode nur eine links/recht-Unterscheidung möglich und es können keine sicheren Informationen über eine Schallherkunft von oben/unten bzw. vorne/hinten abgeleitet werden.

 

Der Klangfarben-Abgleich ist der wichtigste Mechanismus für die Ortung einer Schallquelle. Hier geht es -  anders als zuvor beschrieben - nicht um einen interauralen Vergleich der Schalleindrücke, sondern vielmehr um einen Abgleich der (monaural) erfassten Klangfarbe mit einem gelernten, im Gehirn abgespeicherten Korrelationsmuster. Durch diesen komplexen Vorgang ist auch eine Unterscheidung bezüglich oben/unten sowie vorne/hinten möglich. Die Form des menschlichen Kopfes, vor allem die der Ohrmuscheln, bewirkt Abschattungseffekte, Reflexionen und Resonanzen am Schädel und Außenoh und beeinflusst damit die Klangfarbe eines Schallsignals auf spezifische Art und Weise, je nachdem aus welcher Richtung der Schall eintrifft und das Trommelfell erreicht. Manche Frequenzen werden abgesenkt und andere verstärkt. Diese Filterwirkung des Kopfes wird durch die Head-Related Transfer Function (HRTF) beschrieben. Die spezifischen Klangfärbungen nehmen wir nicht bewusst wahr, sondern entnehmen ihnen relevante Richtungsinformationen. Dass diesem vergleichenden Vorgang ein Lernprozess vorausgehen muss, ist der Grund dafür, warum Kinder über ein schlechteres Richtungshören verfügen als Erwachsene. Nach dem Assoziationsmodell von Theile untergliedert sich der Analyseprozess der Schallrichtung anhand der Klangfarbe in zwei Stufen, die richtungsbestimmende Stufe (in der durch Musterabgleich der Einfallswinkel bestimmt wird) und der gestaltbildenden Stufe (in der nach der Inversion der HRTF die eigentliche Klangfarbe ermittelt wird).

 

Entfernungshören

 

Faktoren, die das Einschätzen der Entfernung einer Schallquelle ermöglichen, sind die Lautstärke, Klangfarbe (entfernungsbedingter Abfall von Frequenzen, Einfluss der Luftabsorption, …), das Pre-Delay (also der zeitliche Abstand zwischen Direktsignal und erster Reflexion), der Hall-Anteil und nicht zuletzt die Erfahrung, mit der alle Eindrücke abgeglichen werden.

 

Maskierungseffekt

Der Maskierungseffekt sorgt für akustische Verdeckung. Es gibt die spektrale Maskierung und die zeitliche Maskierung.

Bei der spektralen Maskierung können wir einen Ton nicht hören, wenn zeitgleich ein lauterer Ton im gleichen Frequenzbereich erklingt.

 

Hintergrund: Die Ruhehörschwelle ist derjenige Schalldruckpegel, bei dem das menschliche Gehör Geräusche gerade noch wahrnehmen kann. Dies ist frequenzabhängig: Für tiefe und sehr hohe Frequenzen liegt die Ruhehörschwelle hoch, während sie für mittlere Frequenzen relativ tief ist. Eine Ruhehörschwellenkurve zeigt also an, ab welchem Schalldruck eine bestimmte Frequenz für uns hörbar wird, wenn ansonsten Ruhe herrscht.

 

Wenn mehrere Schallereignisse aufeinandertreffen, setzt ein vorhandenes Ereignis die Empfindlichkeit für neu auftretende Schallereignisse herab. Es ergibt sich eine neue Hörschwelle, die abhängig ist von der Lautstärke und dem Frequenzspektrum des bestehenden, maskierenden Schallereignisses: Die Mithörschwelle. Liegt ein Schallsignal unterhalb dieser Mithörschwelle des Maskierers, so ist er aufgrund totaler Maskierung nicht hörbar. Zu einer partiellen Maskierung kommt es dann, wenn ein Schallsignal auf oder nur wenig oberhalb der Mithörschwelle liegt. Bei tiefen Frequenzen ist der Maskierungseffekt im Allgemeinen stärker als bei hohen Frequenzen.

 

Bei der zeitlichen Maskierung erklingt ein lauterer Ton nicht zeitgleich, sondern mit zeitlichem Versatz, entweder vorher oder nachher. Beim Premasking wird ein Ton maskiert, weil kurz nachher (maximal 20 ms) ein Ton erklingt, der einen höheren Schalldruckpegel hat. Grund hierfür ist, dass ein Schallsignal von höherer Amplitude vom Gehirn schneller verarbeitet wird als ein leises Signal. Beim Postmasking wird ein Ton maskiert, weil kurz vorher ein lauterer Ton erklungen ist. Dieser Effekt tritt bis zu 200 ms nach Ende des maskierenden Schallereignisses auf. Die zeitliche Maskierung ist wie die spektrale Maskierung frequenzabhängig.

 

Um Maskierungseffekten z.B. in der Musikproduktion entgegenzuwirken, setzt man Filter und Equalizer ein, um einzelne Frequenzbereiche zu reduzieren oder zu betonen und das Klangbild zu ordnen. Einen Beitrag leistet dazu auch die einfach Lautstärken- und Panoramaregelung. Das Ergebnis ist ein Klang, der aufgeräumt klingt und uns guttut. 

bottom of page