Messtechnik: Terz-Analyzer mit Pseudo Random Rauschsignalen | One-Third Octave Analyzer

Terz-Analyzer
mit Rosa Rauschen

Druckfassung

von Michael Gaedtke

Letzte Änderungen vom 18. Juni 2009

Wenn es um größtmögliche Genauigkeit bei akustischen oder elektrischen Messungen geht, dann ist meist eine Analyse mit Gleit- oder Schritt-Sinussignalen angesagt. Wird die Signalfrequenz kontinuierlich verändert, dass spricht man von Gleit- oder Sweep-Signalen; wird die Signalfrequenz schrittweise erhöht, dann spricht man von Schritt- oder Step-Signalen. Mit solchen Anregungssignalen lässt sich im Frequenzbereich eine fast beliebig hohe Auflösung erreichen. Außerdem bieten sie den Vorteil, dass das untersuchte System im eingeschwungenen Zustand gemessen wird.

Leider haben Sweep- und Step-Messungen auch den Nachteil, dass der Messvorgang recht lange dauert, weil immer nur das Systemverhalten bei einer Frequenz gemessen wird und das Messsignal nur mit einer bestimmten Geschwindigkeit verändert wird. Manchmal ist es praktisch, sofort über Messergebnisse verfügen zu können - zum Beispiel, wenn man beim Soundcheck einer Beschallungsanlage in "real time" überprüfen will, welchen Einfluß Equalizereinstellungen und Boxenausrichtung haben. In solchen Fällen ist man mit einer schnellen Messung, die die interessierenden Frequenzen zeitgleich erfasst, besser bedient als mit höchster Auflösung. Dabei sollte allerdings das Messergebnis dem Höreindruck so gut wie möglich entsprechen.

Für die gleichzeitige Messung aller interessierenden Frequenzen braucht man ein Anregungssignal, das alle diese Frequenzen enthält. In Anlehnung an das Licht spricht man von einem weißen Spektrum, wenn die Frequenzen mit gleicher Energie vertreten sind. Ein Impuls ist ein solches Signal, hat aber wegen seiner extrem kurzen Dauer den Nachteil, nur ein sehr schlechtes Signal-Rausch-Verhältnis zu bieten - für den rauen PA- und Studio-Alltag ist das nichts. Rauschsignale, die innerhalb einer festgelegten Bandbreite ebenfalls alle Frequenzen enthalten, sind in dieser Beziehung erheblich besser und werden schon seit langem für akustische Messungen eingesetzt. Weisses Rauschen mit einem ausgeglichenen Spektrum (alle Frequenzen gleich laut, d.h. konstate Energie pro Hertz) wird häufig für elektronische Messungen eingesetzt, hat in der Akustik aber eine Reihe von Nachteilen: Das menschliche Gehör "funktioniert" weitgehend logarithmisch, die Frequenzen gehörter Töne werden in der Cochlea im Innenohr (oderhalb von 500 Hz) logarithmisch auf das Corti-Organ abgebildet (Tonologie) und in Nervenimpulse umgesetzt. Töne einer bestimmten Frequenz versetzen einen eng begrenzten Abschnitt der rund 33 Millimeter langen Basilarmembran in resonante Schwingungen. So wird die Frequenzinformation in eine Ortsinformation umgewandelt. Die Position einer stimulierten Haarzelle in der Cochlea enthält die Information über die Schallfrequenz. Es ist daher kein Wunder, dass unser Verstand mit den üblichen logarithmischen Frequenzdiagrammen am besten zu recht kommt.

Das hörbare Frequenzspektrum wird dazu nicht in gleichbreite Abschnitte eingeteilt, die jeweils die gleiche Zahl von Frequenzen enthalten (z.B. 1000 bis 2000, 2000 bis 3000, 3000 bis 4000 Hz usw.), sondern in Abschnitte mit gleichem Frequenzverhältnis von oberer zu unterer Grenzfrequenz (z.B. 200 zu 100, 400 zu 200, 800 zu 400 und auch 20000 zu 10000 Hz). Bei einem Frequenzverhältnis von 2 spricht man von einer Oktave. Das hörbare Spektrum teilt sich in 11 Oktaven ein (die erste Oktav-Mittenfrequenz liegt bei 16 Hz, die letzte bei 16000 Hz). Für eine Abschätzung, wie ein Lautsprecher oder eine Anlage klingt, ist dieses Raster zu grob. Üblich ist es, die Oktaven nochmals in jeweils drei Abschnitte zu unterteilen, die Terzen genannt werden. Das menschliche Gehör ist offenbar in der Lage, Lautstärkeunterschiede ungefähr mit Terzbreite auflösen zu können, deshalb sind Terzmessungen ein Hilfsmittel, dass mit dem Höreindruck gut korreliert und weit verbreitet. Hinzu kommt, dass man Terzanalysatoren auch in der finsteren computerlosen Vergangenheit relativ einfach mit analogen Bandpassfiltern und Signalgleichrichtern aufbauen konnte. Als Anzeige kam zum Beispiel eine LED-Matrix zum Einsatz.

Wichtig ist, dass alle Frequenzbänder eine konstante relative Bandbreite Δf/f haben und mit gleichem Abstand (äquidistant) auf einer logarithmischen Frequenz-Skala liegen. Es wird ein Rauschsignal benötigt, das für alle Terzkanäle (unsere gedachten Bandpassfilter) die gleiche Ausgangsleistung liefert. Bei einem weissen Rauschen ist das erkennbar nicht der Fall. Wir hatten bereits gesehen, dass die Definition des weissen Rauschens bedeutet, dass die Energie pro Hertz über die gesamte Bandbreite konstant ist. Da eine Terz bei 2000 Hz zehnmal so breit ist wie bei 200 Hz enthält sie auch zehnmal so viel Energie. Die Rauschleistung in den einzelnen Terzen nimmt über der Frequenz zu - der Frequenzgang steigt mit +3 dB pro Oktave an. Diesen Anstieg müsste man aufwändig kompensieren; das ist daher technisch ungünstig.

Weißes Rauschen wirft wegen der ansteigenden Leistung bei akustischen Messungen auch noch ein anderes Problem auf. Hochtönern werden bei Messungen mit weißen Rauschen mit der Frequenz ansteigende Leistungen zugeführt, was schnell zu einer Überlastung führen kann. Außerdem entspricht diese spektrale Energieverteilung nicht den durchschnittlichen Spektren von Musik und Sprache, bei denen die Energie zu höheren Frequenzen abfällt. Bei Messungen mit weißem Rauschen müsste man sehr vorsichtig aussteuern, um die Hochtöner zu schützen, denn 90 Prozent der gesamten Energie fällt im Hochtonbereich (2 bis 20 kHz) an, nur 1 Prozent im Bassbereich (0 bis 200 Hz). Da gerade im Bereich tiefer Frequenzen die lautesten Störgeräusche auftreten (Verkehrslärm, Zugluft, Trittschall), wäre mit einer solchen Messung unter "Feldbedingungen" kaum ein akzeptabler Signal-Rausch-Abstand zu erzielen.

Diese Probleme lassen sich umgehen, wenn man ein Signal einsetzt, dessen Leistung gerade mit -3 dB pro Oktave abfällt. Ein solches Signal liefert bei einer Terzanalyse ohne umständliche Kompensationsmaßnahmen einen glatten Frequenzgang, denn der Abfall wird durch die zunehmende absolute Bandbreite der Terzen genau ausgeglichen. Dieses Rauschen wird - wieder in Anlehnung an die Optik - als rosa Rauschen bezeichnet, weil es aus weißem Rauschen mit einer Verstärkung der tieffrequenten Anteile entsteht. Licht wirkt rot, wenn in einem ursprünglich weißen Spektrum die langwelligen, tieffrequenten Anteile stärker betont werden. Wir assoziieren dass mit warm und gemütlich. Werden die kurzwelligen, hochfrequenten Anteile betont, entsteht „kaltes“, blaues Licht. Die Leistung des rosa Rauschens- man sieht schon: bei Rauschsignalen muss man immer in Leistungen denken - fällt mit dem Kehrwert der Frequenz ab. Rosa Rauschen oder Pink Noise wird daher auch als 1/f-Rauschen bezeichnet. Mit diesem Signal wird auch der Bassbereich ausreichend für einen guten Signal-Rausch-Abstand ausgesteuert.

Ein Rauschsignal entsteht durch einen Zufallsprozeß wie zum Beispiel der thermischen Elektronenbewegung in einem Leiter, dem Stromrauschen in einem Transistor oder in einer Zenerdiode, die man auch als Rauschquelle für analoge Rauschgeneratoren verwendet. In der digitalen Signalverarbeitung (Digital Signal Processing DSP) kann man einen solchen Prozeß mit Hilfe eines Zufallszahlengenerators nachahmen. Um aus einem weißen Rauschen ein Signal einer bestimmten Farbe zu bekommen, wird das weiße Signal gefiltert. Bei analogen Rauschgeneratoren werden dazu meist RC-Filter eingesetzt, wobei die Erzeugung eines gleichmäßig mit -3 dB/Oktave abfallenden Frequenzgangs nicht trivial ist, denn bereits ein einzelner RC-Tiefpass hat eine Steilheit von -6 dB/Oktave. Der gewünschte Frequenzgang entsteht durch Überlagerung von gestaffelten RC-Spannungsteilern.

Unser zufälliges Rauschsignal hat noch einen anderen Pferdefuß, der seine Verwendbarkeit für schnelle Messungen sehr einschränkt: Das Signal ist zufällig – versteht sich. Das bedeutet, dass man zwar sicher sein kann, dass alle Frequenzbereiche auf Dauer mit gleicher Energie auftreten - aber eben nur auf Dauer. Um einen aussagefähigen Frequenzgang zu erhalten, müssen Messungen über eine ausreichend lange Zeit gemittelt werden. Ohne diese Mittelung zappelt das Messergebnis unbrauchbar auf dem Diagramm herum. Solche langen Mittelungszeiten widersprechen aber dem Interesse an einem schnellen Messverfahren.

Zur Lösung dieses Problems wurde eine andere Art Rauschen erdacht, das zwar auch alle Frequenzen enthält, bei dem man aber sicher sein kann, dass alle Frequenzen mit gleicher Energie innerhalb eines bestimmten  Zeitabschnitts, einer Periode, auftreten. Das ist kein echt zufälliges oder stochastisches, sondern ein pseudo-zufälliges Rauschen, ein Pseudo Random Noise, das man bei genauem Hinhören an seinem periodischen "tscheck-tscheck-tscheck"-Geräusch auch klanglich vom echten Random Noise unterscheiden kann, bei dem keine zeitlich wiederkehrende "Melodie" zu erkennen sein sollte. Wenn man es ganz exakt bezeichnen will, dann bezieht man die Eigenschaft der zeitlichen Periodizität auch noch in den Namen ein und nennt das Signal Pseudo Random Periodical Noise. Im Idealfall hat man bei diesem Signal bereits nach einem Durchgang das endgültige Ergebnis. Mit einer Mittelung über mehrere Perioden lässt sich allerdings der Einfluß von Schmutzeffekten wie zum Beispiel Nebengeräuschen reduzieren.

Solche Signale lassen sich erst mit dem Computer effizient erzeugen. MLS-Sequenzen, wie sie seit rund 20 Jahren für Akustikmessungen eingesetzt werden, stellen ein Pseudo Random Noise-Signal dar. Wenn man mit einem solchen Signal als Anregung arbeitet und bei der Messung immer genau eine volle Periode (oder ein ganzzahliges Vielfaches) des Rauschsignals auswertet, dann hat man theoretisch bereits nach zwei Perioden, praktisch jedenfalls nach sehr wenigen Mittelungen ein feststehendes Ergebnis. Solche Pseudo-Zufalls-Rauschsignale sind für die Terzanalyse (und übrigens auch für viele andere Messaufgaben) ideal geeignet.

Wie erzeugt man ein solches Signal? Man bedient sich der Fourier-Synthese. Ende des 18. Jahrhunderts gelang dem französischen Mathematiker Jean Baptiste Joseph Fourier der Nachweis, dass sich jede beliebige periodische Funktion (bzw. jedes beliebige periodische Signal) aus einer Summe charakteristischer Sinussignale und Cosinusisignale zusammen setzen lässt; je komplizierter die Signalform, um so mehr Sinus- und Cosinussignale müssen aufgeboten werden, um die Funktion genau reproduzieren zu können - theoretisch unendlich viele. Mit den Cosinussignalen wird die Phase des Signals eingestellt. Das war die Geburtsstunde der Fourier-Analyse, die heute zum Standard-Handwerkszeug der DSP und Messtechnik gehört und mit der sich ermitteln lässt, welche einzelnen Frequenzen in einem komplexen Signal (z.B. Messsignal und Verzerrungsprodukte) stecken. Wir nutzen hier die umgekehrte Operation, die Fourier-Synthese, denn wir wollen ja ein Signal herstellen.

Die Diskrete Fourier Transformation - egal, ob Fast oder nicht - wandelt ein Zeitsignal in das zugehörigen Frequenzspektrum um. Die Inverse Fourier Transformation mit ihrer schnellen Variante IFFT leistet genau die Umkehrfunktion: sie wandelt ein vorgegebenes Spektrum in das entsprechende Zeitsignal um. Würde man sich zum Beispiel ein leeres Spektrum-Array mit 32768 Bins (bei der FFT werden immer Zweierpotenzen als Blocklänge verwendet) erzeugen, das Bin mit der Nummer

auf den Wert 32767 setzen, alle anderen Werte auf 0 gesetzt lassen und für dieses Spektrum eine IFFT rechnen, dann würde man einen Signal-Vektor im Zeitbereich erhalten, der beim Abspielen mit der Samplerate 48000 Hz den Kammerton a hören lässt - vorausgesetzt, es ist eine Soundkarte angeschlossen.

Weil die so erzeugten Signale aus einer bestimmten Zahl von Sinusschwingungen zusammengesetzt werden, spricht man auch von Multisinus-Signalen (Multisine). Ich finde diese Bezeichnung nur dann angebracht, wenn nicht alle verfügbaren Frequenzen im Spektrum "gesetzt" werden, sondern nur einige gezielt errechnete. Wenn man hingegen alle Frequenz-Bins mit Werten füllt, dann ergibt sich ein Rauschsignal (oder, abhängig von der gesetzten Phase, ein Impuls). Natürlich ist auch dieses Rauschen aus Sinussignalen zusammengesetzt - und von daher ein Multisinus. Andererseits belegt Fourier, dass jedes Signal letztlich ein Multisinus ist. Multisinus-Signale können zudem auf sehr einfache Art - und übrigens ziemlich steilflankig - bandbegrenzt werden. Das kann man zum Beispiel nutzen, um gezielt Signale zum gefahrlosen Testen von Hochtönern zu generieren.

Wenn man den Im-Raum-Frequenzgang einer Stereo- oder PA-Anlage am Hörplatz ermitteln will, dann sollten beide Stereolautsprecher angesteuert werden. Das kann zum Beispiel sinnvoll sein, um die optimale Einstellung von Equalizern oder Klangreglern zu finden. Im Studio benutzt man für solche Messungen zwei von einander unabhängige Rauschgeneratoren, damit die beiden Stereosignale nicht miteinander korreliert – d.h. in Betrag und Phase gleich – sind; wäre das der Fall, dann könnte es bei bestimmten Frequenzen und bestimmten Entfernungen zum Meßmikrofon zu Auslöschungen kommen. Um solche Messungen auch mit dem hier vorgestellten Programm vornehmen zu können, werden auf dem linken und rechten Kanal zwei verschiedene Rauschsignale ausgegeben. Da ein Pseudorauschen verwendet wird, kommen dafür keine wirklich unkorrelierten Signale in Frage. Statt dessen ist das zweite Signal gegenüber dem ersten um eine halbe Periode phasenverschoben. Es ist deshalb korrekter, statt von einem unkorrelierten von einen transponierten Rauschen zu sprechen.

Die Methode, den Frequenzgang einer Übertragungsanlage mit Rosa Rauschen am Hörplatz zu messen, geht übrigens auf den Brüel&Kjaer-Entwickler Henning Møller zurück [Henning Møller: Hi-Fi  Tests with 1/3 ocatave, pink weighted, random noise, Paper A-5 of the 47th AES Convention 1974-02-28/29 Copenhagen/Denmark]. Um die Akustik guter Aufführungssäle nachzuahmen, sollte der Frequenzgang am Hörplatz bei tieferen Frequenzen (unter 1000 Hz) um rund 3 dB angehoben sein, bei höheren Frequenzen sollte er sanft um rund 3 dB abfallen. Bei ansonsten weitgehend linearem Verhalten der Lautsprecher kann ein solcher Frequenzgang mit üblichen Klangreglern eingestellt werden. Auf die Møller-Methode bin ich übrigens durch einen Beitrag von Claudio Negro für AudioXpress aufmerksam geworden.

Die Analyse beginnt mit der Speicherung des vom Mikrofon aufgenommenen Signals im Vektor (Array) InSignal. In jedem Messdurchgang werden 2^15 = 32768 Samples abgespeichert; eine Potenz von 2 wird deshalb gewählt, weil die FFT mit solchen Zweierpotenzen besonders effektiv arbeitet. Die Auswertungszeit entspricht genau einer Signalperiode des periodischen Rauschens, so dass alle Spektralanteile in jedem Messzyklus enthalten sind. Das ist wichtig, um die Vorteile des periodischen Pseudorauschens nutzen zu können.

Auch bei der Analyse des Rauschens muss mit Leistungswerten gerechnet werden. Für die Auswertung genügt deshalb eine einfache FFT, die die spektralen Amplituden liefert, noch nicht aus. Wir brauchen ein Leistungsspektrum (Power Spectrum), das entsteht, wenn die Magnitude jeder Frequenzkomponente quadriert wird, denn uns interessiert, welche Energie das gemessene Signal in einer bestimmten Terz des Spektrums aufweist.

Durch die besondere Eigenschaft des rosa Rauschens, in gleichen Intervallen die gleiche Energie zu enthalten, ergibt sich durch diese Aufsummierung ein linearer Frequenzgang. Am oberen Frequenzende, wo die Bins wegen des abfallenden Signals nur geringe Leistungen enthalten, werden entsprechend mehr Bins aufsummiert als am unteren Ende, wo wenige Bins relativ hohe Leistungspegel haben.

Für die übliche Darstellung als dB-Werte müssen die Ergebnisse normiert und leistungsbezogen in dB-Werte umgerechnet werden. Wenn es nur auf die Abweichungen von einem ideal ausgeglichenen Frequenzgang ankommt, ist die Normierung auf einen Absolutwert verzichtbar.

Der Screenshot zeigt eine Umsetzung der Terz-Analyse in einem kleinen Beispielprogramm. Das Programm ist bewußt simpel gehalten und nur mit den nötigsten Bedienelementen ausgestattet. Die Idee war, ohne großen Aufwand einen schnellen Überblick über den Frequenzgang eines Sound-Systems zu erhalten, ohne das man sich auf ein kompliziertes Messprogramm konzentrieren muss. Die Umsetzung erfolgte in Pascal/Delphi.

Einige Voraussetzungen müssen für einen erfolgreichen Start erfüllt sein:

Die Soundkarte muss mit einer Samplerate von 48 kHz im Vollduplex-Modus arbeiten können. Der Computer muss mit Win32 ausgestattet sein und sollte wegen der umfangreichen online-Berechnungen nicht zu langsam sein. Mein Rechner ist vier Jahre alt, mit 2,3 GHz getaktet und hat keine Probleme.

Das Programm liegt als exe-Datei vor und braucht nicht installiert zu werden. Es genügt, das Programm auf die eigene Festplatte zu kopieren und zu starten. (Wichtiger Hinweis: Installation und Betrieb der Software erfolgen auf eigene Gefahr. Der Autor übernimmt keine Gewährleistung für eventuell aufgetretene Schäden am Computer oder Datenverluste. Bekannt sind mir allerdings auch keine Probleme.)

Der Ausgang der Soundkarte wird am Play Control Feld des Mixers auf Wave gestellt. Die übrigen Ausgangskanäle – insbesondere Mikrophone und LineIn werden durch gesetzte Häkchen abgeschaltet. Der Wave-Slider wird voll aufgezogen. Die Lautstärke wird am Eingangspoti des angeschlossenen Verstärkers geregelt. (Vorsicht bei der ersten Inbetriebnahme: zuerst leise drehen!)

Der Eingang der Soundkarte wird am Wave In Feld des Mixers auf LineIn gesetzt. Dazu muss das entsprechende Häkchen gesetzt werden. Der Slider sollte voll aufgezogen werden. Eine Empfindlichkeitsanpassung erfolgt am zweckmäßigsten am Mikrofonvorverstärker.

Die Soundkarte stellt das Stimulus-Signal am linken LineOut-Ausgang zur Verfügung. Die Lautstärke des rosa Rauschens kann mit einem Volume-Slider eingestellt werden.

Das Eingangssignal (zum Beispiel vom Mikrofon) wird an den linken LineIn-Eingang angeschlossen.

Der Messvorgang wird mit der Start Taste begonnen und kontinuierlich fortgesetzt, bis die Stop Taste gedrückt wird. Mit der Reset Taste kann die Averaging-Funktion zurückgesetzt werden.

Zwei Aussteuerungsanzeigen zeigen an, mit welcher Signalstärke Mess- und Referenz-Signale ankommen. Für eine solide Messung sollte der Messeingangs-Pegel (links) im Bereich um -10 dB liegen. Entsprechende Einstellungen können am Mikrofonvorverstärker oder am Mixer vorgenommen werden.

Der Terz-Analyzer bietet die Möglichkeit, den rechten Kanal der Soundkarte im sogenannten Loopback-Betrieb als Referenzkanal zu verwenden. Damit misst sich die Soundkarte kontinuierlich selbst, stellt Abweichungen von einem geraden Frequenzgang fest und korrigiert die Messung des linken Kanals entsprechend. Weitgehende Gleichheit zwischen linkem und rechtem Kanal vorausgesetzt können so alle Fehler der Soundkarte kompensiert werden. Die gröbsten Fehler werden durch das notwendige Anti-Aliasing-Filter im oberen Frequenzbereich und mitunter durch zu kleine Koppelkondensatoren im unteren Frequenzbereich verursacht. Die Fehler von Hifi-Endstufen und Mikrofon-Vorverstärkern sind demgegenüber (hoffentlich) zu vernachlässigen.

Mit zwei Radio-Buttons oberhalb und unterhalb der Anzeige kann man zwischen den zwei Eingangskanälen umschalten. Im nebenstehenden Bild ist der Frequenzgang des rechten Kanals zu sehen, der als Referenz genutzt wird. Bei abgeschalteter Reference Funktion sind (geringe) Frequenzgangsfehler der Soundkarte zu erkennen.

Wird der Reference Modus zugeschaltet, so verschwinden die geringen Abweichungen völlig.

Für den Loopback-Betrieb müssen rechter LineOut und rechter LineIn lediglich über ein kurzes Audiokabel miteinander verbunden werden. Das Programm arbeitet mit Rosa Rauschen und zeigt terzweise den Energiegehalt. Allerdings wird wie beschrieben kein echtes, stochastisches Rauschen verwendet, sondern ein periodisches pseudo-zufälliges Signal, dass über eine IFFT mit einem rosa Spektrum erzeugt wird. Da in jeder Periode des Rauschens alle Frequenzen vorkommen, ergibt sich bereits nach sehr wenigen Mittelungen eine sauber stehende Anzeige. Im Averaging Modus wird fortlaufend über die letzten 30 Perioden (das entspricht einer Mittelungszeit von rund 20 Sekunden) gemittelt.

Die Anzeige zeigt das Leistungsdichtespektrum (Mag^2) und erfolgt in dB mit Bezug auf die Aussteuerungsgrenze der Soundkarte (Full-Scale = 16 Bit).

Mit dem Slider links vom Diagramm kann man die relative Höhe der Terzbalken verschieben.

Durch einem Klick auf des Save-Button kann der aktuell angezeigte Frequenzgang als Grafik gespeichert werden. Ein Dateiauswahlfenster öffnet sich, in dem Speicherort und Dateiname gewählt werden müssen. Die Grafik wird im Jpeg-Format gespeichert.

Viel Erfolg bei den eigenen Messungen!

 

Credits: Mein herzlicher Dank gebührt Thomas Ahlersmeyer, der bei der Umsetzung dieses Softwareprojektes sehr geholfen hat. Sein unermüdlicher Einsatz als Beta-Tester, Stichwort- und Tippgeber war Gold wert. Ein Besuch auf Thomas’ Homepage [http://www.picosound.de] lohnt sich im Übrigen in jedem Fall.

Top

 

 

Download des TerzAnalyzer-Programms [zip-Datei]

 

Download dieses Textes als PDF-Datei

 

© Michael Gaedtke, Im Püllenkamp 2, D-41462 Neuss, Germany – michael@gaedtke.name