Zurück zum Menü

Einladung zum Vortrag

Zeitpunkt: Dienstag, 22. 4. 2008 18:30

Ort: Technische Universität Wien, Hörsaal HS5         Freihaus, Turm A (grün), 2. Stock         1040 Wien, Wiedner Hauptstraße 8-10

Vortragender: Dipl. Wi. Ing. Gunnar Heilmann         Gesellschaft zur Förderung angewandter Informatik, Berlin

Thema: Akustische Kamera

Eine neue Dimension: Ortsselektive Zeit – und Frequenzmessungen Die Akustische Kamera erweitert die Zeit -und Frequenzselektivität um die Komponente Ortsselektivität. Neben dem Verlauf des Schallsignals kann eine Sequenz von akustischen Fotos erzeugt werden - akustische Filme entstehen. Jetzt wird klar analysiert, wann wo welche Schallquellen aktiv sind. Im Bedarfsfall in extremer Zeitlupe, mit bis zu 192.000 Bildern/Sekunde. Schallwege sind erkennbar, Quellen und Reflexionen werden getrennt. Oft ergeben sich daraus völlig neue Erkenntnisse und Sichtweisen über die Entstehung von Schall. Auch die Analyse von bewegten Objekten ist möglich.

Die akustische Kamera erweitert bisherige Analyseverfahren: Natürlich beinhaltet die Akustische Kamera auch herkömmliche Analyseverfahren, wie A-Bewertung, Terz- und Schmalbandanalysen, Filter und vieles mehr. Darauf aufbauend sind jetzt detailliertere Untersuchungen möglich. In einem Spektrogramm können zum Beispiel Geräusche im Zeit- und Frequenzbereich markiert werden. Das Akustische Bild zeigt dem Anwender dann den Quellort dieses Geräusches. Oder ein Punkt am Messobjekt wird angewählt, der davon ausgehende Schall kann rekonstruiert, dargestellt, in seine spektralen Anteile zerlegt oder über Lautsprecher wiedergegeben werden – und das alles nach beendeter Messung. (aus http://www.acoustic-camera.com)

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum e.kerschbaum@kabsi.at - www.aes-austria.org

DIGITAL UPDATE DAYS /ORF-Zentrum am 28. /29. April INFO auf www.artecast.co




Einladung zum Vortrag

Zeitpunkt: Mittwoch, 28. März 2007 18:30

Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

Vortragende: Nadja Wallaszkovits, Heinrich Pichler

Thema: Anwendbarkeit und Grenzen der Wow- und Flutter-Korrektur bei Magnetaufzeichnungen über das HF Vormagnetisierungssignal

Einer der möglichen und in der Praxis auch auftretenden Fehler bei analoger magnetischer Signalaufzeichnung sind Gleichlauffehler, auch als Wow- und Flutter-Effekte bekannt. Deren Korrektur ist in den letzten Jahren ausführlich in der Literatur bearbeitet worden. Die Grundidee der Korrektur liegt darin, dass die durch mechanische Ursachen hervorgerufenen Geschwindigkeitsschwankungen das Nutzsignal und die HF-Vormagnetisierung gleichermaßen betreffen. Wenn die aufgezeichneten Schwankungen der HF-Vormagnetisierungsfrequenz genügend genau erfasst werden können und darüber hinaus angenommen werden kann, dass die ursprüngliche Vormagnetisierungsfrequenz sich nicht, oder nur relativ langsam ändert, ist eine Entstörung des Nutzsignales möglich.

Die in der Literatur vorgeschlagenen Rückgewinnungsmethoden für das HF-Vormagnetisierungssignal basieren weitgehend auf modifizierten Laufwerken mit speziellen Wiedergabeköpfen. Die teilweise weit oberhalb des Bandes des NF-Nutzsignals gelegene Vormagnetisierungsfrequenz (je nach Gerät 40 bis 450kHz) kann durch die in den Geräten serienmäßig eingebauten Wiedergabeköpfe normalerweise nicht ausgelesen werden, da diese auf das NF-Nutzsignal optimiert sind.

Der vorliegende Beitrag beschreibt die in der Praxis auftretenden Grenzen und Probleme bei der Erfassung und Weiterverarbeitung der HF-Vormagnetisierung bei handelsüblichen Laufwerken. Darüber hinaus wird ein kostengünstiger Weg zur Erfassung des HF-Signals über einen zusätzlich angebrachten Sensorkopf unter Verwendung von Standardkomponenten und Weiterverwendung der serienmäßig am Gerät vorhandenen Köpfe beschrieben.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum



Einladung zum Vortrag

Zeitpunkt: Dienstag, 17. Oktober 2006 ca. 19:15 im Anschluß an die vorher stattfindende Generalversammlung 2006

Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

Vortragende: P. Majdak, P. Balazs - Institut für Schallforschung, Österreichische Akademie der Wissenschaften

Schnelle Messung der Außenohrübertragungsfunktionen mittels der Multiple Exponential SweepMethode

Die Darbietung virtueller Schallquellen über Kopfhörer erfordert eine Filterung der Schallsignale mit Außenohrübertragungsfunktionen (Head Related Transfer Function, HRTF). Die HRTFs beschreiben die Filterwirkung des Kopfes, des Torso und der Pinna und können über im Ohrkanal platzierte Mikrofone gemessen werden. Die HRTFs sind vom Winkel des Schalleinfalls abhängig und werden für verschiedene Richtungen gesondert gemessen. Die Messung eines HRTF-Satzes umfasst je nach Anwendung über 1000 Positionen und kann je nach Messsituation über 20 Minuten dauern.Während dieser Zeit sollte die Versuchsperson absolut still halten.

Um die Messung der HRTF-Sätze zu beschleunigen, wurde die ”Multiple Exponential Sweep“-Methode (MESM) entwickelt. MESM basiert auf der Systemidentifikation mit exponentiellen Sweeps und erlaubt die simultane Messung von mehreren HRTFs aus verschiedenen Richtungen. Die Methode wurde anhand mehrerer Messungen in der Versuchsanlage evaluiert, wobei die Messdauer eines HRTF-Satzes mit über 1000 HRTFs im Vergleich zu einer herkömmlichen Systemidentifikationsmethode von 25 Minuten auf 8 Minuten verkürzt werden konnte.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum



Einladung zum Vortrag

Zeitpunkt: Donnerstag, 29. Juni 2006 18:30

Ort:          FH Technikum Wien, Höchstättplatz 5, 1200 Wien
                 HS 1.05, 1. Stock

Vortragender: Martin DECHANT, Fa. Wien Schall GmbH

Thema:

Raumakustik und Sprachverständlichkeit
Messmöglichkeiten mit dem Acoustilyzer AL1 von NTI

- Schallpegelmessung
- Spektralanalyse
- Nachhallzeit
- FFT Analyse
- Lautsprecherpolarität
- Laufzeitmessung
- Sprachverständlichkeit STI-PA
Methoden im Vergleich
Praxis
Nachbewertung

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum e.kerschbaum@kabsi.at - www.aes-austria.org



Einladung zum Vortrag

Zeitpunkt:

Dienstag, 16. Mai 2006 18:30

Ort:

Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

Vortragender

: Martin DECHANT, Fa. Wien Schall GmbH

Thema:

NTI Digilyzer DL1
              
Ein Messgerät für nahezu alle digitalen Audiosignale

- DL1 Key Features
- Schnittstellen
- Auf einen Blick - der schnelle Konsistenztest
- Beispiele (Auflösung, hängende Bits, Channel Status und User Daten, vu-Messung, AGC - Audiolupe, Verzerrungsmessung)
- Oszilloskop
- Event Logger (Carrier-, Frame-, Audio Signal-, Channels Status- und Consistency Check events)
- Praxis

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum e.kerschbaum@kabsi.at - www.aes-austria.org



Einladung zu den Vorträgen

Zeitpunkt: Dienstag, 24. Jänner 2006 18:30

Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften,Seminarraum, Reichsratstraße 17, 1. Stock

Vortragende: Mag. Nadja WALLASZKOVITS, Phonogrammarchiv der Öst. Akademie der Wissenschaften

Thema: Restaurierung historischer Audiomaterialien – Historische, ethische und ästhetische Aspekte am Beispiel von Aufnahmen aus dem Phonogrammarchiv

Die Restaurierung historischer Audioaufnahmen im Rahmen einer wissenschaftlichen Quellenausgabe stellt die ausführende Person laufend vor die Gewissensfrage:

"Dürfen wir, was wir können?" –

Der Vortrag widmet sich einerseits den Aspekten der historischen Aufnahmetechnik im Phonogrammarchiv, den Einflüssen durch Alterung, Lagerung, Abspielung und den daraus entstandenen hörbaren Artefakten, andererseits der heutigen Übertragungstechnik und den zur Verfügung stehenden digitalen Restaurierungswerkzeugen. Schließlich eröffnet sich beim Bearbeiten der jeweiligen Aufnahme die gesamte Palette der ethischen und ästhetischen Fragestellungen, um die Gratwanderung zwischen Authentizität und Zumutbarkeit für den unbedarften Hörer - in Abhängigkeit vom jeweiligen Verwendungszweck der Aufnahme (Analyse, Edition, Hörbeispiel für Vorträge oder Ausstellungen etc.) - zu bewerkstelligen.

Anhand von Hörbeispielen und Analysen wird versucht, die Grundsätze der klassischen Restaurierungsethik und ihre Umsetzung auf die Audiorestaurierung darzustellen.

ÄNDERUNG des TERMINS

Zeitpunkt: Dienstag, 21. März 2006 18:30

Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

Vortragende: Mag. Maya VINSON, Inst. f. Elektroakustik, Univ. f. Musik und darstellende Kunst

Thema: Anwendung, Bedeutung und Implementation von Sounddesign in Computerspielen

Das Ziel der Arbeit ist es, die Möglichkeiten der Soundgestaltung und der Implementation von Sounds in Computerspielen zu betrachten und mit dem prägenden Medium des Sounddesign, dem Film, zu vergleichen.

Es sollen darüberhinaus Möglichkeiten präsentiert werden, wie der Ton in Spielen durch Integration neuer Technologien realistischer gestaltet werden kann.

Ferner werden die Kategorisierung von Sounds sowie der Implementationsprozess erläutert.

Besonders spannend wird die Tongestaltung bei Computerspielen für Blinde bzw. sehbehinderte Menschen (audio games). Es muss hier eine virtuelle Welt erschaffen werden, die ausschließlich auf Elementen des Sounddesign aufbaut.

 

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum

e.kerschbaum@kabsi.at - www.aes-austria.org





Einladung zum Vortrag

Zeitpunkt: Mittwoch, 16. November 2005 19:00 c.t.
Ort: RP6, ORF-Funkhaus Argentinierstraße 30a, 1040 Wien

Vortragender: Peter Weber, Studer International, Schweiz
Thema: Präsentation des Vista 8 - Mischpults im RP6

Anlässlich der Inbetriebnahme des neu gestalteten RP6 lädt Studer Austria gemeinsam mit dem ORF zur Präsentation des neuen Regieplatzes im Funkhaus Wien. Peter Weber, Produktmanager und Entwickler von Studer International, Schweiz, gibt einen Überblick über das installierte Studer VISTA 8 Mischpult. Besonderes Augenmerk wird dabei auf die speziell auf Live-Anwendungen abgestimmten Features sowie die besondere Bedienergonomie des Pultes gelegt.
Anschließend bittet Studer Austria zu einem kleinen Imbiss.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum


Einladung zum Vortrag

Zeitpunkt: Dienstag, 20. September 2005 18:00
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. StockVortragender: Dr. Heinrich Pichler
Thema: Analoge und digitale Schnittstellen in der Audiotechnik

Teil 2 - Schnittstellen, optische und elektrische Leitungen - Anwendungen und Eigenschaften

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum

 

Einladung zum Vortrag

Zeitpunkt: Dienstag, 21. Juni 2005 18:00
Ort: FHS Höchstädtplatz , HS 3.13Vortragender: Dr. Heinrich Pichler
Thema: Analoge und digitale Schnittstellen in der AudiotechnikAnwendungen und Eigenschaften der in der Audiotechnik üblichen Schnittstellen.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum


Einladung zum Vortrag

Zeitpunkt: Mittwoch, 11. Mai 2005 18:30
Ort: Dompfarramt (Curhaus), Stephanisaal (Hochparterre), Stephansplatz 3
Vortragender: Dr. Gerhard Graber (TU Graz, Inst. für Breitbandkommunikation)
Thema: Die Akustik im Stephansdom – Ist eine akustische Verbesserung der Musiziersituation möglich?

Im Stephansdom zu Wien gibt es eine lange Musiziertradition mit unterschiedlichsten Ensemblegrößen und Musizierorten. Seit dem Einbau der Riegerorgel (1991) ist der Hauptmusizierort der vordere Teil des südlichen Seitenschiffs (Friedrichsschiff).

Die Erfahrung zeigt, dass aus akustischer Sicht dieser Ort einige Mängel aufweist: zum einen hören sich die Musiker gegenseitig in ungenügender Weise, zum anderen ist die diagonale Ausrichtung des Ensembles im Raum (von rechts vorne nach links hinten) für die Abstrahlung in den Dom ungünstig, da an den meisten Hörplätzen durch die Säulen ein mehr oder weniger großer Teil des Ensembles abgeschattet wird.

In einem von der Österreichischen Nationalbank finanzierten Forschungsprojekt wurde in Zusammenarbeit von Technischer Universität Graz, Joanneum Research Graz und dem Technischen Büro Rohde-Jegger Acoustics die Akustik des Stephansdoms mit dem Ziel untersucht, akustische Verbesserungsvorschläge für die Musiker am Hauptmusizierort und eine Verbesserung der Abstrahlung in den Dom auszuarbeiten. Dazu wurde zunächst in umfangreichen Messungen der akustische Istzustand des Stephansdoms erhoben. Diese Ergebnisse wurden verwendet, um die raumakustische Simulation des Istzustandes zu kalibrieren. In die Simulation wurden anschließend Verbesserungsmaßnahmen integriert und verschiedene Varianten in ihren Auswirkungen verglichen.

Der Vortrag gibt einen Überblick über den Ablauf des Forschungsprojekts, geht auf die besonderen Herausforderungen ein und skizziert den Weg der Problemlösung. Es werden die Messergebnisse und die wichtigsten Ergebnisse der raumakustischen Simulation mit den unterschiedlichen Verbesserungsvarianten gezeigt. Auralisationsbeispiele mit der g-moll Fantasie von J.S. Bach (BWV 542) sind geplant.

Im Anschluss an den Vortrag ist die Möglichkeit des Besuchs des Stephansdoms gegeben, wobei Domkapellmeister Johannes Ebenbauer die für die Auralisierung verwendete Fantasie in g-moll von J.S.Bach auf der Riegerorgel life spielen wird.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum



 

Einladung zum Vortrag

Zeitpunkt: 12. April 2005 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. StockVortragender: W.A. Deutsch, Inst. f. Schallforschung d. Öst. Akademie d. Wissenschaften
Thema: NOIDESc: Deskriptoren für Lärmsignale

Lärm ist unerwünschter Schall, physikalisch messbar als Schalldruck über Frequenz, Raum und Zeit. Zeit-Frequenzdarstellungen (Time Frequency Representations, TFR) von akustischen Signalen sind daher prinzipiell geeignet, eine physikalisch hinreichende Beschreibung von Schallereignissen zu geben. Das Erkennen, Bewerten und Klassifizieren von Schallereignissen setzt die (semi)automatische Segmentierung und Auswertung von TFRs voraus.

Im Laufe der letzten Jahre wurden zahlreiche Vorschläge zur Erarbeitung eines allgemein anwendbaren Deskriptor-Schemas für Audiosignale diskutiert. Die wichtigsten Ergebnisse haben Eingang gefunden in den für Multimedia – Zwecke entwickelten Standard MPEG-7 Teil 4 (Audio). Nachdem der Standard keinerlei Einschränkungen bezüglich der Signalart und –Eigenschaften auferlegt, kann er auch für Lärmsignale eingesetzt werden. Der Vortrag beschreibt die Entwicklung und Implementierung von Deskriptoren und Features zur Klassifikation von Lärmsignalen:

· Basic Instantaneous: (momentane) Wellenform und Pegel-Werte
· Basic Spectral: das Log-(Bark-, ERB-, Mel-) Frequenz-Leistungsspektrum und spektrale Flachheit (einschließlich spektrales Zentroid) und spektrale Ausdehnung
· Signal Parameter: Grundfrequenz quasiperiodischer Signale und Harmonizität
· Klangfarbe temporal: Log Attack Zeit und temporales Zentroid
· Klangfarbe spektral: spezielle spektrale Features auf linearer Frequenz-Skala, einschließlich ein spektrales Zentroid sowie spezifische spektrale Features für harmonische Signalteile, einschließlich harmonisches spektrales Zentroid, spektrale Abweichung, Ausdehnung und Variation
· Spektrale Basis-Repräsentationen: Features, die zur automatischen Klassifikation und Wiedererkennung dienen, wie Basisfunktionen, die die Projektion in einen niederdimensionalen Raum erlauben um Kompaktheit für die Wiedererkennung zu gewinnen.

Das Projekt wird vom bmvit im Rahmen ISB2 (Innovatives System Bahn) unterstützt.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum


Einladung zum Vortrag

Zeitpunkt: 8. März 2005 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock
Vortragende: Dr. Susanne Windischberger, Philips Sound Solutions

Thema: Telekomlautsprecher im Spannungsfeld zwischen HiFi und Miniaturisierung

Die kontinuierliche Miniaturisierung in der Elektronik ermöglicht mobile Anwendungen mit einer steigenden Anzahl von Funktionen und immer kleineren Abmessungen. Trotz extremer Rechen-leistungen der Prozessoren werden die Elemente, die die Schnittstellen zum Benutzer darstellen, bestimmend für die minimale Dimension der Geräte. Im Gegensatz zum Display, welches einen möglichst großen Teil der Oberfläche belegen soll, wird von einem akustischen Wandler erwartet, dass seine Größe und das gesamte notwendige Volumen auf ein Minimum reduziert wird und seine Form den vorhandenen Platz optimal ausnützt.

Dies steht im Widerspruch zu den steigenden Anforderungen bezüglich akustischer Qualität, Laut-stärke und der Diversifikation der Anwendungen. Die Folge ist eine kontinuierliche Annäherung an die technisch - physikalischen Grenzen aller Komponenten im dynamischen Lautsprecher und die Suche nach anderen, für die entsprechende Anwendung optimierten Wandlerprinzipien.

Als Schlüsselelement beim dynamischen Wandler stellt sich die Membran heraus. Sie soll möglichst hohe Luftvolumina bewegen können aber eine lineare Federkennlinie aufweisen. Weiters soll sie eine hohe Compliance ermöglichen jedoch keine höheren Moden produzieren. Eine Optimierung der widersprechenden Anforderungen kann nur mehr mit FE – Simulationen sinnvoll durchgeführt werden, die viele entscheidende Membran- und Prozessparameter berücksichtigen.

Mit neuen Wandlerprinzipien versucht man, anwendungsspezifische Nachteile des dynamischen Wandlers zu umgehen. Dazu gehören vor allem die notwendige Dicke, die beschränkten Form-variationen und die nicht vorhandene Skalierbarkeit. Im Fokus bei mobilen Anwendungen bleiben aber wie beim dynamischen Lautsprecher immer eine hohe Volumeneffizienz und ein minimales Gesamtvolumen.

Der Vortrag gibt einen Überblick über die bei PSS durchgeführten theoretischen und experimentellen Arbeiten und neue Produkte in diesem Bereich.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum



Einladung zum Vortrag

Zeitpunkt: 20. Jänner 2005, 18:30 - 20:00
Ort: Universität für Musik und darstellende Kunst Wien, Hörsaal 10, 1. Stock, Singerstr. 26A (Eingang bei kleiner grüner Tür unter Schild "Antquitäten")Vortragender: Dr. Carl Poldy
Thema: PSYCHOAKUSTISCHER BASS UND DIE ECHTE LANDKARTE FÜR MUSIK

Das Thema wird anhand einiger Beispiele mit visuellen und akustischen Demonstrationen dargestellt.
Differenztöne - Der Geigenvirtuose und Komponist Giuseppe Tartini kannte diesen Effekt aus der Praxis. Er hat seinen Schülern geraten, bei Doppelgriffen, als Indiz für sauberes Intonieren, auf einen tiefen Ton zu horchen. Dieser Ton ist im Schallsignal physikalisch nicht vorhanden.
Zum Beispiel, wenn man beim A-Dur-Akkord [A Cis E] mit (440 550 660 Hz) nur die zwei oberen Töne [Cis E] spielt, hört das Ohr den Differenzton A = (660 - 550) = 110Hz im Bass (2 Oktaven unter dem Kammerton a1 /440 Hz). Dabei wird diese kleine Terz zu einem vollen A-Dur-Akkord (110 550 660 Hz) ergänzt.

Mobiltelefon - Lautsprecher - Diese funktionieren erst ab etwa 400 Hz. Mit dem oben beschriebenen Mechanismus kann man den fehlenden Bass vortäuschen.
Voraussetzungen dafür:
1) reine Stimmung (nicht die übliche Klavierstimmung) und
2) obertonreiche Töne.
Der Klang wird mit dem temperierten Klang bei gleicher objektiver Klangfarbe verglichen.

Sichtbare Harmonie - Es geht darum, das harmonische Geschehen in einem Musikstück nicht nur sichtbar zu machen, sondern auch übersichtlich. Dafür braucht man eine geeignete Landkarte. Wenn man darauf von Ton zu Ton schreitet, sollen die kleinsten Schritte solche Töne verbinden, die harmonisch am stärksten verwandt sind.
Die Klaviertastatur erfüllt diese Bedingung nicht, da die Beziehung zwischen A und Ais eher dissonant ist.

Das Tonnetz - Auf dem Tonnetz sind [A Cis] und [A E] nächste Nachbarn.
Wir werden während des Abhörens von Musikbeispielen (z.B. Mozart Klarinettenquintett, Zauberflöte, etc.) auf dem Tonnetz das harmonische Geschehen verfolgen.

Tristan-Akkord - Das Tonnetz ist grundsätzlich 2-dimensional (Y-Achse für Quinten 2:3, X-Achse für Terzen 4: 5). Für manche Musikstücke braucht man eine dritte Dimension (Z-Achse für reine Septimen 4:7), z.B. Dominantseptakkord A7 in D-Dur mit G = 770 Hz. Dabei kommen die ersten drei nicht-trivialen Primzahlen 3, 5, 7 zur Geltung.
Der rätselhafte Tristan-Akkord, dessen Deutung Musikwissenschaftler lange beschäftigt hat, wird schlicht als Spiegelbild (Moll) des 4 - 5 - 6 - 7 Schemas interpretiert.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Ewald Kerschbaum


Einladung zum Vortrag

Zeitpunkt: 14. Dezember 2004 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

Helmut Kühnelt, (Institut f. Wr. Klangstil, Universität f. Musik u. darst. Kunst Wien)

Aktuelle Forschungsprojekte zur Flöte am IWK

1) Dreidimensionale Simulation der Klangerzeugung in Flöten: Die Wechselwirkung von Luftströmung des Strahls und Schallfeld im Instrument bestimmt die Klangerzeugung bei Flöten und labialen Orgelpfeifen. Mit Hilfe von dreidimensionalen Computersimulationen in realistischen Geometrien werden die strömungsakustischen Vorgänge in der Flöte nachgebildet und analysiert. Die dabei eingesetzte Lattice-Boltzmann-Methode wird vorgestellt. Das Verhalten des schwingenden Systems in Zeit- und Frequenzbereich wird ebenso betrachtet, wie die erzeugte Schallleistung und die Auswirkung kleiner Änderungen der Geometrie im Labialbereich auf den Klang.

2) Methoden zur Messung akustischer Parameter bei Flöten: Die Messung der Eingangsimpedanz stößt aufgrund physikalischer Gegebenheiten bei Flöten auf grundsätzliche Schwierigkeiten. Mögliche Messmethoden - u.a. mit dem am IWK entwickelten BIAS-System - werden vorgestellt und ihre Praxistauglichkeit als Werkzeug für die Entwicklung und zur Qualitätskontrolle im Flötenbau diskutiert.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Ewald Kerschbaum


Einladung zum Vortrag

Zeitpunkt: 19. Oktober 2004 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

Piotr Majdak und Holger Waubke, Inst.f. Schallforschung, OeAW
Aufbau und Auswertung von Vielkanalmessungen (Mikrofonarray) zur Lokalisation von Schallquellen

Es wird ein am Institut für Schallforschung der ÖAW entwickeltes Microfonarray-System (64 Kanäle) zur Lokalisation von Schallquellen im Raum vorgestellt. Berichtet wird über verschiedene Ansätze der Lokalisation; Beamformingverfahren und akustische Holographie. Erste Ansätze werden am Beispiel von Vorbeifahrten von Hochgeschwindigkeitszügen demonstriert.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Ewald Kerschbaum


Einladung zum Meeting/Vortrag

Zeitpunkt: 21. September 2004 18:15
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

1. Piotr Majdak
Aufbau von Experimenten zur Wahrnehmung interauraler Laufzeitdifferenzen von Cochlea-Implantat-Trägern

Die Wahrnehmung interauraler Laufzeitdifferenzen (Interaural Time Differences, kurz ITD) beim Normalhörer zeigt Abhängigkeiten vom Schallpegel, der interauralen Pegeldifferenz, der Frequenz und der binauralen Übereinstimmung der Frequenz der Stimuli. In Experimenten zur Untersuchung der ITD-Diskriminination werden diese Parameter üblicherweise konstant gehalten und lediglich die interaurale Phase als unabhängige Variable betrachtet und variiert. Obwohl die Abhängigkeit der ITD-Wahrnehmung bei Cochlea-Implantat-Trägern (CI-Trägern) noch nicht zur Gänze erforscht ist, können die meisten Zusammenhänge aus der Literatur für Normalhörer übernommen werden. Aufgrund der großen interindividuellen Unterschiede diverser psychoakustischer Parameter (wie Stromstärke, ILD oder tonope Position der elektrischen Stimulation), wird die notwendige Konfiguration für jede Versuchsperson in psychoakustischen Experimenten einzeln ermittelt. In diesem Vortrag werden die einzelnen Vortests und deren Optimierung erläutert.

2. Bernhard Laback
Temporal fine structure and onset/offset cues in ITD-based lateralization of bilateral Cochlear Implant listeners

Several studies reported generally higher lateralization thresholds upon interaural time delay (ITD) of bilateral Cochlear Implant listeners (CI) compared to normal hearing (NH) listeners. In addition, the thresholds appear to increase much more rapidly with increasing stimulus (pulse) rate than in NH listeners. Up to now, it has not directly proven that CI listeners are sensitive to ITD in the temporal fine structure and how this sensitivity relates to the sensitivity to ITD in the signal onset and offset. This study directly determined the relative importance of ITD in the temporal fine structure and in onset and offset with bilateral CI listeners, applying an lateralization task. To exclude cofounding effects of interaural level difference (ILD) in the onset/offset portions , a four-pulse stimulus was used, which allowed a strict separation between signal onset/offset and fine-structure. Conditions with ITD in the stimulus onset and/or offset only were tested to examine if the particular importance of ITD in the stimulus onset, as known from normal hearing, can also be found in CI listeners. All types of ITD were tested as a function of pulse rate, since the relative contribution of fine structure and gating delay is expected to depend on the pulse rate. Four of the five CI listeners tested up to now showed rather poor ITD sensitivity, making it impossible to discriminate between different measurement conditions. One CI listener, however, showed sensitivity to ITD in the temporal fine-structure up to 800 pulses per second, the highest rate tested. In accordance with NH listeners, the importance of the signal onset for ITD-based lateralization increases with pulse rate.

Beide Beiträge werden in deutscher Sprache gehalten.

Im Anschluß an die Vorträge findet um ca. 19:00 die Generalversammlung statt. Sie ist nur Mitgliedern zugänglich.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner


Einladung zum Vortragsabend bei AKG

Zeitpunkt: 20. April 2004, 19:00
Ort: AKG Acoustics GmbH, Lemböckgasse 21 - 25 (U6 Siebenhirten oder über Perfektastrasse parallel zur U6)1. Richard Barnert
The NeXt Generation C 414

Produktpräsentation der neuen C 414-Modelle: C 414B-XLS / C 414B-XLII2. Dominik Biba
Messung und Simulation von Membranen

Durch den Einsatz bildgebender Verfahren, wie dem Laservibrometer, kann die Gültigkeit von Finite-Elemente-Berechnungen von Membranen unmittelbar überprüft werden. Speziell der Vergleich von Rechnung und Messung des mechanischen Schwingungsverhaltens im Vakuum erlaubt einen präzisen Abgleich der Materialparameter. Es werden Mess- und Rechenergebnisse des Schwingungsverhaltens dynamischer Wandler vorgestellt.3. Thomas Stubics
Professionelle Studiokopfhörer OHNE Kabel

Im Studio- und Broadcastbereich findet man für Kopfhörer ein breites Anwendungsspektrum, da sie gegenüber Lautsprechern viele Vorteile bieten und in kritischen Situationen unersetzbar sind. Jedoch findet man hier fast ausschließlich kabelgebundene Lösungen, da bisherige Drahtlossysteme den professionellen Anforderungen, vor allem an die Klangperformance, nicht gerecht werden konnten.
AKG stellt nun mit dem Hearo 999 Audiosphere II den ersten "Digital Wireless" Kopfhörer vor, der auch diesen hohen Ansprüchen, mit Schwerpunkt auf Akustikdesign, gerecht wird.
Präsentation und Demonstration4. Anläßlich des 30. Jahrestags der Gründung der österreichischen Sektion der AES:

Unter dem Motto: "AES-Austria die ersten 30 Jahre" werden alle Gründungsmitglieder herzlichst eingeladen im Rahmen eines Podiumsgesprächs ihre eigene AES-Austria - Zeit zu schildern. Geschichten, Bilder, Highlights, Enttäuschungen bitte mitbringen.
Mit einem Spezialbeitrag über die AES-Convention in Wien von E. Kerschbaum.
Einleitende Worte und Moderation: W.A. Deutsch

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl.-Ing. Ewald Kerschbaum

Bitte um Info, ob wir mit Ihrer Teilnahme rechnen dürfen.
(e.kerschbaum@kabsi.at oder 0676 5233678)


Einladung zum Meeting/Vortrag

Zeitpunkt: 23. März 2004 18 Uhr c.t.
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock

Lukas Hebenstreit

Das Wolftonverhalten der Geige

Einführung in die Funktionsweise und Akustik der Geige.
Was ist der Wolfton?
Das Wolftonverhalten der Geige unter spezieller Beachtung des Einflusses der Saiten auf das Wolftonverhalten der Geige.
Messaufbau (das computerunterstützte Geigenmesssystem VIAS) und wie es besser ginge.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
(Generalsekretär AES-Austria)


EINLADUNG zum Meeting/Vortrag

Zeitpunkt: 18. November 2003 18 Uhr c.t.

Ort: 1030 Wien, Dietrichgasse 25, SiemensFORUM, Seminarraum 3

Christophe Beaugeant

Tutorial on Noise Reduction

Während der letzten Jahrzehnte hat die Mobilität einen wichtigen Platz in der Telekommunikation eingenommen. Kommunikationsbausteine, wie der PC, das Telefon, oder die Tagesordnung, haben sich von ihrem ursprünglichen Platz aus die ganz Welt zu eigen gemacht. Das Telefonieren im Auto, an der Bahnstation oder am Flughafen ist in Industriestaaten ganz normal, und Experten sind der Meinung, dass das erst der Anfang der Kommunikationskultur der modernen Nomaden ist. Eine Folgeerscheinung dieser Entwicklung ist die immer mehr durch Umweltgeräusche verseuchte Kommunikation, was wiederum herabgesetzte Verständlichkeit, Gesprächsqualität oder verminderte Umsetzung bei Spracherkennungssystemen bewirkt. Folglich muß das Signalprozessing in der Lage sein, den Einfluß des Geräusches vermindern zu können. Solche Technologien arbeiten in mobilen Bausteinen, ohne dass der Benutzer es merkt, und viel Aufwand wird getrieben, um die bestehenden Systeme zu verbessern bzw. neue Technologien in dieser Richtung zu entwickeln.

Der Vortrag will einen Überblick über die Problematik in Zusammenhang mit geräuschkorrumpierter Sprache geben und bringt die verschiedenen Techniken im Hinblick auf diese Art der Rauschunterdrückung ein. Vier Anwendungen werden speziell behandelt und und bilden ein allgemeines Forum der Lösungen, die bereits existieren.

Zuerst werden Rauschverminderungssysteme, die auf der Signalanalyse in der Frequenzdomäne basieren, vorgestellt; gegenwärtig quasi Standard für Signalverbesserung im Bereich der Sprache. Mehr auf die Spracherkennung zugeschnittene Rauschverminderung basierend auf dem Sprach- und/oder Rauschmodell werden ebenfalls beschrieben. Lösungen durch Mikrophonaufstellung, letztendlich in Verbindung mit digitalem Signal-Prozessing, werden hauptsächlich im car-audio oder in visio-conference Systemen mit großem Erfolg eingesetzt. Zum Schluß werden noch aktive Geräuschkontrolltechniken zur Verbesserung des Lautsprechersignals in lärmendem Umfeld beschrieben.

Audiocodierung ist heute auch in vielen Geräten der Unterhaltungselektronik zu finden. Der Vortrag gibt einen Einblick in die Funktionsweise, Geschichte und aktuelle Anwendungen von Audiocodierverfahren. Obwohl im klassischen Bereich der "CD-Qualität" (wie immer man sie definieren mag) schon seit sechs Jahren wenig Änderungen am Stand der Technik zu verzeichnen sind, gibt es weiterhin aktive Forschung in Teilgebieten der Audiocodierung. Ein Überblick insbesondere parametrischer Verfahren zeigt diese aktuellen Forschungsthemen auf.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
(Generalsekretär AES-Austria)


EINLADUNG zum Meeting/Vortrag

Zeitpunkt: 30. Oktober 2003, 18 Uhr 30
Ort: Helmut-List-Halle,Graz, Waagner-Biro-Strasse 98a

Präsentation der Helmut-List-Halle

Ablauf :
18:30-19:00 Ankunft und Begrüssung (steirischer Herbst,NN)
19:00-19:20 Architektur und akustische Konzeption der Helmut-List-Halle (Arch. Markus Perthaler)
19:20-19:40 Elektroakustische Anlagen und Beschallungskonzepte der Halle (rohde-jegger acoustics,DI Rohde)
19:40-20:00 Pause und Eintritt
20:00-21:30 Generalprobe "Lost Highway" von Olga Neuwirth
21:30-22:00 Erläuterungen zum "ambisonic"- Setup der Produktion (DI Noisternig)
ca 22:10  Ende und Abfahrt
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Interessenten bitten wir um rasche Rückmeldung ,da ein Bus organisiert werden muß (Abfahrtsmodalitäten werden noch bekannt gegeben).
Für privat Anreisende findet sich umseitig eine Anfahrtskizze.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
(Generalsekretär AES-Austria)


EINLADUNG zum Meeting/Vortrag

Zeitpunkt: 16. September 2003 18 Uhr c.t.

Ort: Technikum Wien, Wien 1200, Höchstädtplatz 5, Hörsaal 1.05, U2 Schottenring, Linie 31 Höchstädtplatz oder U6 Dresdner Straße, 1 Station mit 37A Richtung Dänenstraße bzw. N Richtung Friedrich-Engels-Platz

Prof. Dr. Karlheinz Brandenburg
Audiocodierung: von mp3 zu parametrischer CodierungAudiocodierung ist heute in vielen Geräten der Unterhaltungselektronik zu finden. Der Vortrag gibt einen Einblick in die Funktionsweise, Geschichte und aktuelle Anwendungen von Audiocodierverfahren. Obwohl im klassischen Bereich der "CD-Qualität" (wie immer man sie definieren mag) schon seit sechs Jahren wenig Änderungen am Stand der Technik zu verzeichnen sind, gibt es weiterhin aktive Forschung in Teilgebieten der Audiocodierung. Ein Überblick insbesondere parametrischer Verfahren zeigt diese aktuellen Forschungsthemen auf.

Unser Dank gilt der Fachhochschule Technikum Wien für die Bereitstellung der Räumlichkeit und der notwendigen Facilities.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
(Generalsekretär AES-Austria)


EINLADUNG zur GENERALVERSAMMLUNG 2003

Ort: Technikum Wien, Wien 1200, Höchstädtplatz 5, Hörsaal 1.05
Zeitpunkt: 16. September 2003 im Anschluß an das Meeting, das um 18 Uhr c.t.beginnt.

Tagesordnung:

1) Eröffnung und Feststellung der Beschlußfähigkeit
2) Genehmigung des letzten Protokolls
3) Bericht des Präsidenten
4) Bericht des Kassiers
5) Bericht der Rechnungsprüfer
6) Entlastung des Vorstandes
7) Allfälliges

Anträge zur Tagesordnung sind dem Vorstand 2 Wochen vor der Generalversammlung schriftlich bekanntzugeben

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner eh.
(Sekretär AES-Austria)


EINLADUNG zum Meeting/VortragZeitpunkt: 8. April 2003 18:30 c.t.

Ort: AKG Acoustics, Wien 1230, Lemböckgasse 21-25

1. Vortragender: Dr. Richard Barnert (AKG)
Thema: Der sichtbare Klangunterschied von Mikrophonen

Oft kommt es vor, daß sich ein Tonmeister für eine Anwendung zwischen zwei Mikrophonen entscheiden muß, die beinahe identische technische Spezifikationen aufweisen und daher ähnlich klingen sollten. Und trotzdem kann es passieren, daß sich die beiden Kandidaten sehr unterschiedlich verhalten, sobald sie zur Anwendung gelangen. Doch wie ist das möglich? Diese Frage stellt sich natürlich und es wird offensichtlich, daß die üblicherweise publizierten Spezifikationen das tatsächliche Verhalten des Mikrophons nicht hundertprozentig beschreiben können. Es muß also noch weitere "versteckte" Eigenschaften geben, die zur Klangbeschreibung wichtig und notwendig sind. Aber wie können diese unsichtbaren Eigenschaften von Mikrophonen sichtbar gemacht werden?
Die Papers zum Vortrag können Sie von http://www.richardbarnert.com/english/Events/Events.htm downloaden!

2. Vortragender: Mario Siokola (AKG)
Thema: Das drahtlose Mikrofonsystem AKG WMS 4000

Beim WMS 4000 handelt es sich um das neueste drahtlose Mehrkanal-Mikrofonsystem von AKG, wobei die Betonung auf "System" liegt. In der Tat handelt es sich um mehr als 14 modulare Systemkomponenten, die, je nach Ausbaustufe, eine Fülle von neuartigen Features für professionelle Anwender drahtloser Mikrofonsysteme bieten. So beinhaltet das WMS4000 unter anderem eine hochgenaue Restspielzeitanzeige, digitalen Pilotton, Ethernet Schnittstelle, nachprogrammierbares Frequenzmanagement, ein anpassungsfähiges Antennensystem und PC-Steuerung.
Eine Beschreibung des AKG WMS4000 finden Sie auf der AKG-Homepage www.akg.com

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at


EINLADUNG zum Meeting/VortragZeitpunkt: 11. März 2003 18 Uhr c.t.

Ort: Technikum Wien, Wien 1200, Höchstädtplatz 5, Hörsaal 1.05, U2 Schottenring, Linie 31 Höchstädtplatz oder U6 Dresdner Straße, 1 Station mit 37A Richtung Dänenstraße bzw. N Richtung Friedrich-Engels-Platz

Vortragender: DI Dr. Heinrich Pichler

Thema: Das Fernsehen - Von den Anfängen bis 1945

· Bilddarstellung: Scanningverfahren: Mechanisch, Elektronisch; Wiedergabeprinzipien
· Bildaufnahmeverfahren, Bildwiedergabeverfahren
· Nipkow Scheibe, Zwischenfilmverfahren, Elektronische Bildwandler
· Gerätetechnik früher Fernsehgeräte, Frühe Fernsehtelefone, Gerätetechnik früher Farbfernsehgeräte

Unser Dank gilt der Fachhochschule Technikum Wien für die Bereitstellung der Räumlichkeit und der notwendigen Facilities.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at


EINLADUNG zum Meeting/VortragZeitpunkt: 14. Jänner 2003 17 Uhr st

Ort: Österreichische Mediathek, Marchettischlössl, Gumpendorferstraße 96, 2. Stock 57A Haltestelle Hirschengasse

Vortragender: Dr. Rainer Hubert

Führung durch das Digitalarchiv der Österreichischen Mediathek

Start im Marchettischlössl (2. Stock, dann 1. Stock):
· Gesamtüberblick des Systems - die einzelnen Module (Datenbank, Massenspeicher, Digitalisierungsstationen) und ihr Zusammenspiel in einem teilweise automatisierten Workflow
· Benützung (Voxbox = lokal; Website mit Online-Katalog und akustischen Galerien) + Katalogisierung in der Webgasse:
· Medienroboter (Massenspeicher)
· Digitalisierungsstationen

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
(Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at


EINLADUNG zum Meeting/VortragZeitpunkt: 10. Dezember 2002 18 Uhr 30 ct

Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften Seminarraum, Reichsratstraße 17, 1. Stock

Vortragender: Johannes Spitzbart

Thema: Qualitätskontrolle bei CD-R-Rohlingen mit Focus Symbiose Brenner-Rohling

Es wird eine Methode vorgestellt, mit deren Hilfe die Kompatibilität zwischen Writer und CD-R-Rohling sowie deren Einfluß auf die Restlebenszeit und/oder die Lesbarkeit der beschriebenen CD-R festgestellt werden kann. Die Basis der Qualitätskontrolle bildet ein Studer D730 CD-Player, von dem die verschiedenen Fehlersignale einem Mikrokontroller zugeführt werden, wo sie über eine geeignete Software verarbeitet und über eine serielle Schnittstelle an einen PC weitergeleitet werden. Es wurden Tests auf zwei verschiedenen Rekordern mit fünf verschiedenen CD-R Marken bei unterschiedlichen Brenngeschwindigkeiten durchgeführt, welche signifikante Unterschiede zwischen den Medien und geringere Unterschiede zwischen den Rekordern zeigten. Nur zwei der fünf Marken zeigten zufriedenstellende Ergebnisse für eine Langzeitspeicherung. Dieser Umstand zeigt auf, dass eine Evaluierung von verschiedenen CD-R-Typen für Anwendungen als Langzeitdatenspeicher von entscheidender Wichtigkeit ist.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

Mit freundlichen Grüßen

Dipl. Ing. Franz Lechleitner e.h.
(Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at


EINLADUNG zum Dia-Vortrag

Edwin Pfanzagl,
Leiter der Abteilung Akustik bei den Salzburger Festspielen, wird am

Montag, 9.12. um 19 Uhr

im Gottwaldsaal in der Rienößlgasse 12, 1040 Wien (ehem. Institut für Elektroakustik, 2.Stock)

einen Dia-Vortrag über Music Recording Studios in New York halten.

Er wird vor allem Avatar (vormals "Power Station"), Hit-Factory, Quad-Recording, "Electriy Lady Studios" (Jimi Hendrix) und Waterfront Recording Studios (Lenny Kravitz) vorstellen.

Dazu sind alle Interessenten herzlich eingeladen.

Gruß,

Felix Dreher
Student Section Wien


EINLADUNG zum AES- Section Meetingam 5.November 2002 – 18:00

Österreichische Akademie der Wissenschaften Institut für Schallforschung – Phonogrammarchiv
1010 Wien, Reichratsstrasse 17, 1. Stock rechts

Holger Waubke, Florian Kragl und Peter Balazs (Institut für Schallforschung der ÖAW)

MPEG-7 Audio (ISO/IEC JTC1/SC29/WG11), eine Kurzbeschreibung

MPEG-7 Audio bietet 5 Technologien an: ein Audio Description Framework (einschließlich skalierbarer Sequenzen, Low-Level Deskriptoren und ein vereinheitlichtes „Silence“ Segment), Beschreibungswerkzeuge für die Klangfarbe von Musikinstrumenten, Schallerkennungs-Werkzeuge, Beschreibungswerkzeuge für Spracherkennung und Melodie-Beschreibungswerk­zeuge.

MPEG-7 Audio Description Framework


Das Audio Framework enthält Low-Level Tools, die als Grundlage für höherrangige Audio-Applikationen dienen. Sie bilden eine gemeinsame Basis für die Struktur der Beschreibungen und die Semantik allgemein anerkannter Audio Features. MPEG-7 Audio bildet ferner eine Plattform für Interoperabilität für alle Anwendungen, die sich des künftigen Standards bedienen.

Im wesentlichen bieten sich zwei Möglichkeiten an, Low-Level Audio Features einzusetzen. Die erste nimmt Werte, die aus einzelnen Samples errechnet werden, die zweite benützt Segmente um Bereiche zu markieren, die innerhalb der Signale ähnlich oder unähnlich sind. Beide Möglichkeiten sind in den Low-Level Deskriptoren implementiert: für skalare Werte, wie Pegel oder Grundfrequenz und für Vektor-Typen, z.B Spektren. Jeder dieser Deskriptoren kann unmittelbar für ein Segment als einzelner Wert oder für eine Folge von Samples bestimmt werden, je nachdem was die Anwendung erfordert.

Die solcherart bestimmten Werte können selbst wieder im Rahmen eines vereinheitlichten Interfaces in skalierbaren Sequenzen weiterverarbeitet werden: skalierbare Folgen gestatten das progressive Down-Sampling der Daten, je nach Applikation, Bandbreite oder Speicherbedarf. Der entstehende „Baum“ kann auch die verschiedensten Summenwerte aufnehmen, wie Minimum, Maximum, Mittelwerte und Varianzen der Deskriptorenwerte.

Die 7 Zeitfunktions- und spektralen Deskriptoren werden grob in folgende Gruppen zusammengefasst:
* Basic: Instantaneous (momentan) Wellenform and Pegel-Werte
* Basic Spectral: das Log-(Bark-) Frequenz-Leistungsspektrum und spektrale Flachheit (einschließlich spektrales Zentroid) und spektrale Ausdehnung
* Signal Parameter: Grundfrequenz quasiperiodischer Signale und Harmonizität
* Klangfarbe temporal: Log Attack Zeit und temporales Zentroid
* Klangfarbe spektral: spezielle spektrale Features auf linearer Frequenz-Skala, einschließlich ein spektrales Zentroid sowie spezifische spektrale Features für harmonische Signalteile, einschließlich harmonisches spektrales Zentroid, spektrale Abweichung, spektrale Ausdehnung und spektrale Variation
* Spektrale Basis-Repräsentationen: Features, die zur Wiedererkennung dienen, wie Basisfunktionen, die die Projektion in einen nieder-dimensionalen Raum erlauben um Kompaktheit für die Wiedererkennung zu gewinnen.

Während Low-Level Audio Deskriptoren sich in allen möglichen Applikationen wertvoll zeigen, erbringt bereits das spektrale Flachheitsmaß einen robusten Indikator für das Matching von Audio-Signalen. Anwendungen schließen ein: Audio Fingerprinting, Identification von Audio in Datenbasen mit bekanntem Inhalt, z.B. für das Auffinden von Signalen ohne Metadaten oder ohne Annotierung (Copyrights).

Ein zusätzliches aber höchst einfaches Tool ist im “Silence”-Deskriptor verfügbar, der als Hilfe für weitere Segmentierungen herangezogen wird.

Figure 1: MPEG-7 Audio-Segmentierungs-Schema [1] für ein Soundfile (vgl. unten OeAW_ISF: STOOLS-STx für Applikationen mit simultaner Verarbeitung einer Vielzahl von Soundfiles).

Figure 2: STOOLS-STx Multi-Layer Segmentierungssystem für Soundfiles: Sound Segmentadressen, Segment-Identifiers, optionale Links und Content Deskriptoren (Annotierungen) sind in Referenz- (Meta-) Datenfiles abgespeichert. Die relative Adressierung (Segment[Beginn, Ende, Dauer] +/- Zeit[h, min, s, ms, Samples])erlaubt nicht nur Überlappung in eine Richtung, sondern auch bidirektionale Segment- und Offsetspezifizierungen [2].

High-Level Audio Description Tools

Vier Gruppen von High-Level Deskriptoren sind derzeit spezifiziert: Schallerkennung, Klangfarbe von Musikinstrumenten, gesprochene Sprache und melodische Kontur.

Klangfarbe von Musikinstrumenten:

Klangfarben-Deskriptoren bauen auf perzeptiven Features der Instrumentenklänge auf. Klangfarbe ist derzeit wie folgt definiert:

Klangfarbe ist jene Eigenschaft einer auditiven Empfindung wonach ein Zuhörer zwei in gleicher Weise dargebotene Schälle, die dieselbe Lautheit und dieselbe Tonhöhe hervorrufen als unterschiedlich beurteilen kann. Klangfarbe ist neben Tonhöhe, Lautstärke und anderen Eigenschaften, ein Merkmal der Hörempfindung, das sich mehrdimensional auf verschiedenen Skalen ausdrücken läßt, z.B. hell-dunkel oder scharf-stumpf usw. Die Klangfarbe wird im wesentlichen durch den Verlauf des Spektrums bestimmt [NTG 1704].

Anmerkung: die Klangfarbe hängt in erster Linie vom Spektrum des Signals ab, aber ebenso von der Wellenform, dem Schalldruck, der Lage der Frequenzen im Spektrum und von den zeitlichen Charakteristika.

Ziel der Klangfarben-Deskriptoren ist es, die perzeptuellen Features mit Hilfe eines reduzierten Satzes von Deskriptoren zu beschreiben. Dazu gehören die Beschreibungen, wie Einschwingvorgänge (Attack), Helligkeit, Klangfülle usw. Vergleiche auf akustischer Basis wurden bereits zahlreich durchgeführt und haben für die Differenzierung von Instrumentenklassen eine experimentell abgeleitete Distanz-Metrik ergeben (vgl. dagegen Hornbostl-Sachs, Instrumentensyste­matik).

Sound Recognition Tools

Sound Recognition Deskriptoren und Beschreibungs-Schemata bilden eine Sammlung von Tools für die Indizierung und Kategorisierung von allgemeinen Schällen, insbesodere Ton-Effekten. Die Recognition Tools unterstützen die automatische Identifikation, wie auch die Aufstellung von Taxonomien von Signalklassen, bzw. die Spezifikation der Sound Recognizer.

Die Sound Recognition Tools verwenden Spectral Basis Deskriptoren als Grundlage. Die Basisfunktionen werden weiter verarbeitet in eine Sequenz von Zuständen, die ein oder mehrere statistische Modelle beinhalten, z.B. Hidden Markov (HMM) oder Gaussian Mixture Modelle (GMM) aber auch Artifizielle Neuronale Netzwerke (ANNs), die auf Übergangswahrscheinlichkeiten trainiert werden. Diese Modelle werden für sich selbst errichtet oder sie sind assoziiert zur Semantik der Originaltöne und/oder können sie verwendet werden, um neue Signale zu kategorisieren (Generalisierung und Differenzierung), bzw. dienen sie als Input für weitere, modifizierte Recognition Systeme.

Spoken Content Description Tools

Spracherkennungs – Tools für frei gesprochene Sprache ermöglichen die Erkennung von Wörtern in einem Audio-Stream. In Kenntnis der Tatsache, dass die derzeit verfügbaren Automatic Speech Recognition (ASR) Technologien nur begrenzt einsatzfähig sind, und man stets mit Out-of-Vocabulary Utterances zu rechnen hat, muss ein Kompromiss zur Kompaktheit und Robustheit im Rahmen der Such-Algorithmen eingegangen werden. Zur Erreichung dieses Zieles werden die Tools in erster Linie dazu eingesetzt, Zwischenergebnisse für die Automatic Speech Recognition zu erbringen. Nichtsdestotrotz können die ASR-Technologien sinnvoll in Retrieval-Sze­narios eingesetzt werden.

Melody Description Tools

Die Melodie-Kontur-Beschreibung soll eine kompakte Repräsentation der melodischen Information liefern, die für Ähnlichkeitsvergleiche, z.B. query-by-humming eingesetzt werden kann. Das Melody Contour Description Scheme führt eine 5-stufige Kontur ein, in der die aneinanderliegenden Intervallabstände kodiert sind (Intervallschritt auf/ab, groß/klein...). Gemeinsam mit der Basis-Rhythmus-Information (Zählung der Takte), erhält man ein erstaunlich brauchbares Tool für Melodie-Matching in Abfrageprozeduren.

Applikationen, die eine genauere Schätzung der Melodie erfordern können auch Cent-Werte eingesetzt werden. Zur genaueren Erfassung des Rhythmus wird ferner das Log-Verhältnis der Zeitdifferenzen zwischen den Onsets der Noten bestimmt. Schließlich werden sonst verfügbare Meta-Daten wie z.B. Noten, Tonart, Metrum usw. erfasst, soferne verfügbar.Quellenangaben:

Der vorstehende Text wurde bearbeitet, ergänzt und frei übersetzt nach [1]

[1] José M. Martínez (UPM-GTI, ES)
http://ipsi.fhg.de/delite/Projects/MPEG7/Documents/w4031mpeg7overview.htm

[2] STx User's Manual and Reference Guide
http://www.kfs.oeaw.ac.at/software/stx_manual/index.htm


Einladung zum Meeting/Vortrag

Zeitpunkt:             20. November 2001 18 Uhr 30, pünktlich

Ort:                 Phonogrammarchiv der Österr. Akademie der Wissenschaften

                        Seminarraum, Reichsratstraße 17, 1. Stock

Vortragender: Dipl. Ing. Dr. Gernot Kubin, Signal Processing and Speech Communication

  Laboratory, TU Graz und Forschungszentrum Telekommunikation Wien, ftw.

Thema: Automatische Dialogsysteme und oesterreichisches Deutsch

Vortragende: Dr. Sylvia Moosmüller, Institut für Schallforschung der ÖAW

Thema: Sprechererkennung

Das eingelangte Datenmaterial muß nicht nur bezüglich Aufnahmequalität und Dauer der zu analysierenden Sequenz vorbegutachtet werden, es ist in der Folge auch notwendig, das setting (emotionale Stimmung, Sprechsituation, regionale und soziale Zugehörigkeit, etwaige Stimmverstellungen) zu evaluieren.

Für einen reliablen Vergleich ist einerseits eine akustische Analyse (Stimmqualität, Grundfrequenz, Formanten), andererseits eine phonologische sowie auditive Analyse notwendig. Für die Evaluierung der phonologischen Variation sind genaue Kenntnisse der Variation jeweiligen Sprachvarietät bzw. detaillierte Sprachbeschreibungen notwendig. Auch bei der Erstellung des Vergleichsmaterials können Fälle von Stimmverstellungen oder Vortäuschen von Inkompetenz der zu analysierenden Sprache vorkommen.

Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.

<p>Mit freundlichen Grüßen

Dipl.Ing. Franz Lechleitner e.h.

(Generalsekretär AES-Austria)

Franz.Lechleitner@chello.at