Einladung zum Vortrag
Zeitpunkt: Dienstag, 22. 4. 2008 18:30
Ort: Technische Universität Wien, Hörsaal HS5 Freihaus, Turm A (grün), 2. Stock 1040 Wien, Wiedner Hauptstraße 8-10
Vortragender: Dipl. Wi. Ing. Gunnar Heilmann Gesellschaft zur Förderung angewandter Informatik, Berlin
Thema: Akustische Kamera
Eine neue Dimension: Ortsselektive Zeit – und Frequenzmessungen Die Akustische Kamera erweitert die Zeit -und Frequenzselektivität um die Komponente Ortsselektivität. Neben dem Verlauf des Schallsignals kann eine Sequenz von akustischen Fotos erzeugt werden - akustische Filme entstehen. Jetzt wird klar analysiert, wann wo welche Schallquellen aktiv sind. Im Bedarfsfall in extremer Zeitlupe, mit bis zu 192.000 Bildern/Sekunde. Schallwege sind erkennbar, Quellen und Reflexionen werden getrennt. Oft ergeben sich daraus völlig neue Erkenntnisse und Sichtweisen über die Entstehung von Schall. Auch die Analyse von bewegten Objekten ist möglich.
Die akustische Kamera erweitert bisherige Analyseverfahren: Natürlich beinhaltet die Akustische Kamera auch herkömmliche Analyseverfahren, wie A-Bewertung, Terz- und Schmalbandanalysen, Filter und vieles mehr. Darauf aufbauend sind jetzt detailliertere Untersuchungen möglich. In einem Spektrogramm können zum Beispiel Geräusche im Zeit- und Frequenzbereich markiert werden. Das Akustische Bild zeigt dem Anwender dann den Quellort dieses Geräusches. Oder ein Punkt am Messobjekt wird angewählt, der davon ausgehende Schall kann rekonstruiert, dargestellt, in seine spektralen Anteile zerlegt oder über Lautsprecher wiedergegeben werden – und das alles nach beendeter Messung. (aus http://www.acoustic-camera.com)
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum e.kerschbaum@kabsi.at - www.aes-austria.org
DIGITAL UPDATE DAYS /ORF-Zentrum am 28. /29. April INFO auf www.artecast.co
Einladung zum Vortrag
Zeitpunkt: Mittwoch, 28. März 2007 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock
Vortragende: Nadja Wallaszkovits, Heinrich Pichler
Thema: Anwendbarkeit und Grenzen der Wow- und Flutter-Korrektur bei Magnetaufzeichnungen über das HF Vormagnetisierungssignal
Einer der möglichen und in der Praxis auch auftretenden Fehler bei analoger magnetischer Signalaufzeichnung sind Gleichlauffehler, auch als Wow- und Flutter-Effekte bekannt. Deren Korrektur ist in den letzten Jahren ausführlich in der Literatur bearbeitet worden. Die Grundidee der Korrektur liegt darin, dass die durch mechanische Ursachen hervorgerufenen Geschwindigkeitsschwankungen das Nutzsignal und die HF-Vormagnetisierung gleichermaßen betreffen. Wenn die aufgezeichneten Schwankungen der HF-Vormagnetisierungsfrequenz genügend genau erfasst werden können und darüber hinaus angenommen werden kann, dass die ursprüngliche Vormagnetisierungsfrequenz sich nicht, oder nur relativ langsam ändert, ist eine Entstörung des Nutzsignales möglich.
Die in der Literatur vorgeschlagenen Rückgewinnungsmethoden für das HF-Vormagnetisierungssignal basieren weitgehend auf modifizierten Laufwerken mit speziellen Wiedergabeköpfen. Die teilweise weit oberhalb des Bandes des NF-Nutzsignals gelegene Vormagnetisierungsfrequenz (je nach Gerät 40 bis 450kHz) kann durch die in den Geräten serienmäßig eingebauten Wiedergabeköpfe normalerweise nicht ausgelesen werden, da diese auf das NF-Nutzsignal optimiert sind.
Der vorliegende Beitrag beschreibt die in der Praxis auftretenden Grenzen und Probleme bei der Erfassung und Weiterverarbeitung der HF-Vormagnetisierung bei handelsüblichen Laufwerken. Darüber hinaus wird ein kostengünstiger Weg zur Erfassung des HF-Signals über einen zusätzlich angebrachten Sensorkopf unter Verwendung von Standardkomponenten und Weiterverwendung der serienmäßig am Gerät vorhandenen Köpfe beschrieben.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: Dienstag, 17. Oktober 2006 ca. 19:15 im Anschluß an die vorher stattfindende Generalversammlung 2006
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. Stock
Vortragende: P. Majdak, P. Balazs - Institut für Schallforschung, Österreichische Akademie der Wissenschaften
Schnelle Messung der Außenohrübertragungsfunktionen mittels der Multiple Exponential SweepMethode
Die Darbietung virtueller Schallquellen über Kopfhörer erfordert eine Filterung der Schallsignale mit Außenohrübertragungsfunktionen (Head Related Transfer Function, HRTF). Die HRTFs beschreiben die Filterwirkung des Kopfes, des Torso und der Pinna und können über im Ohrkanal platzierte Mikrofone gemessen werden. Die HRTFs sind vom Winkel des Schalleinfalls abhängig und werden für verschiedene Richtungen gesondert gemessen. Die Messung eines HRTF-Satzes umfasst je nach Anwendung über 1000 Positionen und kann je nach Messsituation über 20 Minuten dauern.Während dieser Zeit sollte die Versuchsperson absolut still halten.
Um die Messung der HRTF-Sätze zu beschleunigen, wurde die ”Multiple Exponential Sweep“-Methode (MESM) entwickelt. MESM basiert auf der Systemidentifikation mit exponentiellen Sweeps und erlaubt die simultane Messung von mehreren HRTFs aus verschiedenen Richtungen. Die Methode wurde anhand mehrerer Messungen in der Versuchsanlage evaluiert, wobei die Messdauer eines HRTF-Satzes mit über 1000 HRTFs im Vergleich zu einer herkömmlichen Systemidentifikationsmethode von 25 Minuten auf 8 Minuten verkürzt werden konnte.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen GrüßenEinladung zum Vortrag
Zeitpunkt: Donnerstag, 29. Juni 2006 18:30
Ort: FH Technikum Wien,
Höchstättplatz 5, 1200 Wien
HS 1.05, 1. Stock
Vortragender: Martin DECHANT, Fa. Wien Schall GmbH
Thema:
Raumakustik und
Sprachverständlichkeit
Messmöglichkeiten mit dem Acoustilyzer AL1 von NTI
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Einladung zum Vortrag
Zeitpunkt:
Dienstag, 16. Mai 2006 18:30Ort:
Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum, Reichsratstraße 17, 1. StockVortragender
: Martin DECHANT, Fa. Wien Schall GmbHThema:
NTI Digilyzer DL1
Einladung zu den Vorträgen
Zeitpunkt: Dienstag, 24. Jänner 2006 18:30
Ort:
Phonogrammarchiv der Österr. Akademie der Wissenschaften,Seminarraum,
Reichsratstraße 17, 1. Stock
Vortragende: Mag. Nadja WALLASZKOVITS, Phonogrammarchiv der Öst. Akademie der
Wissenschaften
Thema: Restaurierung historischer Audiomaterialien – Historische, ethische
und ästhetische Aspekte am Beispiel von Aufnahmen aus dem Phonogrammarchiv
Die Restaurierung historischer Audioaufnahmen im Rahmen einer
wissenschaftlichen Quellenausgabe stellt die ausführende Person laufend vor
die Gewissensfrage:
"Dürfen wir, was wir können?" –
Der Vortrag widmet sich einerseits den Aspekten der historischen Aufnahmetechnik im Phonogrammarchiv, den Einflüssen durch Alterung, Lagerung, Abspielung und den daraus entstandenen hörbaren Artefakten, andererseits der heutigen Übertragungstechnik und den zur Verfügung stehenden digitalen Restaurierungswerkzeugen. Schließlich eröffnet sich beim Bearbeiten der jeweiligen Aufnahme die gesamte Palette der ethischen und ästhetischen Fragestellungen, um die Gratwanderung zwischen Authentizität und Zumutbarkeit für den unbedarften Hörer - in Abhängigkeit vom jeweiligen Verwendungszweck der Aufnahme (Analyse, Edition, Hörbeispiel für Vorträge oder Ausstellungen etc.) - zu bewerkstelligen.
Anhand von
Hörbeispielen und Analysen wird versucht, die Grundsätze der klassischen
Restaurierungsethik und ihre Umsetzung auf die Audiorestaurierung
darzustellen.
ÄNDERUNG des TERMINS
Zeitpunkt: Dienstag, 21. März 2006 18:30
Ort:
Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. Stock
Vortragende: Mag. Maya VINSON, Inst. f. Elektroakustik, Univ. f. Musik und
darstellende Kunst
Thema: Anwendung, Bedeutung und Implementation von Sounddesign in
Computerspielen
Das Ziel der Arbeit ist es, die Möglichkeiten der Soundgestaltung
und der Implementation von Sounds in Computerspielen zu betrachten und mit
dem prägenden Medium des Sounddesign, dem Film, zu vergleichen.
Es sollen darüberhinaus Möglichkeiten präsentiert werden, wie der Ton in Spielen durch Integration neuer Technologien realistischer gestaltet werden kann.
Ferner werden die Kategorisierung von Sounds sowie der Implementationsprozess erläutert.
Besonders spannend wird die Tongestaltung bei Computerspielen für Blinde bzw. sehbehinderte Menschen (audio games). Es muss hier eine virtuelle Welt erschaffen werden, die ausschließlich auf Elementen des Sounddesign aufbaut.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
e.kerschbaum@kabsi.at - www.aes-austria.org
Einladung zum Vortrag
Zeitpunkt: Mittwoch,
16. November 2005 19:00 c.t.
Ort: RP6, ORF-Funkhaus Argentinierstraße 30a, 1040 Wien
Vortragender: Peter
Weber, Studer International, Schweiz
Thema: Präsentation des Vista 8 - Mischpults im
RP6
Anlässlich der Inbetriebnahme
des neu gestalteten RP6 lädt Studer Austria gemeinsam mit dem ORF zur
Präsentation des neuen Regieplatzes im Funkhaus Wien. Peter Weber,
Produktmanager und Entwickler von Studer International, Schweiz, gibt einen
Überblick über das installierte Studer VISTA 8 Mischpult. Besonderes
Augenmerk wird dabei auf die speziell auf Live-Anwendungen abgestimmten
Features sowie die besondere Bedienergonomie des Pultes gelegt.
Anschließend bittet Studer Austria zu einem kleinen
Imbiss.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: Dienstag,
20. September 2005 18:00
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. StockVortragender: Dr. Heinrich Pichler
Thema: Analoge und digitale Schnittstellen in der
Audiotechnik
Teil 2 - Schnittstellen, optische und elektrische Leitungen - Anwendungen und Eigenschaften
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
Zeitpunkt: Dienstag,
21. Juni 2005 18:00
Ort: FHS Höchstädtplatz , HS 3.13Vortragender: Dr. Heinrich Pichler
Thema: Analoge und digitale Schnittstellen in der AudiotechnikAnwendungen und
Eigenschaften der in der Audiotechnik üblichen
Schnittstellen.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: Mittwoch,
11. Mai 2005 18:30
Ort: Dompfarramt (Curhaus), Stephanisaal (Hochparterre), Stephansplatz 3
Vortragender: Dr. Gerhard Graber (TU Graz, Inst. für
Breitbandkommunikation)
Thema: Die Akustik im Stephansdom – Ist eine akustische Verbesserung der
Musiziersituation möglich?
Im Stephansdom zu Wien gibt es eine lange Musiziertradition mit unterschiedlichsten Ensemblegrößen und Musizierorten. Seit dem Einbau der Riegerorgel (1991) ist der Hauptmusizierort der vordere Teil des südlichen Seitenschiffs (Friedrichsschiff).
Die Erfahrung zeigt, dass aus akustischer Sicht dieser Ort einige Mängel aufweist: zum einen hören sich die Musiker gegenseitig in ungenügender Weise, zum anderen ist die diagonale Ausrichtung des Ensembles im Raum (von rechts vorne nach links hinten) für die Abstrahlung in den Dom ungünstig, da an den meisten Hörplätzen durch die Säulen ein mehr oder weniger großer Teil des Ensembles abgeschattet wird.
In einem von der Österreichischen Nationalbank finanzierten Forschungsprojekt wurde in Zusammenarbeit von Technischer Universität Graz, Joanneum Research Graz und dem Technischen Büro Rohde-Jegger Acoustics die Akustik des Stephansdoms mit dem Ziel untersucht, akustische Verbesserungsvorschläge für die Musiker am Hauptmusizierort und eine Verbesserung der Abstrahlung in den Dom auszuarbeiten. Dazu wurde zunächst in umfangreichen Messungen der akustische Istzustand des Stephansdoms erhoben. Diese Ergebnisse wurden verwendet, um die raumakustische Simulation des Istzustandes zu kalibrieren. In die Simulation wurden anschließend Verbesserungsmaßnahmen integriert und verschiedene Varianten in ihren Auswirkungen verglichen.
Der Vortrag gibt einen Überblick über den Ablauf des Forschungsprojekts, geht auf die besonderen Herausforderungen ein und skizziert den Weg der Problemlösung. Es werden die Messergebnisse und die wichtigsten Ergebnisse der raumakustischen Simulation mit den unterschiedlichen Verbesserungsvarianten gezeigt. Auralisationsbeispiele mit der g-moll Fantasie von J.S. Bach (BWV 542) sind geplant.
Im Anschluss an den Vortrag ist die Möglichkeit des Besuchs des Stephansdoms gegeben, wobei Domkapellmeister Johannes Ebenbauer die für die Auralisierung verwendete Fantasie in g-moll von J.S.Bach auf der Riegerorgel life spielen wird.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: 12. April
2005 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. StockVortragender: W.A. Deutsch, Inst. f.
Schallforschung d. Öst. Akademie d. Wissenschaften
Thema: NOIDESc: Deskriptoren für
Lärmsignale
Lärm ist unerwünschter Schall, physikalisch messbar als Schalldruck über Frequenz, Raum und Zeit. Zeit-Frequenzdarstellungen (Time Frequency Representations, TFR) von akustischen Signalen sind daher prinzipiell geeignet, eine physikalisch hinreichende Beschreibung von Schallereignissen zu geben. Das Erkennen, Bewerten und Klassifizieren von Schallereignissen setzt die (semi)automatische Segmentierung und Auswertung von TFRs voraus.
Im Laufe der letzten Jahre wurden zahlreiche Vorschläge zur Erarbeitung eines allgemein anwendbaren Deskriptor-Schemas für Audiosignale diskutiert. Die wichtigsten Ergebnisse haben Eingang gefunden in den für Multimedia – Zwecke entwickelten Standard MPEG-7 Teil 4 (Audio). Nachdem der Standard keinerlei Einschränkungen bezüglich der Signalart und –Eigenschaften auferlegt, kann er auch für Lärmsignale eingesetzt werden. Der Vortrag beschreibt die Entwicklung und Implementierung von Deskriptoren und Features zur Klassifikation von Lärmsignalen:
· Basic
Instantaneous: (momentane) Wellenform und Pegel-Werte
· Basic Spectral: das Log-(Bark-, ERB-, Mel-) Frequenz-Leistungsspektrum und
spektrale Flachheit (einschließlich spektrales Zentroid) und spektrale
Ausdehnung
· Signal Parameter: Grundfrequenz quasiperiodischer Signale und
Harmonizität
· Klangfarbe temporal: Log Attack Zeit und temporales Zentroid
· Klangfarbe spektral: spezielle spektrale Features auf linearer
Frequenz-Skala, einschließlich ein spektrales Zentroid sowie spezifische
spektrale Features für harmonische Signalteile, einschließlich harmonisches
spektrales Zentroid, spektrale Abweichung, Ausdehnung und Variation
· Spektrale Basis-Repräsentationen: Features, die zur automatischen
Klassifikation und Wiedererkennung dienen, wie Basisfunktionen, die die
Projektion in einen niederdimensionalen Raum erlauben um Kompaktheit für die
Wiedererkennung zu gewinnen.
Das Projekt wird vom bmvit im Rahmen ISB2 (Innovatives System Bahn) unterstützt.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing.
Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: 8. März
2005 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. Stock
Vortragende: Dr. Susanne Windischberger, Philips Sound Solutions
Thema: Telekomlautsprecher im Spannungsfeld zwischen HiFi und
Miniaturisierung
Die kontinuierliche Miniaturisierung in der Elektronik ermöglicht mobile Anwendungen mit einer steigenden Anzahl von Funktionen und immer kleineren Abmessungen. Trotz extremer Rechen-leistungen der Prozessoren werden die Elemente, die die Schnittstellen zum Benutzer darstellen, bestimmend für die minimale Dimension der Geräte. Im Gegensatz zum Display, welches einen möglichst großen Teil der Oberfläche belegen soll, wird von einem akustischen Wandler erwartet, dass seine Größe und das gesamte notwendige Volumen auf ein Minimum reduziert wird und seine Form den vorhandenen Platz optimal ausnützt.
Dies steht im Widerspruch zu den steigenden Anforderungen bezüglich akustischer Qualität, Laut-stärke und der Diversifikation der Anwendungen. Die Folge ist eine kontinuierliche Annäherung an die technisch - physikalischen Grenzen aller Komponenten im dynamischen Lautsprecher und die Suche nach anderen, für die entsprechende Anwendung optimierten Wandlerprinzipien.
Als Schlüsselelement beim dynamischen Wandler stellt sich die Membran heraus. Sie soll möglichst hohe Luftvolumina bewegen können aber eine lineare Federkennlinie aufweisen. Weiters soll sie eine hohe Compliance ermöglichen jedoch keine höheren Moden produzieren. Eine Optimierung der widersprechenden Anforderungen kann nur mehr mit FE – Simulationen sinnvoll durchgeführt werden, die viele entscheidende Membran- und Prozessparameter berücksichtigen.
Mit neuen Wandlerprinzipien versucht man, anwendungsspezifische Nachteile des dynamischen Wandlers zu umgehen. Dazu gehören vor allem die notwendige Dicke, die beschränkten Form-variationen und die nicht vorhandene Skalierbarkeit. Im Fokus bei mobilen Anwendungen bleiben aber wie beim dynamischen Lautsprecher immer eine hohe Volumeneffizienz und ein minimales Gesamtvolumen.
Der Vortrag gibt einen Überblick über die bei PSS durchgeführten theoretischen und experimentellen Arbeiten und neue Produkte in diesem Bereich.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: 20. Jänner
2005, 18:30 - 20:00
Ort: Universität für Musik und darstellende Kunst Wien, Hörsaal 10, 1. Stock,
Singerstr. 26A (Eingang bei kleiner grüner Tür unter Schild
"Antquitäten")Vortragender: Dr. Carl Poldy
Thema: PSYCHOAKUSTISCHER BASS UND DIE ECHTE LANDKARTE FÜR
MUSIK
Das Thema wird anhand einiger
Beispiele mit visuellen und akustischen Demonstrationen dargestellt.
Differenztöne - Der Geigenvirtuose und Komponist Giuseppe Tartini kannte
diesen Effekt aus der Praxis. Er hat seinen Schülern geraten, bei
Doppelgriffen, als Indiz für sauberes Intonieren, auf einen tiefen Ton zu
horchen. Dieser Ton ist im Schallsignal physikalisch nicht vorhanden.
Zum Beispiel, wenn man beim A-Dur-Akkord [A Cis E] mit (440 550 660 Hz) nur
die zwei oberen Töne [Cis E] spielt, hört das Ohr den Differenzton A = (660 -
550) = 110Hz im Bass (2 Oktaven unter dem Kammerton a1 /440 Hz). Dabei wird
diese kleine Terz zu einem vollen A-Dur-Akkord (110 550 660 Hz) ergänzt.
Mobiltelefon - Lautsprecher -
Diese funktionieren erst ab etwa 400 Hz. Mit dem oben beschriebenen
Mechanismus kann man den fehlenden Bass vortäuschen.
Voraussetzungen dafür:
1) reine Stimmung (nicht die übliche Klavierstimmung) und
2) obertonreiche Töne.
Der Klang wird mit dem temperierten Klang bei gleicher objektiver Klangfarbe
verglichen.
Sichtbare Harmonie - Es geht
darum, das harmonische Geschehen in einem Musikstück nicht nur sichtbar zu
machen, sondern auch übersichtlich. Dafür braucht man eine geeignete
Landkarte. Wenn man darauf von Ton zu Ton schreitet, sollen die kleinsten
Schritte solche Töne verbinden, die harmonisch am stärksten verwandt sind.
Die Klaviertastatur erfüllt diese Bedingung nicht, da die Beziehung zwischen
A und Ais eher dissonant ist.
Das Tonnetz - Auf dem Tonnetz
sind [A Cis] und [A E] nächste Nachbarn.
Wir werden während des Abhörens von Musikbeispielen (z.B. Mozart
Klarinettenquintett, Zauberflöte, etc.) auf dem Tonnetz das harmonische
Geschehen verfolgen.
Tristan-Akkord - Das Tonnetz
ist grundsätzlich 2-dimensional (Y-Achse für Quinten 2:3, X-Achse für Terzen
4: 5). Für manche Musikstücke braucht man eine dritte Dimension (Z-Achse für
reine Septimen 4:7), z.B. Dominantseptakkord A7 in D-Dur mit G = 770 Hz.
Dabei kommen die ersten drei nicht-trivialen Primzahlen 3, 5, 7 zur
Geltung.
Der rätselhafte Tristan-Akkord, dessen Deutung Musikwissenschaftler lange
beschäftigt hat, wird schlicht als Spiegelbild (Moll) des 4 - 5 - 6 - 7
Schemas interpretiert.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: 14.
Dezember 2004 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. Stock
Helmut Kühnelt,
(Institut f. Wr. Klangstil, Universität f. Musik u. darst. Kunst Wien)
Aktuelle Forschungsprojekte zur Flöte am
IWK
1) Dreidimensionale Simulation der Klangerzeugung in Flöten: Die Wechselwirkung von Luftströmung des Strahls und Schallfeld im Instrument bestimmt die Klangerzeugung bei Flöten und labialen Orgelpfeifen. Mit Hilfe von dreidimensionalen Computersimulationen in realistischen Geometrien werden die strömungsakustischen Vorgänge in der Flöte nachgebildet und analysiert. Die dabei eingesetzte Lattice-Boltzmann-Methode wird vorgestellt. Das Verhalten des schwingenden Systems in Zeit- und Frequenzbereich wird ebenso betrachtet, wie die erzeugte Schallleistung und die Auswirkung kleiner Änderungen der Geometrie im Labialbereich auf den Klang.
2) Methoden zur Messung akustischer Parameter bei Flöten: Die Messung der Eingangsimpedanz stößt aufgrund physikalischer Gegebenheiten bei Flöten auf grundsätzliche Schwierigkeiten. Mögliche Messmethoden - u.a. mit dem am IWK entwickelten BIAS-System - werden vorgestellt und ihre Praxistauglichkeit als Werkzeug für die Entwicklung und zur Qualitätskontrolle im Flötenbau diskutiert.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Ewald Kerschbaum
Einladung zum Vortrag
Zeitpunkt: 19. Oktober
2004 18:30
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. Stock
Piotr Majdak und
Holger Waubke, Inst.f. Schallforschung, OeAW
Aufbau und Auswertung von Vielkanalmessungen (Mikrofonarray) zur Lokalisation
von Schallquellen
Es wird ein am Institut für Schallforschung der ÖAW entwickeltes Microfonarray-System (64 Kanäle) zur Lokalisation von Schallquellen im Raum vorgestellt. Berichtet wird über verschiedene Ansätze der Lokalisation; Beamformingverfahren und akustische Holographie. Erste Ansätze werden am Beispiel von Vorbeifahrten von Hochgeschwindigkeitszügen demonstriert.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Ewald Kerschbaum
Einladung zum Meeting/Vortrag
Zeitpunkt: 21.
September 2004 18:15
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. Stock
1. Piotr Majdak
Aufbau von Experimenten zur Wahrnehmung interauraler Laufzeitdifferenzen von
Cochlea-Implantat-Trägern
Die Wahrnehmung interauraler Laufzeitdifferenzen (Interaural Time Differences, kurz ITD) beim Normalhörer zeigt Abhängigkeiten vom Schallpegel, der interauralen Pegeldifferenz, der Frequenz und der binauralen Übereinstimmung der Frequenz der Stimuli. In Experimenten zur Untersuchung der ITD-Diskriminination werden diese Parameter üblicherweise konstant gehalten und lediglich die interaurale Phase als unabhängige Variable betrachtet und variiert. Obwohl die Abhängigkeit der ITD-Wahrnehmung bei Cochlea-Implantat-Trägern (CI-Trägern) noch nicht zur Gänze erforscht ist, können die meisten Zusammenhänge aus der Literatur für Normalhörer übernommen werden. Aufgrund der großen interindividuellen Unterschiede diverser psychoakustischer Parameter (wie Stromstärke, ILD oder tonope Position der elektrischen Stimulation), wird die notwendige Konfiguration für jede Versuchsperson in psychoakustischen Experimenten einzeln ermittelt. In diesem Vortrag werden die einzelnen Vortests und deren Optimierung erläutert.
2. Bernhard Laback
Temporal fine structure and onset/offset cues in ITD-based lateralization of
bilateral Cochlear Implant
listeners
Several studies reported generally higher lateralization thresholds upon interaural time delay (ITD) of bilateral Cochlear Implant listeners (CI) compared to normal hearing (NH) listeners. In addition, the thresholds appear to increase much more rapidly with increasing stimulus (pulse) rate than in NH listeners. Up to now, it has not directly proven that CI listeners are sensitive to ITD in the temporal fine structure and how this sensitivity relates to the sensitivity to ITD in the signal onset and offset. This study directly determined the relative importance of ITD in the temporal fine structure and in onset and offset with bilateral CI listeners, applying an lateralization task. To exclude cofounding effects of interaural level difference (ILD) in the onset/offset portions , a four-pulse stimulus was used, which allowed a strict separation between signal onset/offset and fine-structure. Conditions with ITD in the stimulus onset and/or offset only were tested to examine if the particular importance of ITD in the stimulus onset, as known from normal hearing, can also be found in CI listeners. All types of ITD were tested as a function of pulse rate, since the relative contribution of fine structure and gating delay is expected to depend on the pulse rate. Four of the five CI listeners tested up to now showed rather poor ITD sensitivity, making it impossible to discriminate between different measurement conditions. One CI listener, however, showed sensitivity to ITD in the temporal fine-structure up to 800 pulses per second, the highest rate tested. In accordance with NH listeners, the importance of the signal onset for ITD-based lateralization increases with pulse rate.
Beide Beiträge werden in deutscher Sprache gehalten.
Im Anschluß an die Vorträge findet um ca. 19:00 die Generalversammlung statt. Sie ist nur Mitgliedern zugänglich.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
Einladung zum Vortragsabend bei AKG
Zeitpunkt: 20. April
2004, 19:00
Ort: AKG Acoustics GmbH, Lemböckgasse 21 - 25 (U6 Siebenhirten oder über
Perfektastrasse parallel zur U6)1. Richard Barnert
The NeXt Generation C 414
Produktpräsentation
der neuen C 414-Modelle: C 414B-XLS / C 414B-XLII2. Dominik Biba
Messung und Simulation von
Membranen
Durch den Einsatz bildgebender
Verfahren, wie dem Laservibrometer, kann die Gültigkeit von
Finite-Elemente-Berechnungen von Membranen unmittelbar überprüft werden.
Speziell der Vergleich von Rechnung und Messung des mechanischen
Schwingungsverhaltens im Vakuum erlaubt einen präzisen Abgleich der
Materialparameter. Es werden Mess- und Rechenergebnisse des
Schwingungsverhaltens dynamischer Wandler vorgestellt.3. Thomas Stubics
Professionelle Studiokopfhörer OHNE Kabel
Im Studio- und
Broadcastbereich findet man für Kopfhörer ein breites Anwendungsspektrum, da
sie gegenüber Lautsprechern viele Vorteile bieten und in kritischen
Situationen unersetzbar sind. Jedoch findet man hier fast ausschließlich
kabelgebundene Lösungen, da bisherige Drahtlossysteme den professionellen
Anforderungen, vor allem an die Klangperformance, nicht gerecht werden
konnten.
AKG stellt nun mit dem Hearo 999 Audiosphere II den ersten "Digital Wireless"
Kopfhörer vor, der auch diesen hohen Ansprüchen, mit Schwerpunkt auf
Akustikdesign, gerecht wird.
Präsentation und Demonstration4. Anläßlich des 30. Jahrestags der Gründung
der österreichischen Sektion der AES:
Unter dem Motto: "AES-Austria
die ersten 30 Jahre" werden alle Gründungsmitglieder herzlichst eingeladen im
Rahmen eines Podiumsgesprächs ihre eigene AES-Austria - Zeit zu schildern.
Geschichten, Bilder, Highlights, Enttäuschungen bitte mitbringen.
Mit einem Spezialbeitrag über die AES-Convention in Wien von E. Kerschbaum.
Einleitende Worte und Moderation: W.A. Deutsch
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl.-Ing. Ewald Kerschbaum
Bitte um Info, ob wir mit
Ihrer Teilnahme rechnen dürfen.
(e.kerschbaum@kabsi.at oder 0676 5233678)
Einladung zum
Meeting/Vortrag
Zeitpunkt: 23. März 2004 18 Uhr c.t.
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften, Seminarraum,
Reichsratstraße 17, 1. Stock
Lukas Hebenstreit
Das Wolftonverhalten der Geige
Einführung in die
Funktionsweise und Akustik der Geige.
Was ist der Wolfton?
Das Wolftonverhalten der Geige unter spezieller Beachtung des Einflusses der
Saiten auf das Wolftonverhalten der Geige.
Messaufbau (das computerunterstützte Geigenmesssystem VIAS) und wie es besser
ginge.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
(Generalsekretär AES-Austria)
EINLADUNG zum
Meeting/Vortrag
Zeitpunkt: 18. November 2003 18 Uhr c.t.
Ort: 1030 Wien, Dietrichgasse 25, SiemensFORUM, Seminarraum 3
Christophe Beaugeant
Tutorial on Noise Reduction
Während der letzten Jahrzehnte hat die Mobilität einen wichtigen
Platz in der Telekommunikation eingenommen. Kommunikationsbausteine, wie der
PC, das Telefon, oder die Tagesordnung, haben sich von ihrem ursprünglichen
Platz aus die ganz Welt zu eigen gemacht. Das Telefonieren im Auto, an der
Bahnstation oder am Flughafen ist in Industriestaaten ganz normal, und
Experten sind der Meinung, dass das erst der Anfang der Kommunikationskultur
der modernen Nomaden ist. Eine Folgeerscheinung dieser Entwicklung ist die
immer mehr durch Umweltgeräusche verseuchte Kommunikation, was wiederum
herabgesetzte Verständlichkeit, Gesprächsqualität oder verminderte Umsetzung
bei Spracherkennungssystemen bewirkt. Folglich muß das Signalprozessing in
der Lage sein, den Einfluß des Geräusches vermindern zu können. Solche
Technologien arbeiten in mobilen Bausteinen, ohne dass der Benutzer es merkt,
und viel Aufwand wird getrieben, um die bestehenden Systeme zu verbessern
bzw. neue Technologien in dieser Richtung zu
entwickeln.
Der Vortrag will einen Überblick über die Problematik in Zusammenhang mit geräuschkorrumpierter Sprache geben und bringt die verschiedenen Techniken im Hinblick auf diese Art der Rauschunterdrückung ein. Vier Anwendungen werden speziell behandelt und und bilden ein allgemeines Forum der Lösungen, die bereits existieren.
Zuerst werden Rauschverminderungssysteme, die auf der Signalanalyse in der Frequenzdomäne basieren, vorgestellt; gegenwärtig quasi Standard für Signalverbesserung im Bereich der Sprache. Mehr auf die Spracherkennung zugeschnittene Rauschverminderung basierend auf dem Sprach- und/oder Rauschmodell werden ebenfalls beschrieben. Lösungen durch Mikrophonaufstellung, letztendlich in Verbindung mit digitalem Signal-Prozessing, werden hauptsächlich im car-audio oder in visio-conference Systemen mit großem Erfolg eingesetzt. Zum Schluß werden noch aktive Geräuschkontrolltechniken zur Verbesserung des Lautsprechersignals in lärmendem Umfeld beschrieben.
Audiocodierung ist heute auch in vielen Geräten der Unterhaltungselektronik zu finden. Der Vortrag gibt einen Einblick in die Funktionsweise, Geschichte und aktuelle Anwendungen von Audiocodierverfahren. Obwohl im klassischen Bereich der "CD-Qualität" (wie immer man sie definieren mag) schon seit sechs Jahren wenig Änderungen am Stand der Technik zu verzeichnen sind, gibt es weiterhin aktive Forschung in Teilgebieten der Audiocodierung. Ein Überblick insbesondere parametrischer Verfahren zeigt diese aktuellen Forschungsthemen auf.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
(Generalsekretär AES-Austria)
EINLADUNG zum
Meeting/Vortrag
Zeitpunkt: 30. Oktober 2003, 18 Uhr 30
Ort: Helmut-List-Halle,Graz, Waagner-Biro-Strasse 98a
Präsentation der Helmut-List-Halle
Ablauf :
18:30-19:00 Ankunft und Begrüssung (steirischer Herbst,NN)
19:00-19:20 Architektur und akustische Konzeption der Helmut-List-Halle
(Arch. Markus Perthaler)
19:20-19:40 Elektroakustische Anlagen und Beschallungskonzepte der Halle
(rohde-jegger acoustics,DI Rohde)
19:40-20:00 Pause und Eintritt
20:00-21:30 Generalprobe "Lost Highway" von Olga Neuwirth
21:30-22:00 Erläuterungen zum "ambisonic"- Setup der Produktion (DI
Noisternig)
ca 22:10 Ende und Abfahrt
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Interessenten bitten wir um rasche Rückmeldung ,da ein Bus
organisiert werden muß (Abfahrtsmodalitäten werden noch bekannt gegeben).
Für privat Anreisende findet sich umseitig eine Anfahrtskizze.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
(Generalsekretär AES-Austria)
EINLADUNG zum
Meeting/Vortrag
Zeitpunkt: 16. September 2003 18 Uhr c.t.
Ort: Technikum Wien, Wien 1200, Höchstädtplatz 5, Hörsaal 1.05, U2
Schottenring, Linie 31 Höchstädtplatz oder U6 Dresdner Straße, 1 Station mit
37A Richtung Dänenstraße bzw. N Richtung Friedrich-Engels-Platz
Prof. Dr. Karlheinz Brandenburg
Audiocodierung: von mp3 zu parametrischer CodierungAudiocodierung
ist heute in vielen Geräten der Unterhaltungselektronik zu finden. Der
Vortrag gibt einen Einblick in die Funktionsweise, Geschichte und aktuelle
Anwendungen von Audiocodierverfahren. Obwohl im klassischen Bereich der
"CD-Qualität" (wie immer man sie definieren mag) schon seit sechs Jahren
wenig Änderungen am Stand der Technik zu verzeichnen sind, gibt es weiterhin
aktive Forschung in Teilgebieten der Audiocodierung. Ein Überblick
insbesondere parametrischer Verfahren zeigt diese aktuellen Forschungsthemen
auf.
Unser Dank gilt der
Fachhochschule Technikum Wien für die Bereitstellung der Räumlichkeit und der
notwendigen Facilities.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
(Generalsekretär AES-Austria)
EINLADUNG zur
GENERALVERSAMMLUNG 2003
Ort: Technikum Wien, Wien 1200, Höchstädtplatz 5, Hörsaal 1.05
Zeitpunkt: 16. September 2003 im Anschluß an das Meeting, das um 18 Uhr
c.t.beginnt.
Tagesordnung:
1) Eröffnung und Feststellung
der Beschlußfähigkeit
2) Genehmigung des letzten Protokolls
3) Bericht des Präsidenten
4) Bericht des Kassiers
5) Bericht der Rechnungsprüfer
6) Entlastung des Vorstandes
7) Allfälliges
Anträge zur Tagesordnung sind dem Vorstand 2 Wochen vor der Generalversammlung schriftlich bekanntzugeben
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
eh.
(Sekretär AES-Austria)
EINLADUNG zum Meeting/VortragZeitpunkt: 8. April 2003 18:30 c.t.
Ort: AKG Acoustics, Wien 1230, Lemböckgasse 21-25
1. Vortragender: Dr.
Richard Barnert (AKG)
Thema: Der sichtbare Klangunterschied von Mikrophonen
Oft kommt es vor, daß sich ein Tonmeister für eine Anwendung zwischen zwei
Mikrophonen entscheiden muß, die beinahe identische technische
Spezifikationen aufweisen und daher ähnlich klingen sollten. Und trotzdem
kann es passieren, daß sich die beiden Kandidaten sehr unterschiedlich
verhalten, sobald sie zur Anwendung gelangen. Doch wie ist das möglich? Diese
Frage stellt sich natürlich und es wird offensichtlich, daß die üblicherweise
publizierten Spezifikationen das tatsächliche Verhalten des Mikrophons nicht
hundertprozentig beschreiben können. Es muß also noch weitere "versteckte"
Eigenschaften geben, die zur Klangbeschreibung wichtig und notwendig sind.
Aber wie können diese unsichtbaren Eigenschaften von Mikrophonen sichtbar
gemacht werden?
Die Papers zum Vortrag können Sie von http://www.richardbarnert.com/english/Events/Events.htm
downloaden!
2. Vortragender: Mario
Siokola (AKG)
Thema: Das drahtlose Mikrofonsystem AKG WMS 4000
Beim WMS 4000 handelt es sich
um das neueste drahtlose Mehrkanal-Mikrofonsystem von AKG, wobei die Betonung
auf "System" liegt. In der Tat handelt es sich um mehr als 14 modulare
Systemkomponenten, die, je nach Ausbaustufe, eine Fülle von neuartigen
Features für professionelle Anwender drahtloser Mikrofonsysteme bieten. So
beinhaltet das WMS4000 unter anderem eine hochgenaue Restspielzeitanzeige,
digitalen Pilotton, Ethernet Schnittstelle, nachprogrammierbares
Frequenzmanagement, ein anpassungsfähiges Antennensystem und PC-Steuerung.
Eine Beschreibung des AKG WMS4000 finden Sie auf der AKG-Homepage www.akg.com
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at
EINLADUNG zum Meeting/VortragZeitpunkt: 11. März 2003 18 Uhr c.t.
Ort: Technikum Wien, Wien 1200, Höchstädtplatz 5, Hörsaal 1.05, U2 Schottenring, Linie 31 Höchstädtplatz oder U6 Dresdner Straße, 1 Station mit 37A Richtung Dänenstraße bzw. N Richtung Friedrich-Engels-Platz
Vortragender: DI Dr. Heinrich Pichler
Thema: Das Fernsehen - Von den Anfängen bis 1945
· Bilddarstellung: Scanningverfahren: Mechanisch, Elektronisch; Wiedergabeprinzipien
Unser Dank gilt der
Fachhochschule Technikum Wien für die Bereitstellung der Räumlichkeit und der
notwendigen Facilities.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at
EINLADUNG zum Meeting/VortragZeitpunkt: 14. Jänner 2003 17 Uhr st
Ort: Österreichische Mediathek, Marchettischlössl, Gumpendorferstraße 96, 2. Stock 57A Haltestelle Hirschengasse
Vortragender: Dr. Rainer Hubert
Führung durch das Digitalarchiv der Österreichischen Mediathek
Start im Marchettischlössl (2.
Stock, dann 1. Stock):
· Gesamtüberblick des Systems - die einzelnen Module (Datenbank,
Massenspeicher, Digitalisierungsstationen) und ihr Zusammenspiel in einem
teilweise automatisierten Workflow
· Benützung (Voxbox = lokal; Website mit Online-Katalog und akustischen
Galerien) + Katalogisierung in der Webgasse:
· Medienroboter (Massenspeicher)
· Digitalisierungsstationen
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
(Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at
EINLADUNG zum Meeting/VortragZeitpunkt: 10. Dezember 2002 18 Uhr 30 ct
Ort: Phonogrammarchiv der Österr. Akademie der Wissenschaften Seminarraum, Reichsratstraße 17, 1. Stock
Vortragender: Johannes Spitzbart
Thema: Qualitätskontrolle bei CD-R-Rohlingen mit Focus Symbiose Brenner-Rohling
Es wird eine Methode vorgestellt, mit deren Hilfe die Kompatibilität zwischen Writer und CD-R-Rohling sowie deren Einfluß auf die Restlebenszeit und/oder die Lesbarkeit der beschriebenen CD-R festgestellt werden kann. Die Basis der Qualitätskontrolle bildet ein Studer D730 CD-Player, von dem die verschiedenen Fehlersignale einem Mikrokontroller zugeführt werden, wo sie über eine geeignete Software verarbeitet und über eine serielle Schnittstelle an einen PC weitergeleitet werden. Es wurden Tests auf zwei verschiedenen Rekordern mit fünf verschiedenen CD-R Marken bei unterschiedlichen Brenngeschwindigkeiten durchgeführt, welche signifikante Unterschiede zwischen den Medien und geringere Unterschiede zwischen den Rekordern zeigten. Nur zwei der fünf Marken zeigten zufriedenstellende Ergebnisse für eine Langzeitspeicherung. Dieser Umstand zeigt auf, dass eine Evaluierung von verschiedenen CD-R-Typen für Anwendungen als Langzeitdatenspeicher von entscheidender Wichtigkeit ist.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Mit freundlichen Grüßen
Dipl. Ing. Franz Lechleitner
e.h.
(Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at
EINLADUNG zum
Dia-Vortrag
Edwin Pfanzagl, Leiter der Abteilung Akustik bei den Salzburger
Festspielen, wird am
Montag, 9.12. um 19 Uhr
im Gottwaldsaal in der Rienößlgasse 12, 1040 Wien (ehem. Institut für Elektroakustik, 2.Stock)
einen Dia-Vortrag über Music Recording Studios in New York halten.
Er wird vor allem Avatar (vormals "Power Station"), Hit-Factory, Quad-Recording, "Electriy Lady Studios" (Jimi Hendrix) und Waterfront Recording Studios (Lenny Kravitz) vorstellen.
Dazu sind alle Interessenten herzlich eingeladen.
Gruß,
Felix Dreher
Student Section Wien
EINLADUNG zum AES- Section Meetingam 5.November 2002 – 18:00
Österreichische
Akademie der Wissenschaften Institut für Schallforschung –
Phonogrammarchiv
1010 Wien, Reichratsstrasse 17, 1. Stock rechts
Holger Waubke, Florian Kragl und Peter Balazs (Institut für Schallforschung der ÖAW)
MPEG-7 Audio (ISO/IEC JTC1/SC29/WG11), eine Kurzbeschreibung
MPEG-7 Audio bietet 5 Technologien an: ein Audio Description Framework (einschließlich skalierbarer Sequenzen, Low-Level Deskriptoren und ein vereinheitlichtes „Silence“ Segment), Beschreibungswerkzeuge für die Klangfarbe von Musikinstrumenten, Schallerkennungs-Werkzeuge, Beschreibungswerkzeuge für Spracherkennung und Melodie-Beschreibungswerkzeuge.
MPEG-7 Audio Description Framework
Im wesentlichen bieten sich zwei Möglichkeiten an, Low-Level Audio Features einzusetzen. Die erste nimmt Werte, die aus einzelnen Samples errechnet werden, die zweite benützt Segmente um Bereiche zu markieren, die innerhalb der Signale ähnlich oder unähnlich sind. Beide Möglichkeiten sind in den Low-Level Deskriptoren implementiert: für skalare Werte, wie Pegel oder Grundfrequenz und für Vektor-Typen, z.B Spektren. Jeder dieser Deskriptoren kann unmittelbar für ein Segment als einzelner Wert oder für eine Folge von Samples bestimmt werden, je nachdem was die Anwendung erfordert.
Die solcherart bestimmten Werte können selbst wieder im Rahmen eines vereinheitlichten Interfaces in skalierbaren Sequenzen weiterverarbeitet werden: skalierbare Folgen gestatten das progressive Down-Sampling der Daten, je nach Applikation, Bandbreite oder Speicherbedarf. Der entstehende „Baum“ kann auch die verschiedensten Summenwerte aufnehmen, wie Minimum, Maximum, Mittelwerte und Varianzen der Deskriptorenwerte.
Die 7 Zeitfunktions- und
spektralen Deskriptoren werden grob in folgende Gruppen zusammengefasst:
* Basic: Instantaneous (momentan) Wellenform and Pegel-Werte
* Basic Spectral: das Log-(Bark-) Frequenz-Leistungsspektrum und spektrale
Flachheit (einschließlich spektrales Zentroid) und spektrale Ausdehnung
* Signal Parameter: Grundfrequenz quasiperiodischer Signale und
Harmonizität
* Klangfarbe temporal: Log Attack Zeit und temporales Zentroid
* Klangfarbe spektral: spezielle spektrale Features auf linearer
Frequenz-Skala, einschließlich ein spektrales Zentroid sowie spezifische
spektrale Features für harmonische Signalteile, einschließlich harmonisches
spektrales Zentroid, spektrale Abweichung, spektrale Ausdehnung und spektrale
Variation
* Spektrale Basis-Repräsentationen: Features, die zur Wiedererkennung dienen,
wie Basisfunktionen, die die Projektion in einen nieder-dimensionalen Raum
erlauben um Kompaktheit für die Wiedererkennung zu gewinnen.
Während Low-Level Audio Deskriptoren sich in allen möglichen Applikationen wertvoll zeigen, erbringt bereits das spektrale Flachheitsmaß einen robusten Indikator für das Matching von Audio-Signalen. Anwendungen schließen ein: Audio Fingerprinting, Identification von Audio in Datenbasen mit bekanntem Inhalt, z.B. für das Auffinden von Signalen ohne Metadaten oder ohne Annotierung (Copyrights).
Ein zusätzliches aber höchst einfaches Tool ist im “Silence”-Deskriptor verfügbar, der als Hilfe für weitere Segmentierungen herangezogen wird.
Figure 1: MPEG-7 Audio-Segmentierungs-Schema [1] für ein Soundfile (vgl. unten OeAW_ISF: STOOLS-STx für Applikationen mit simultaner Verarbeitung einer Vielzahl von Soundfiles).
Figure 2: STOOLS-STx Multi-Layer Segmentierungssystem für Soundfiles: Sound Segmentadressen, Segment-Identifiers, optionale Links und Content Deskriptoren (Annotierungen) sind in Referenz- (Meta-) Datenfiles abgespeichert. Die relative Adressierung (Segment[Beginn, Ende, Dauer] +/- Zeit[h, min, s, ms, Samples])erlaubt nicht nur Überlappung in eine Richtung, sondern auch bidirektionale Segment- und Offsetspezifizierungen [2].
High-Level Audio Description Tools
Vier Gruppen von High-Level Deskriptoren sind derzeit spezifiziert: Schallerkennung, Klangfarbe von Musikinstrumenten, gesprochene Sprache und melodische Kontur.
Klangfarbe von Musikinstrumenten:
Klangfarben-Deskriptoren bauen auf perzeptiven Features der Instrumentenklänge auf. Klangfarbe ist derzeit wie folgt definiert:
Klangfarbe ist jene Eigenschaft einer auditiven Empfindung wonach ein Zuhörer zwei in gleicher Weise dargebotene Schälle, die dieselbe Lautheit und dieselbe Tonhöhe hervorrufen als unterschiedlich beurteilen kann. Klangfarbe ist neben Tonhöhe, Lautstärke und anderen Eigenschaften, ein Merkmal der Hörempfindung, das sich mehrdimensional auf verschiedenen Skalen ausdrücken läßt, z.B. hell-dunkel oder scharf-stumpf usw. Die Klangfarbe wird im wesentlichen durch den Verlauf des Spektrums bestimmt [NTG 1704].
Anmerkung: die Klangfarbe hängt in erster Linie vom Spektrum des Signals ab, aber ebenso von der Wellenform, dem Schalldruck, der Lage der Frequenzen im Spektrum und von den zeitlichen Charakteristika.
Ziel der Klangfarben-Deskriptoren ist es, die perzeptuellen Features mit Hilfe eines reduzierten Satzes von Deskriptoren zu beschreiben. Dazu gehören die Beschreibungen, wie Einschwingvorgänge (Attack), Helligkeit, Klangfülle usw. Vergleiche auf akustischer Basis wurden bereits zahlreich durchgeführt und haben für die Differenzierung von Instrumentenklassen eine experimentell abgeleitete Distanz-Metrik ergeben (vgl. dagegen Hornbostl-Sachs, Instrumentensystematik).
Sound Recognition Tools
Sound Recognition Deskriptoren und Beschreibungs-Schemata bilden eine Sammlung von Tools für die Indizierung und Kategorisierung von allgemeinen Schällen, insbesodere Ton-Effekten. Die Recognition Tools unterstützen die automatische Identifikation, wie auch die Aufstellung von Taxonomien von Signalklassen, bzw. die Spezifikation der Sound Recognizer.
Die Sound Recognition Tools verwenden Spectral Basis Deskriptoren als Grundlage. Die Basisfunktionen werden weiter verarbeitet in eine Sequenz von Zuständen, die ein oder mehrere statistische Modelle beinhalten, z.B. Hidden Markov (HMM) oder Gaussian Mixture Modelle (GMM) aber auch Artifizielle Neuronale Netzwerke (ANNs), die auf Übergangswahrscheinlichkeiten trainiert werden. Diese Modelle werden für sich selbst errichtet oder sie sind assoziiert zur Semantik der Originaltöne und/oder können sie verwendet werden, um neue Signale zu kategorisieren (Generalisierung und Differenzierung), bzw. dienen sie als Input für weitere, modifizierte Recognition Systeme.
Spoken Content Description Tools
Spracherkennungs – Tools für frei gesprochene Sprache ermöglichen die Erkennung von Wörtern in einem Audio-Stream. In Kenntnis der Tatsache, dass die derzeit verfügbaren Automatic Speech Recognition (ASR) Technologien nur begrenzt einsatzfähig sind, und man stets mit Out-of-Vocabulary Utterances zu rechnen hat, muss ein Kompromiss zur Kompaktheit und Robustheit im Rahmen der Such-Algorithmen eingegangen werden. Zur Erreichung dieses Zieles werden die Tools in erster Linie dazu eingesetzt, Zwischenergebnisse für die Automatic Speech Recognition zu erbringen. Nichtsdestotrotz können die ASR-Technologien sinnvoll in Retrieval-Szenarios eingesetzt werden.
Melody Description Tools
Die Melodie-Kontur-Beschreibung soll eine kompakte Repräsentation der melodischen Information liefern, die für Ähnlichkeitsvergleiche, z.B. query-by-humming eingesetzt werden kann. Das Melody Contour Description Scheme führt eine 5-stufige Kontur ein, in der die aneinanderliegenden Intervallabstände kodiert sind (Intervallschritt auf/ab, groß/klein...). Gemeinsam mit der Basis-Rhythmus-Information (Zählung der Takte), erhält man ein erstaunlich brauchbares Tool für Melodie-Matching in Abfrageprozeduren.
Applikationen, die eine genauere Schätzung der Melodie erfordern können auch Cent-Werte eingesetzt werden. Zur genaueren Erfassung des Rhythmus wird ferner das Log-Verhältnis der Zeitdifferenzen zwischen den Onsets der Noten bestimmt. Schließlich werden sonst verfügbare Meta-Daten wie z.B. Noten, Tonart, Metrum usw. erfasst, soferne verfügbar.Quellenangaben:
Der vorstehende Text wurde bearbeitet, ergänzt und frei übersetzt nach [1]
[1] José M. Martínez
(UPM-GTI, ES)
http://ipsi.fhg.de/delite/Projects/MPEG7/Documents/w4031mpeg7overview.htm
[2] STx User's Manual
and Reference Guide
http://www.kfs.oeaw.ac.at/software/stx_manual/index.htm
Einladung zum
Meeting/Vortrag
Zeitpunkt: 20. November 2001 18 Uhr 30, pünktlich
Ort:
Phonogrammarchiv der
Österr. Akademie der
Wissenschaften
Seminarraum, Reichsratstraße 17,
1. Stock
Vortragender: Dipl. Ing. Dr. Gernot Kubin,
Signal Processing and Speech Communication
Laboratory, TU Graz und Forschungszentrum Telekommunikation Wien,
ftw.
Thema: Automatische Dialogsysteme und
oesterreichisches
Deutsch
Vortragende: Dr. Sylvia Moosmüller, Institut
für Schallforschung der
ÖAW
Thema:
Sprechererkennung
Das eingelangte
Datenmaterial muß nicht nur bezüglich Aufnahmequalität und Dauer der zu
analysierenden Sequenz vorbegutachtet werden, es ist in der Folge auch
notwendig, das setting (emotionale Stimmung, Sprechsituation, regionale und
soziale Zugehörigkeit, etwaige Stimmverstellungen) zu evaluieren.
Für einen reliablen
Vergleich ist einerseits eine akustische Analyse (Stimmqualität,
Grundfrequenz, Formanten), andererseits eine phonologische sowie auditive
Analyse notwendig. Für die Evaluierung der phonologischen Variation sind
genaue Kenntnisse der Variation jeweiligen Sprachvarietät bzw. detaillierte
Sprachbeschreibungen notwendig. Auch bei der Erstellung des
Vergleichsmaterials können Fälle von Stimmverstellungen oder Vortäuschen von
Inkompetenz der zu analysierenden Sprache
vorkommen.
Wir bitten um zahlreiches Erscheinen, Gäste sind herzlich willkommen.
Dipl.Ing. Franz Lechleitner e.h.
(Generalsekretär AES-Austria)
Franz.Lechleitner@chello.at