Forschung: bio-inspiriertes Mikrofon zur Spracherkennung

FORSCHUNG & ENTWICKLUNG MESSTECHNIK ANALOGTECHNIK

Die Technische Universität Ilmenau hat gemeinsam mit Forschungspartnern ein Mikrofon entwickelt, das von der Biologie inspiriert ist und Schall ähnlich wie das menschliche Ohr aufnimmt. Damit könnte die Spracherkennung zur Steuerung von digitalen Anwendungen verbessert werden.



Das Verfahren könnte nach Angaben der WissenschaftlerInnen akustische Gesamtsysteme aus Mikrofon und Spracherkennung auch effizienter machen, sodass sie weniger Energie verbrauchen. Die Forschungsarbeiten wurden im Fachgebiet Mikro- und nanoelektronische Systeme der TU Ilmenau gemeinsam mit Forschungspartnern durchgeführt.

Im Gegensatz zu Technologien zur Spracherkennung kann das menschliche Gehör die Stimmen einzelner Personen in lauten Umgebungen mit einer Vielzahl an Hintergrundgeräuschen heraushören und das Gesagte besser verstehen.


Der Ansatz

Diese Vorzüge des menschlichen Ohrs hat sich ein Forscherteam der TU Ilmenau, der Christian-Albrechts-Universität Kiel, des Karlsruher Instituts für Technologie, des University College Cork und des Ilmenauer Fraunhofer-Instituts für Digitale Medientechnologie zunutze gemacht. Sie bilden die Funktion des Innenohrs nach, denn das unterstützt beim Menschen das Hörverstehen insbesondere in lauten Umgebungen. Das entwickelte bio-inspirierte Mikrofon nutzt drei Eigenschaften des menschlichen Gehörs:

  1. Geräusche, etwa ein gesprochenes Wort oder eine Melodie, bestehen aus verschiedenen Tönen. Sie können von Spracherkennungssystemen erkannt werden, indem die Geräusche in die enthaltenen Töne zerlegt werden. Beim Menschen erfolgt diese Zerlegung nicht erst im Gehirn, sondern bereits im Innenohr. Das besteht aus einer Vielzahl kleiner Haarzellen, die jeweils auf unterschiedliche Töne reagieren. Damit wird verhindert, dass sich die verschiedenen Töne beim Hören beeinflussen und leise Töne durch laute Töne verdeckt werden. Im Unterschied zu herkömmlichen Mikrofonen zerlegt das bio-inspirierte Mikrofon Geräusche schon vor der Umwandlung in ein elektrisches Signal.
     
  2. Um leise Töne zu verstehen, müssen sie deutlich verstärkt werden. Laute Töne hingegen müssen, damit sie unverzerrt wahrgenommen werden, gedämpft werden. Diese Fähigkeit des Gehörs erlaubt es dem Menschen, Töne zu hören, deren Schalldruck sich um einen Faktor von einer Million ändern. Im Innenohr ist diese, wie Fachleute sie nennen: nichtlineare oder kompressive Verstärkung bereits in den Sensor integriert. So ist es möglich, deutlich größere Lautstärkebereiche zu hören.
     
  3. In leisen Umgebungen gelingt es dem Menschen relativ leicht, für ihn wichtige Schallsignale wie die Stimme einer einzelnen Person herauszuhören. In lauten Umgebungen ist dies jedoch schwierig und die für den Hörer wichtigen Schallsignale müssen für ein gutes Hörverständnis stärker verstärkt werden als die Umgebungsgeräusche. Um in verschiedenen Umgebungen möglichst gleich gut zu hören, werden daher die Sensoren des Innenohres, die Haarzellen, permanent an die sich verändernden Erfordernisse angepasst. Dies wird dadurch erreicht, dass die relativen Verstärkungsfaktoren für einzelne Töne situationsabhängig verändert werden.



Technologisches Herzstück …

des bio-inspirierten Mikrofons sind den Haarzellen nachempfundene Biegebalken aus Silizium mit einer Länge von einem Drittel Millimeter bis etwas über einen Millimeter. Dieser Längenunterschied bewirkt, dass jeder Biegebalken nur auf einen einzelnen Ton des Schallsignals reagiert (Punkt 1). Eine elektronische Steuerung ermöglicht es, die Eigenschaften jedes Biegebalkens, wie zum Beispiel die Verstärkung, separat zu steuern (Punkt 2) und so an verschiedene, zum Beispiel unterschiedlich laute Umgebungen anzupassen (Punkt 3).

Dank der für jede Tonhöhe separat steuerbaren und automatischen Anpassung an das Schallsignal werden die relevanten Signale hervorgehoben. Dadurch, so die Idee der Forscherinnen und Forscher, ist für die Sprachanalyse weniger Rechenleistung und somit für das Gesamtsystem aus Spracherkennung und Mikrofon weniger elektrische Energie nötig. Vor allem Anwendungen mit begrenzten Energiekapazitäten, etwa Hörgeräte, wären so in der Lage, deutlich komplexere Sprach- und Schallanalysen durchzuführen. Zudem ermöglicht die Herstellung des bio-inspirierten Mikrofons auf Basis von Siliziumtechnologie nicht nur eine mikrometergenaue Fertigung, sondern auch eine kostengünstige Massenproduktion.


Ausblick

Gemeinsam mit den Wissenschaftlerinnen und Wissenschaftlern der Partnereinrichtungen will die TU Ilmenau nun Prototypen des bio-inspirierten Mikrofons entwickeln. Mögliche Einsatzgebiete sind neben Sprachassistenzsystemen und Hörgeräten auch Technologien zur Überwachung von Maschinen in der Produktion.


Informationen zum Projekt

Realisiert wurde der Demonstrator des bio-inspirierten Mikrofons im „ForLab Ilmenau für neuromorphe Elektronik“, das durch das Bundesforschungsministerium unterstützt wird. Das ForLab ist am Zentrum für Mikro- und Nanotechnologien der TU Ilmenau angesidelt.

Die Forschungsergebnisse entstanden im Rahmen von zwei Forschungsprojekten der TU Ilmenau: „SFB 1461 – Neuroelektronik: Biologisch inspirierte Informationsverarbeitung“, das von der Deutschen Forschungsgemeinschaft gefördert wird, und „MemWerk“, gefördert von der Carl-Zeiss-Stiftung, in dem die TU Ilmenau intelligente Werkstoffe für biologisch inspirierte Elektronik erforscht.
 

Fachartikel

Präzisions-Designs mit differenzieller Verstärker-Ansteuerung
Probleme und Lösungsansätze für IEEE 1588 Implementierungen
Kabellose Energieübertragung: Spulen als zentrale Bauelemente