Large-Language-Modell

Generative KI befeuert die MEMS-Mikrofon-Revolution

18. April 2024, 19:00 Uhr | Heinz Arnold
Die Single-Backplate(SBP)- und die von Infineon entwickelte Sealed-Dual-Membrane-Technik im Vergleich
© Infineon Technologies

Der Siegeszug der Large-Language-Models und der virtuellen Assistenten macht Audio zu einem wesentlichen Bestandteil unserer Kommunikation – und beflügelt damit die Transducer-MEMS-Mikrofone, für deren Technologie Infineon einer der Pioniere ist.

Large-Language-Models machen es möglich: Virtual Personal Assistants, über die wir in natürlicher Sprache kommunizieren, werden unsere Welt und die Art und Weise, wie wir über das Internet interagieren, drastisch verändern. »Hey Siri« und Ähnliches war daran gemessen nur ein sehr bescheidener Anfang.

Mit dem Auto sprechen

Auch die Geräte und Systeme, über die wir kommunizieren, werden sich ändern, wie etwa der »Rabbit R1« gezeigt hat. Auf der CES Anfang des Jahres war einiges davon zu sehen, wie etwa die Assistenten in den Autos zeigten, die die Hersteller dort demonstrierten: Wir werden ganz natürlich mit dem Auto sprechen.

Vielleicht werden wir schon einigen Jahren nicht mehr bevorzugt über Smartphones kommunizieren, sondern über unsere dann hoffentlich stylischen Augmented-Reality-Brillen. Bis dahin müssen noch einige technische Hürden genommen werden, doch die unterschiedlichsten Unternehmen arbeiten eifrig daran, das Gesamtkunstwerk AR-Brille praxistauglich und erschwinglich zu machen.

Eine ganz besondere Komponente, die nicht nur in den AR-Brillen – wenn sie denn kommen – eine wesentliche Rolle spielen werden, sondern in unserem Zuhause, im Auto, im Büro und in der Produktion werden häufig übersehen: Mikrofone. Genauer gesagt MEMS-Mikrofone auf Basis von kapazitiven mikromechanischen Systemen auf Halbleiterbasis. Nur diese Technologie verspricht, die Mikrofone sowohl klein genug zu machen, dass sie in die Geräte hineinpassen, als auch so energiesparend, dass sie den Batterien eine lange Lebensdauer bescheren können. Gleichzeitig werden sie so leistungsfähig, dass sie sich verschiedenen akustischen Umgebungen anpassen können – und das jeweils optimale Verhältnis zwischen Stromaufnahme und Performance finden.

Die ersten MEMS-Mikrofone

Um diese Trends zu verstehen, ein Blick in die Geschichte der MEMS-Mikrofone. 2010 bedeutete für sie das Jahr des Durchbruchs: Das iPhone 4 kam auf den Markt. Nun wurden sie erstmals in Stückzahlen nachgefragt. Im Vergleich zu den traditionellen ECM-Mikrofonen boten die neuartigen MEMS-Mikrofone Vorteile in der Baugröße und der Temperaturstabilität.

Anbieter zum Thema

zu Matchmaker+
Infineon Technologies
Infineon entwickelt die SBP- und die SDM-Mikrofone parallel weiter, um damit eine Vielfalt von Endanwendungen abdecken zu können.
© Infineon Technologies

Die hohen Stückzahlen machten sie für große Hersteller interessant. Zu den Pionieren auf diesem Gebiet gehört Infineon. Ausgangspunkt waren die MEMS-Drucksensoren, die Infineon schon lange vor 2010 für den Einsatz in Airbags entwickelt und verkauft hatte.

Wie man Schallwellen aufnimmt

Schallwellen aufzunehmen sollte doch auf Grundlage desselben Prinzips ebenfalls funktionieren. Allerdings war die Herausforderung gewaltig: Für Drucksensoren reicht es aus, im Bereich von 1 bar zu messen. Ein Mikrofon muss Unterschiede im Bereich von 1 Pascal messen – muss also um den Faktor 10.000 empfindlicher sein. Kein Wunder, dass es einige Zeit dauerte, bis die Ingenieure die Tricks und Kniffe fanden, die erforderlich waren, um die MEMS plus zugehöriger Elektronik nicht nur empfindlich genug zu machen, sondern auch in großen Stückzahlen mit vernünftiger Ausbeute produzierbar und robust genug für den Einsatz in den Handys.

Seitdem hat sich viel getan: Die Hersteller – neben Infineon gehören Firmen wie Knowles, TDK, STM und Goertek dazu – haben die Mikrofone stetig verbessert, und für fast jede Anwendung hat sich ein eigener Mikrofontyp entwickelt, der speziell darauf zugeschnitten ist.

Signal-Rausch-Abstand – der wesentliche Kennwert

Ein wesentlicher Kennwert für die Leistungsfähigkeit von Mikrofonen ist der Signal-Rausch-Abstand (SNR). »Signal« seht in diesem Zusammenhang für das akustische Eingangssignal, das vom Mikrofon aufgenommen wird. Dieses Signal wird beim SNR-Wert mit dem Eigenrauschen des Mikrofons verglichen. Umso höher der SNR-Wert eines Mikrofons, umso besser ist es.

Lorenz Gunar
Gunar Lorenz, Infineon: »Auf Large-Language-Models basierende Kopiloten werden uns auf Schritt und Tritt begleiten und nicht an ein bestimmtes Gerät gebunden sein.«
© Infineon Technologies

Die ersten marktreifen MEMS-Mikrofone erreichten gerade mal einen SNR-Wert von 60 dB. Heute sind Werte über 70 nichts Besonderes. Welchen SNR-Wert die Mikrofone erreichen sollten, hängt von ihrem Einsatzbedingungen ab. Während Mikrofone für gute Laptops und Tablets auf mindestens 70 dB kommen sollten, benötigen Hörgeräte zumindest 71 dB, Mikrofone für Over-Ear-Headsets und Konferenzsysteme sollten bereits 72 dB oder mehr bieten. Wenn der Anwender aber wünscht, dass er die Geräusche der Umwelt ebenfalls hören kann (Transparent Hearing), beispielsweise, wenn er in der S-Bahn über seine kabellosen Kopfhörer (True Wireless Stereo, TWS) telefoniert, dann kommt es nicht darauf an, dass das Eigenrauschen des Mikrofons möglichst gering ist; hier genügt ein weniger hoher SNR-Wert von 68 dBA.

Virtual Personal Assistants verändern alles

Doch warum geht der Trend zu immer höheren SNR-Werten? »Ganz einfach, weil Audio wieder zu einem wesentlichen Bestandteil unserer Kommunikation wird, wie nicht zuletzt auf der CES in Las Vegas kürzlich wieder eindrücklich zu sehen war«, antwortet Gunar Lorenz, Technical Marketing Director von Infineon. »Überall waren Virtual-Voice-Assistants wie ‚Rabbit R1’ oder ‚Humane AI Pin’ zu sehen, die, wenn es nach dem Willen der Hersteller geht, eines Tages Smartphones zumindest zum Teil ersetzen könnten.« Bei diesen neuartigen Geräten erfolgt die Eingabe nicht über eine virtuelle Tastatur, sondern ausschließlich über natürliche Sprache. Die Large-Language-Models wie ChatGPT verarbeiten die Befehle und »antworten«. Damit sie dies tun können, müssen sie die Sprache erst einmal akustisch verstehen.

Neben den etablierten und neuen Elektronikherstellern hat der Trend längst auch Automobilhersteller erreicht. So haben auf der CES BMW und Mercedes ihre eigenen, auf generativer KI basierende Assistenten vorgestellt. Die Insassen können so in natürlicher Sprache mit dem Auto kommunizieren. »Auf Large-Language-Models basierende Kopiloten werden uns auf Schritt und Tritt begleiten und nicht an ein bestimmtes Gerät gebunden sein. Vielmehr wird uns ‚unser’ virtueller Assistent am Arm, im Ohr, in der Hosentasche, am Laptop, Fernseher oder Auto zur Verfügung stehen«, so Lorenz.

Das bedeutet für die Mikrofone: Sie müssen die Sprache trotz störender Umweltgeräusche gut erkennen können, und das verlangt nach einem hohen SNR-Wert. Ein Mikrofon mit einem SNR-Wert von 64 bis 65 dBA in 4 bis 2 m Abstand kann zumindest 80 Prozent der eingehenden Sprache erkennen. Mit zunehmender Entfernung fällt die treffsichere Erkennung steil ab^; bei 8 m liegt sie bei 60 Prozent, bei 16 m bei 10 Prozent, um nach 32 m bei Null zu landen. Ein Mikrofon mit einem SNR-Wert von 70 dB dagegen erkennt die Sprache über eine Entfernung von 8 m mit einer Sicherheit von über 90 Prozent, bei 16 m sind es 90 Prozent und bei 32 m immer noch 85 Prozent. Die Erkennung von Schlüsselwörtern verbessert sich sogar noch deutlicher.

Kapazitive MEMS-Mikrofone – die Grundlage

Infineon setzt bei Mikrofonen auf die kapazitiven MEMS-Schallwandler. Das zugrunde liegende Prinzip ist einfach: Die Schallwellen lenken eine Membran aus. Die Auslenkung wird über die Veränderung der Kapazität gegenüber einer festen Elektrode gemessen.

Füldner
Marc Füldner, Infineon: »Bei den Smartphones kam es auf höchste SNR-Werte bisher nicht so sehr an, doch die Large-Language-Models und generative KI verändern alles.«
© Infineon Technologies

Hier verfolgt Infineon zwei verschiedene Designs. Das einfachere ist das Single-Backplate-Design (SBP). Hier gibt es nur eine Membran. Es handelt sich also um einen relativ schlichten Aufbau, der ein robustes Verhalten gegenüber Staub und Wasser zeigt. Diese MEMS-Mikrofone stehen in kleinen Gehäuseformen wie z. B. 2,75 mm × 1,85 mm × 0,9 mm zur Verfügung und entsprechen der Schutzart IP57.

Trotz ihrer kleinen Bauform erreichen sie sehr gute SNR-Werte und eignen sich deshalb vor allem für den Einsatz in Geräten, in denen nur sehr wenig Platz zur Verfügung steht. Und die Entwicklung ist noch nicht am Ende: »Wir arbeiten bereits an einer neuen Generation, deren SNR-Wert sich noch einmal deutlich verbessern wird«, so Marc Füldner, Teamleiter der MEMS-Konzeptgruppe Mikrofon und Drucksensoren von Infineon.

Spezielle MEMS-Technologie für High-End-Geräte

Für das High End hat Infineon im eigenen Hause eine zweite patentierte Technik entwickelt, die eine deutlich bessere akustische Performance erreichen. Zum ersten Mal fand die neue Technik im Jahr 2018 in miniaturisierten kabellosen Kopfhörern Einsatz. Hier war die höchste akustische Performance gefragt.

Diese speziell für höchste Anforderungen entwickelte Technik hat Infineon auf den Namen Sealed-Dual-Membrane, kurz: SDM, getauft. Wie der Name sagt, sind in diesem kapazitiven Mikrofonen zwei Membranen verbaut, sodass differenzielle Signale aufgenommen werden können. Selbstverständlich gibt es weitere Tricks. Beispielsweise herscht zwischen den Membranen ein Vakuum. »Damit gibt es kaum Luftmoleküle, die auf der Membran knistern können«, erklärt Marc Füldner. »Insgesamt eine revolutionäre Technologie, mit der sich SNR-Werte bis 80 dB erreichen lassen.«

Den Vorteil der besseren Leistungsfähigkeit muss die SDM-Technik allerdings durch einen komplexeren Aufbau bezahlen: Um die beiden Membranen und die weiteren erforderlichen Elemente fertigen zu können, müssen gegenüber den SBP-Mikrofonen mehr Schichten abgeschieden werden, was deutlich mehr Prozessschritte erfordert. Das macht sie teurer.

Doch Gunar Lorenz ist sich sicher, dass die Anwender geneigt sind, die höheren Kosten wegen der besseren Leistungsfähigkeit jetzt auch in Smartphones in Kauf zu nehmen. »Bei den Smartphones kam es auf höchste SNR-Werte bisher nicht so sehr an, doch die Large-Language-Models und generative KI verändern alles«, sagt Gunar Lorenz, Technical Marketing von Infineon. »Deshalb stehen die SDM-Mikrofone kurz davor, in neue Smartphones eingebaut zu werden.«

Infineon Technologies
Die zwei Zweige der Optimierung der kapazitiven MEMS-Mikrofone auf Basis der SDM-Technik: einmal in Richtung höchster SNR-Werte und einmal in Richtung möglichst geringer Leistungsaufnahme
© Infineon Technologies

Das eröffnet die Aussichten auf einen riesigen Absatzmarkt: Omdia rechnet mit einer jährlichen Wachstumsrate von 8,7 Prozent im Konsumgüterbereich für MEMS-Mikrofone mit einer SNR über 64 dB, bei einem Absatz von fast 3 Milliarden Stück bis 2027.

Vor allem steckt in der SDM-Technik nach seinen Worten noch viel Potenzial. »Wir haben bereits viele Ideen für die nächste Generation!«

Kapazitiver Wandler versus piezoelektrischer Wandler

Doch neben den kapazitiven Wandlern gibt es eine weitere MEMS-Technik, die nicht auf dem kapazitiven, sondern auf dem piezoelektrischen Effekt basiert: Auf der Membran wird eine piezoelektrische Schicht abgeschieden, etwa PZT oder AlN: Entsprechend der Verbiegung liefert sie eine bestimmte Spannung, kann also Schallwellen ebenso wie die kapazitiven Wandler in elektrische Signale zur Weiterverarbeitung umsetzen.

Sieht Infineon diese etwas neuere Technik nicht ebenfalls als vielversprechend an? Da ist Füldner skeptisch: Der elektromechanische Koeffizient – also die elektrische Spannung, die eine bestimmte Auslenkung erzeugt – liegt bei piezoelektrischen Wandlern vergleichbarer Größe um den Faktor 10 unter dem der kapazitiven Wandler. Es müsse also eine extrem gute Mechanik entwickelt werden, das Potenzial für weitere Verbesserungen auf dieser Ebene dürfte aber bereits ausgeschöpft sein. »Im Moment sehe ich zur kapazitiven Wandlung im Bereich der Mikrofone keine Alternative, das wird sich auch über die nächsten fünf Jahren nicht ändern, der Vorsprung der SBP- und SDM-Technologie dürfte nicht mehr aufzuholen sein.«

Ohne die richtigen ASICs geht nichts …

Zwar ist eine gute MEMS-Technik die Voraussetzung dafür, dass das MEMS-Mikrofon die gewünschte Performance erreicht, doch genauso wichtig ist die zugehörige Elektronik; beides muss Hand in Hand gehen und aufeinander abgestimmt entwickelt werden.

Wegen der Verbesserungen auf der Ebene der Elektronik ist es Infineon gelungen, seit 2019 die Stromaufnahme um nicht weniger als den Faktor 3 zu reduzieren. Ob am ASIC oder den A/D-Wandlern, überall bieten die Mikrofone laut Gunar Lorenz Raum für weitere Optimierungen. So hat Infineon ein neues ASIC-Konzept umgesetzt. Außerdem wurde ein Ring-Oszillator entwickelt, der die Stromaufnahme ebenfalls stark reduziert. Schon früh hat Infineon auf die energiesparenden Sigma-Delta-Wandler gesetzt, was zusammen die Stromaufnahme um die Hälfte reduziert hat.

»Die Ear-Buds und die Hörgeräte haben diese Entwicklung befeuert, die nun auch den High-End-Mikrofonen für den Einsatz in den Smartphones zugutekommt«, erklärt Gunar Lorenz.

Doch es gib noch eine weitere Möglichkeit, die CMUT-Mikrofone zu optimieren: das Packaging. Weil sich das Packaging zunehmend zu einen Differenzierungsfaktor entwickelt hat, ist Infineon 2019 in Zusammenarbeit mit einem Joint-Venture-Partner in die Produktion der gesamten MEMS-Mikrofone eingestiegen. Bis dahin hatte Infineon die MEMS und ASICs nur als Bare Dies an die Kunden geliefert.

Die eigenen Mikrofone verkauft das Unternehmen unter der Marke »Xensiv«. »Das war ein wichtiger Schritt, denn die großen Kunden erwarten mittlerweile, dass sie die Mikrofone geliefert bekommen und nicht mehr nur die Dies. Wir haben viel Geld in die Back-End-Fertigung und den Test investiert, um die Mikrofone entsprechend den Bedürfnissen der Kunden zu optimieren«, sagt Gunar Lorenz.

… und ohne die richtigen Gehäuse auch nicht

Doch es gibt einen noch wichtigeren Beweggrund: »Die Innovationen finden inzwischen zu einem nicht unerheblichen Teil in der Verbesserung der Gehäusetechnik statt«, erklärt Füldner und spricht bereits von der nächsten Revolution: Mithilfe der neusten Xensiv-Technologie kann die Membran zum Schutz der Mikrofone bereits im Gehäuse integriert werden.

Um die Bedeutung dieses Fortschritts ermessen zu können, hilft ein Blick auf die bisherige Technik zum Schutz der Mikrofone. Erforderlich ist der Schutz, weil die Schallwellen erst einmal zur Membran gelangen müssen, also ist eine Öffnung zur Außenwelt erforderlich. Schlecht nur, dass neben den erwünschten Schallwellen auch Flüssigkeiten, Staub, leitende Partikel und Druckluft eindringen können. Um dem vorzubeugen, müssen am Schallkanal, der von der äußeren Öffnung des Mikrofons zur Membran verläuft, winzige Schutzgitter (Mesh) angebracht werden.

Allerdings stehen die beiden Optimierungen – bessere akustische Performance einerseits und ein besserer Schutz vor Umwelteinflüssen andererseits – in einem gewissen Konkurrenzverhältnis zueinander. Denn je besser die MEMS-Mikrofone von der Außenwelt abgeschlossen sind, umso mehr reduziert sich notwendigerweise der SNR-Wert, der vom Schutzgitter, der Membran, dem Sound Channel und der Abdichtung abhängt.

Das richtige Mikrofon erspart hohe Reinraumklasse

Das Schutzgitter kann allerdings erst dann ins Handy-Gehäuse eingebaut werden, wenn seine Montage praktisch abgeschlossen ist. Das bedeutet: Die Assemblierung muss komplett im Reinraum stattfinden, um zu vermeiden, dass in das Mikrofon schon während der Montage Schmutz eindringt und es am Ende nicht funktioniert.

Die Assemblierung im Reinraum durchführen zu müssen kommt allerdings teuer zu stehen. Mit der neuen Packaging-Technik von Infineon wäre der hohe Aufwand überflüssig, weil die Mikrofone bereits komplett geschützt angeliefert werden und während der Assemblierung nicht mehr beschädigt werden können.

Weil die Mikrofone bei Weitem die empfindlichsten Bauelemente im Handy sind – mit Abstand gefolgt von den Drucksensoren, die ebenfalls eine Öffnung zur Außenwelt benötigen –, kann zumindest die Reinraumklasse verringert werden, was die Fertigungskosten erheblich senkt. »Denn die Audioqualität hängt nun erstmals nicht mehr von der Assemblierung ab, sondern nur noch vom Mikrofon, was sich in reduziertem Testaufwand und besserer Ausbeute niederschlägt«, sagt Gunar Lorenz.

Das ist aber bei Weitem noch nicht alles. Infineon ist es mit der neuen Gehäusetechnik auch gelungen, die passiven Komponenten direkt neben dem ASIC im MEMS-Teil zu platzieren. Sie sind also im Modul integriert, statt in SMD-Technik nebenan auf die Leiterplatte gesetzt zu werden. Durch die hohe Integration sind die MEMS-Mikrofone außerdem viel besser als bisher vor ESD geschützt.

Doch sowohl die akustischen Verbesserungen als auch die höhere Integration durch die neue Packaging-Technik sorgen dafür, dass die Summe dieser Verbesserungen mehr Performance bringt, als die bessere Isolation vor Umwelteinflüssen kostet. »Die SDM-Technik ist der Schlüssel dazu – ein entscheidender Evolutionsschritt, denn besserer Schutz ist jetzt nicht mehr gleichbedeutend mit schlechterer akustischer Performance«, erklärt Füldner.

Doch die Virtual Personal Assistants stellen noch eine weitere Anforderung an die Mikrofone: Ob in den Lautsprechern von Amazon oder in Smartphone – die Mikrofone sind ständig eingeschaltet. Dennoch sollte die Stromaufnahme möglichst gering sein. Nun korreliert der dynamische Bereich, also der Bereich vom leisesten bis zum lautesten Geräusch, das noch aufgenommen werden kann, direkt mit der Stromaufnahme. Wie oben schon erwähnt, wurden die Mikrofone deshalb bisher auf ihre jeweiligen Einsatzfälle genau abgestimmt und der erforderliche dynamische Bereich auf das optimale Verhältnis von Performance und Stromaufnahme jeweils fest eingestellt.

Der dynamische Bereich kann sich aber oft sehr schnell ändern.

Der nächste Schritt besteht darin, dass die Mikrofone sich selbst auf das optimale Verhältnis von Performance und Stromaufnahme flexibel einstellen werden, also adaptiv werden.

Infineon Technologies
Die nächste Generation der Xensiv-MEMS-Mikrofone. Höchste akustische Leistung bei gleichzeitig hohem Schutz vor Umgebungseinflüssen sind Innovationstreiber der nächsten Smartphone-Generationen.
© Infineon Technologies

Adaptive MEMS-Mikrofone sparen Strom

Deshalb hat Infineon erstmals adaptive Mikrofone entwickelt, die sich selbst auf das optimale Verhältnis von Performance und Stromaufnahme flexibel einstellen können, und im Januar vergangenen Jahres das »IM69D128S« auf den Markt gebracht. Ist die Umgebung leise, dann darf das IM69D128S nur sehr wenig Eigengeräusche generieren, der SNR-Wert muss also hoch sein. Ist die Umgebung sowieso laut, kommt es auf einen möglichst hohen SNR-Wert nicht mehr an und die Leistungsaufnahme kann reduziert werden.

Deshalb konnte Infineon die Stromaufnahme des IM69D128S gegenüber bisherigen Mikrofonen um die Hälfte auf 520 µA reduzieren. Dabei erreicht es einen SNR-Wert von 69 dB(A) und sitzt in einem nur 3,5 mm × 2,65 mm × 0,98 mm großen Gehäuse. Damit eignet es sich für den Einsatz in True Wireless Earbuds, Over-Ear-Headsets und Hörgeräten genauso wie in Smartphones, IoT-Geräten und Wearables.

Die nächste MEMS-Revolution hat schon begonnen

Dabei kommt es darauf an, dass das ASIC zwischen den Modi so schalten kann, dass keine hörbaren akustische Artefakte entstehen. »Die hohe Kunst liegt darin, Nichtlinearitäten zu verhindern«, so Füldner. Gegenüber einem System, das nicht nahtlos hin- und herschalten kann, spart das pro Mikrofon deutlich Stromaufnahme ein: statt 420 µA sind nur 360 µA erforderlich. Doch erkauft wird dies durch eine komplexere Kommunikation zwischen dem ASIC und dem IM69D128S: Ein zusätzliches I/O-Interface muss integriert werden, das weitere Leitungen benötigt.

Doch diese Komplexität will Infineon in künftigen Generationen reduzieren: mithilfe des Standards MIPI SoundWire (SWI3S). »Das wird die nächste Revolution in der Welt der MEMS-Mikrofone«, freut sich Lorenz.


Lesen Sie mehr zum Thema


Das könnte Sie auch interessieren

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu INFINEON Technologies AG Neubiberg

Weitere Artikel zu TDK

Weitere Artikel zu STMicroelectronics GmbH

Weitere Artikel zu Künstliche Intelligenz (KI)

Weitere Artikel zu Mikrosystemtechnik (MEMS)

Weitere Artikel zu MEMS- und Halbleitersensoren