Fraunhofer IDMT entwickelt Sprachsteuerung für Maschinen

Eine Frau steuert eine Maschine durch Sprachbefehle. — _{Foto: Fraunhofer IDMT / Anika Bödecker}

Die Forschenden des Fraunhofer-Instituts für Digitale Medientechnologie IDMT in Oldenburg haben eine Lösung für die Spracherkennung in der industriellen Produktion entwickelt. Das System ist auch in einer lauten Umgebung verlässlich und flexibel an die Bedürfnisse eines Anwenders anpassbar. Mitarbeitende in der Fabrikhalle haben freie Hände und können mit den intuitiven Sprachbefehlen deutlich effizienter arbeiten. Eine praxisnahe Demonstration des Forschungsprojekts wird am 15. Februar 2023 auf der Hannover Messe Preview gezeigt.

Noise Cancelling in lauten Produktionshallen

Bisher galt die Sprachsteuerung von Maschinen in der Produktion als fehleranfällig und wurde daher kaum genutzt. Das Fraunhofer IDMT hat nun eine Lösung entwickelt, die eine zuverlässige Steuerung von Maschinen mit Sprachbefehlen ermöglicht. Die Spracherkennung funktioniert auch in lauten Umgebungen und nutzt zur Spracheingabe ein kabelloses Headset, ein stationäres Mikrofon oder zukünftig ein smartes Hearable, das ebenfalls am Institutsteil Hör‑, Sprach- und Audiotechnologie HSA entwickelt wird. Durch die Kombination aus Richtmikrofonen und wirkungsvollem Noise Cancelling werden laute Umgebungsgeräusche fast vollständig ausgeblendet.

Kürzere Laufwege und freie Hände

Marvin Norda, Projektleiter »Voice Controlled Production« am Fraunhofer IDMT, sagt: »Unsere Technologie ermöglicht erstmals die robuste und gleichzeitig intuitive Steuerung von Maschinen in der Produktion durch Sprachbefehle. Für produzierende Unternehmen bedeutet das eine verbesserte Effizienz und sinkende Kosten.« Die berührungslose Bedienung der Maschinen ist für den Menschen sicher und hygienisch, und die Laufwege werden kürzer, da die Mitarbeitenden die Anlagen auch aus der Entfernung über eine mobile Spracheingabe kontrollieren können. Sie haben beide Hände frei und können ein Werkstück im Arbeitsbereich positionieren und dem Roboter gleichzeitig Anweisungen wie »Arm senken« oder »Werkstück greifen« geben.

Die Steuerung per Sprachbefehl ist effizienter als mit einem Schaltpult oder einem Touch-Panel, da das umständliche und fehlerträchtige Klicken durch verschachtelte Menüstrukturen durch den direkten Sprachbefehl mit simplen Kommandos ersetzt wird. Die Spracherkennung beherrscht je nach Anwendung Hunderte von Einzelbefehlen und ist dabei sprecherunabhängig. Neue oder modifizierte Befehle können schnell hinzugefügt und trainiert werden.

Spracherkennung nach Kundenwunsch

Die Forschenden aus Oldenburg haben langjährige Erfahrung und Expertise bei der Entwicklung von Audiotechnologien und Spracherkennungssoftware, wovon auch die mehr als 50 Mitgliedsunternehmen des Industriearbeitskreises »Audiotechnologie für die intelligente Produktion« (AiP) profitieren. Das Unternehmen kann maßgeschneiderte Systemlösungen für Industriekunden anbieten, die schnell implementiert werden können und sich entsprechend den Anforderungen des Unternehmens sowohl in der Cloud als auch auf dem Firmenserver integrieren lassen.

Die neue Technologie und ihre Möglichkeiten können Interessierte auf der Hannover Messe vom 17. bis 21. April 2023 live erleben.