Sprechen Sie schon mit Ihren Maschinen?

Sprachsteuerung in der Industrie - Embedded, robust, natürlichsprachig

Mit der "Spectra PowerBox 100-Voice" stellen die Spectra GmbH & Co. KG (Spectra) und der Sprachexperte voice INTER connect GmbH (VIC) ein erstes Ergebnis ihrer intensiven Zusammenarbeit auf dem Gebiet industrieller Sprachsteuerungen vor.

"Das gemeinsame Produkt erwächst aus unserem Glauben an den erheblichen Mehrwert von Sprachbedienungen in Industrie-Anwendungen" erläutert Geschäftsführerin Dr. Diane Hirschfeld.
"voice INTER connect bringt Expertise und das spezielle Know-how im Bereich der Spracherkennung, -übertragung und -verarbeitung, sowie langjährige Erfahrungen bei der Entwicklung praxistauglicher Anwendungen ein. Die Spectra ist Branchenspezialist für Industrie-PC sowie Steuerungs- und Automatisierungstechnik."

Die Interaktion mit Maschinen via Sprache ermöglicht als neue Modalität eine bisher nicht gekannte Effizienz und Ergonomie von HMI-Lösungen und wird in ausgewählten Bereichen herkömmliche grafische Bedienkonzepte anreichern oder ganz ablösen. Maschinen werden als technische Assistenten den Menschen durch kontextbezogene Erfassung und Bereitstellung der richtigen Informationen in Echtzeit bei Entscheidungsprozessen unterstützen, sowie die Dokumentation und Qualitätssicherung von Produktionsprozessen rationalisieren. Diese Trends greifen wir auf und bieten eine leistungsstarke Embedded-Lösung für die Industrie, die auch im lauten Umfeld und ohne Internet aus natürlich gesprochenen Sätzen eindeutige Befehle an die Maschine erkennt. Die Systemantworten oder benötigte Informationen werden via Sprache wieder ausgegeben.

Welche Vorteile bietet Sprachbedienung?

Anders als im Smart Home oder Consumer-Umfeld, wo Sprachbedienung oft nur ein Komfortmerkmal ist, bietet Sprachbedienung im Industrieanwendungen echte Vorteile:

  • Wenn Hände oder die Aufmerksamkeit des Anwenders durch manuelle Tätigkeiten wie Montage, Transport, die Handhabung von Medizintechnik oder Laborausrüstung bereits gebunden sind, kann Sprache als "dritte Hand" die Bedienung von Maschinen oder die Abfrage von Informationen dennoch parallel ermöglichen.
  • Unter widrigen Umweltbedingungen, im Dunkeln, bei Hitze oder Kälte bzw. im sterilen Umfeld ermöglicht Sprache eine berührungslose Auslösung von Funktionen.
  • Parallel zu manuellen Aufgaben erlaubt Sprache die Dokumentation von Arbeiten, z. B. im Pflege- oder Servicebereich oder die Beurteilung von Maschinen, wie im Gutachterwesen.
  • Der Zugriff auf Funktionen per Sprache erfolgt direkt, ohne Umwege über Menüs wie bei GUIs. Weiterhin werden Ähnlichkeiten bei den Sprachbefehlen ausgewertet, so dass diese nicht präzise eingegeben werden müssen. Beide Eigenschaften bewirken eine Beschleunigung des Bedienvorganges.
  • Sprachbedienung erlaubt eine extreme Miniaturisierung des User Interfaces. Im einfachsten Fall besteht das User Inerface aus einem Mikrofon, einem Lautsprecher und einer Taste, so dass Sprachbedienung auch für leichtgewichtige, mobile Geräte wie SmartWatches und SmartGlasses geeignet ist.

Wie diskutiert, kann im industriellen Umfeld Sprachinteraktion in vielen Bereichen seine Vorteile gegenüber bisher üblichen Bedienmodalitäten ausspielen. Wie wir in den nächsten Abschnitten sehen werden, ist der Aufwand für eine Integration einer Sprachbedienfunktion aufgrund unseres modellbasierten Ansatzes gering, daher lohnt sich eine Bewertung des jeweiligen Nutzens.

Kann Sprachbedienung in einer Industriehalle funktionieren?

Anwendungen der Automatisierungs- und Fertigungstechnik erscheinen aufgrund der starken Umweltgeräusch-Belastung in Produktionshallen als wenig geeignet für eine Sprachbedienung.

Der herkömmliche Ansatz zur sauberen Spracherfassung ist die Ausstattung des Bedienpersonals mit geräuschfilternden und drahtlosen Headsets, welche an die Sprachverarbeitungseinheit angeschlossen sind.

Aufgrund der Bewegungseinschränkung, die das mit sich bringt, kann dieser Ansatz bei den Nutzern zu Akzeptanzeinbußen führen. Ebenso muss eine zuverlässige Funktion drahtloser Headsets für die Dauer einer Schicht gewährleistet sein bzw. das Ladekonzept muss sich gut in den Arbeitsablauf einfügen.

voice INTER connect bietet eine Lösung anderer Art. Durch spezielle Raumsensoren (vicDIVA-Technologie für Distant Voice Acquisition), die dreidimensional Sprachquellen verfolgen und deren Sprachsignale aufzeichnen, verstärken und von Umweltgeräuschen reinigen können, wird das Tragen körpernaher Sensoren (Headset, Smartwatch) überflüssig. Die 3D-Audiosensoren haben je nach Art und Pegel der Umweltgeräusche eine Flächenabdeckung bis zu 70 m², so dass bei entsprechender Installationsdichte auch größere Anlagen gut abgedeckt werden können. Auch für mobile Anwendungen wie autonome Transportsysteme oder Industrieroboter ist die Technologie aufgrund ihrer kompakten Bauweise und des geringen Stromverbrauchs gut geeignet. Mittels vicDIVA erreichen VICs Sprachbedienlösungen eine beispiellose Robustheit gegenüber Umweltgeräuschen.

Gibt es Anwendungen, die sich nicht für eine Sprachsteuerung eignen?

Gerade im Bereich Automatisierungstechnik oder bei der Nachrüstung von Bestandsanlagen ist durch ein hohes Sicherheitsbedürfnis bzw. eine fehlende Netzwerkanbindung eine lokale, integrierte Sprachbedienung wie vicCONTROL industrial gegenüber den bekannten, cloud-basierten Lösungen im Vorteil:

  • Sie funktioniert in Echtzeit, ohne Latenzen durch die Sprachübertragung ins Internet.
  • Sie ist ständig verfügbar, auch bei Ausfall vom Netzwerk oder sogar der Stromversorgung.
  • Durch die lokale Verarbeitung treten auch keine Sicherheitslücken auf, die Daten bleiben beim Anwender.
  • Durch den zugeschnittenen Wortschatz (domänenspezifischer Sprachdialog) wird eine hohe Verarbeitungssicherheit und Bediengeschwindigkeit erreicht.

Den größten Nutzen erzielt der Anwender bei direkten Steueraufgaben, z. B. "Motordrehzahl 1200 Umdrehungen einstellen". Graduelle Regelprozesse hingegen ("Licht heller ... heller ... stop) lassen sich besser mit haptischen Bedienelementen wie Drehreglern abbilden.

Der Einsatz von Sprachbedienung darf ebenfalls nicht dazu führen, dass der Anwender mobile Maschinen unbeaufsichtigt oder versehentlich aktiviert. Laut Maschinenrichtlinie darf keine Sicherheits- oder Gesundheitsgefährdung des Menschen auftreten. Durch sorgfältige Beachtung prozessbezogener und ergonomischer Faktoren sowie Risikobetrachtungen zu Projektbeginn, können solche Gefährdungen bereits beim Entwurf der Lösung erkannt und vermieden werden. Darüber hinaus führt VIC bei den meisten Projekten eine Befragung und intensive Einbeziehung potentieller Nutzer- und Interessensgruppen im Rahmen von Feldtests durch, um alle Anforderungen beim Lösungsdesign berücksichtigen zu können und bestmögliche Rationalisierungseffekte zu erzielen.

Safety-Anwendungen, bei denen allein eine Bedienung per Sprache stattfinden soll (z. B. sprachbasiertes Not-AUS) müssen je nach Einsatzbedingungen beurteilt werden.
Tatsächlich ist es ja so, dass der Mensch bei Gefahr intuitiv seine Stimme einsetzt, um sein Umfeld zu warnen oder sich bemerkbar zu machen. Dies kann man sich bei Notruf- und Notschalter-Anwendungen zunutze machen.

In Fällen mit lauten Hintergrundgeräuschen, z. B. in einer Maschinenhalle, ist eine Kombination mit komplementären Sensoren angebracht, da die Auswertung eines akustischen Sensors allein zu viele Risiken birgt. In Umfeldern wie Büros oder Wohnungen mit moderaten Hintergrundgeräuschen kann ein sprach-basierter Notruf durchaus komfortabler und sicherer als herkömmliche Anwendungen mit mechanischen Rufknöpfen sein, die im Notfall gegebenenfalls nicht am Körper getragen werden. In jedem Fall muss das Einsatzszenario analysiert und potentielle Risiken identifiziert werden, sowie eine nachhaltige Erprobung und Optimierung unter Einsatzbedingungen gegeben sein, damit die gewünschte Funktion im Ernstfall zuverlässig gewährleistet werden kann.

Bei Anwendungen, in denen die Bediener unterschiedliche Nationalitäten haben oder eine Sprache mit Akzent sprechen, kann durch die Auswahl der passenden Zielsprache oder die nachträgliche Adaption des Wortschatzes bzw. Berücksichtigung von Aussprachevarianten, im Rahmen einer Felderprobungsphase die Funktionssicherheit optimiert werden.

Können vorhandene Anwendungen mit einer Sprachsteuerung "nachgerüstet" werden?

Als Voraussetzung für eine nachträgliche Erweiterung durch eine Sprachbedienung sollte die zu steuernde Anwendung einen Zugriff auf Parameter, interne Zustände bzw. Funktionen erlauben. Bei hinreichender Abstraktion von Anwendung und Bedienung ist dies Voraussetzung meist gegeben.

Bei monolitisch implementierten Lösungen, bei denen Anwendung und User Interface eng miteinander verwoben sind, ist eine nachträgliche Erweiterung aufwändig, da solche Schnittstellen an geeigneter Stelle in die Anwendung eingebracht werden müssen.

Um eine kundenspezifische Sprachbedienlösung zu erstellen, wird zunächst der Prozessablauf analysiert und sämtliche Usecases zusammengetragen. Im Idealfall verfügt die Zielanwendung bereits über eine GUI,  die bezüglich der Verwendung von Sprachinteraktion analysiert werden kann. Eine Prozessanalyse gibt Aufschluss über die akustischen Randbedingungen und ermöglicht uns, Empfehlungen für die Ausstattung mit Mikrofonen und Lautsprechern zu geben. Weiterhin erlaubt eine solche Prozessanalyse frühzeitig die Einbeziehung der Anwenderwünsche und die Erfassung des zu erwartenden Rationalisierungspotentials und somit - in Gegenüberstellung zur Investitionssumme - eine Bewertung der Anwendung unter Aufwand-Nutzen-Gesichtspunkten.

Eine frühzeitige Einbeziehung der Anwender beim Dialog-Design und bei der Prozessintegration sowie eine Diskussion der Vorteile mit dem Anwender, unterstützt beim Abbau von Vorurteilen und dem Überwinden von Akzeptanzhürden noch vor Einführung der Lösung.

Weitere Informationen

Dieser Text ist ein Auszug aus unserem Whitepaper:

VOICE CONTROL - READY FOR AUTOMATION
Warum Sprachinteraktion in Zukunft grafische Bedienkonzepte erweitern oder sogar ablösen wird.

Zum Download geht es hier.

 

Einen Kommentar schreiben

Was ist die Summe aus 6 und 4?

Zurück

Weitere Blogbeiträge

Effizientes Testen von MEMS Mikrofonmodulen

Präzise Messungen und wirksame Störgeräuschisolation

MEMS Mikrofonmodule sind aus der modernen Audiotechnologie nicht mehr wegzudenken. Sie finden Anwendung in Smartphones, Wearables oder IoT-Geräten. Wie prüft man am besten Qualität und Zuverlässigkeit dieser Mikrofone? Lesen Sie dazu unseren Fachbeitrag.

Sprache verbindet: 20 Jahre voice INTER connect

Pionierarbeit für Sprachbedienung, Kommunikation und künstliche Intelligenz

Faszination für Sprachtechnologie, Unternehmergeist und die Vision, Mensch-Maschinen-Kommunikation mit Sprachbedienung zu revolutionieren: Daraus entstand 2001 voice INTER connect.

Schnelle Entwicklung, klare Verständigung

Laute, wechselnde Hintergrundgeräusche, raue Umgebungsbedingungen und hohe Ansprüche an Dienstgüte, Ausfallsicherheit und Schutz vor Cyberattacken: Moderne Leit- und Informationssysteme müssen vielfältigen Anforderungen gewachsen sein. Erfahren Sie im Artikel, wie dies mit vicCOM IP gelingt.

Fragen?

+49 351 40752650
E-Mail senden