Direkt zum Inhalt
x
Image
Sprach- und Gestensteuerung
Datenerfassung
digitale Kommunikation
digitale Steuerung

Unter Sprachsteuerung wird die Übermittlung von gesprochenen Befehlen an technische Geräte verstanden. Dabei erkennen die Geräte Muster in der gesprochenen Sprache und können aufgrund der Zuordnung dieser Muster eine Aktion einleiten.

Gestensteuerung ist die automatische Erkennung von Gesten als Teil der Mensch-Computer-Interaktion. Die Gesten wirken als Befehle, mit denen ein Mensch dem System vorgibt, was es zu tun hat. Verschiedenen Körperhaltungen und Körperbewegungen können eine Geste darstellen, jedoch liegt der Fokus auf der Erkennung von Hand- und Kopfgesten. Die Sprach- und Gestensteuerung gelten als besonders intuitive und unmittelbare Technologien.

Ansprechpartner

Gerhard Hieber

Handwerkskammer für Schwaben

Die Sprachinteraktion kann je nach Anwendungsfall einerseits über eine kommandosprachliche Interaktion mit Schlüsselwörtern, z. B. in einer Umgebung mit lauten Geräuschen erfolgen. Andererseits können auch ganze Sätze oder Satzglieder verarbeitet werden. Die Spracherkennung gliedert sich in die Vorverarbeitung, die das Sprachsignal in einzelne Frequenzen zerlegt und eine anschließende Erkennung mithilfe akustischer und sprachlicher Modelle.

Image
Sprach- und Gestensteuerung

Bei der Gestensteuerung muss zunächst ein Gestenkatalog für die Technologie generiert werden. Hierbei werden Gesten ausgewählt, die für den Benutzer möglichst intuitiv zur gewünschten Funktion passen. Die technische Erkennung der Gesten lässt sich in die bild- und gerätebasierte Erkennung einteilen. Die gerätebasierte Variante greift oft auf Beschleunigungs- oder Positionssensoren, die vom Bediener am Körper getragen werden, zurück. Weitere Beispiele für die gerätebasierte Gestenerkennung sind Touchpads oder Touchscreens. Kamerabasierte Verfahren greifen auf Methoden der Objekterkennung und Bildverarbeitung zurück.

 

Mittels Sprach- und Gestensteuerung kann die Bedienung von komplexen Maschinen für den Menschen deutlich vereinfacht werden. Traditionelle Werkzeuge werden zunehmend durch moderne Geräte und Eingabemethoden ersetzt. Auch bei Zukunftstrends, wie z. B. der Robotik oder der Künstlichen Intelligenz, hat sich die intelligente Bedienung durch Sprache oder Gestik in der Forschung schon fest etabliert. Roboter, die als Alltagshelfer oder sog. „Cobots“ im Arbeitsumfeld tätig sind, werden meist durch sprachliche Interaktion oder berührungslose Raumgesten gesteuert.


Auf dem Gebiet des automatischen Verstehens von gesprochener Sprache hat es in den vergangenen Jahren erhebliche Fortschritte gegeben: Mobiltelefone die einfache Sprachbefehle erkennen und ausführen oder Diktiersysteme, die das Gesprochene in Text umwandeln können. Heutige Spracherkennungs- und Sprachsteuerungssysteme gehen jedoch weit über die einfache Diktierfunktion hinaus. Anstelle einer reinen Kommandosteuerung ist ein natürlichsprachlicher Dialog mit dem System möglich, der dazu dient, Unklarheiten zu beseitigen und Fehler zu korrigieren.

Sinnvoll ist der Einsatz dieser neuen Technologien im Arbeitsalltag vor allem dann, wenn die Hände parallel für andere Dinge verwendet werden sollen oder wenn die Bedienung z. B. eines Geräts oder einer Maschine vereinfacht werden soll. Die Kombination aus mobilen Endgeräten wie Smartphones und Tablets und Assistenzsystemen wie Datenbrillen vereinen mithilfe der Touchscreens, der Spracherkennung und der Gestensteuerung die wichtigsten Interaktionsformen zur Bedienung intelligenter Maschinen.

Dokumentation
Auch im Bereich der Dokumentation kann der Einsatz von Gesten- und Sprachsteuerung sinnvoll sein. So können zum Beispiel Bauteile oder Räume durch Benutzung einer Datenbrille ganz einfach über eine bestimmte Gestik oder einen Sprachbefehl fotografiert werden.

Das Dokumentieren von Geschäftsprozessen und Vorgehensweisen ist ein wichtiger Bestandteil eines Handwerksunternehmens. Durch die Sprachsteuerung kann dieser Vorgang erleichtert werden. Die Person muss die zu dokumentierenden Informationen nur noch dem technischen Gerät mitteilen.

Datenerfassung
Beim Erfassen wichtiger Daten kann die Sprach- und Gestensteuerung dem Handwerker unterstützend zur Seite stehen. Durch die Sprachsteuerung entfällt für viele Handwerker das lange Suchen nach Anleitungen. So können zum Beispiel Heizungsbauer mit ihrem Handy über die Sprachsteuerungsfunktion kommunizieren. Das Smartphone sucht ohne, dass eine manuelle Eingabe benötigt wird, die passende Anleitung. Somit benötigt der Handwerker für das Suchen der Informationen keine Hände und hat diese für die handwerkliche Tätigkeit frei.

Steuerung
Um bei Smart Homes die Funktionen des intelligenten Gebäudes in vollem Umfang nutzen zu können ist eine intelligente Steuerung über Sprachbefehle und Gesten sinnvoll. Hierbei gibt es bereits einige Anbieter für Haussysteme die eine Integration von Amazons Alexa ermöglichen. Hausbesitzer können dadurch Musik, Beleuchtung, Beschattung, Temperatur und Videoübertragung steuern.

Durch die Sprach- und Gestensteuerung können viele Geräte ohne die Benutzung der Hände  bedient werden. Dadurch kann der Handwerker mit seinen Händen eine Tätigkeit ausführen während er gleichzeitig mit der Maschine kommuniziert oder sie steuert. Dies kann zum Beispiel für Schreiner von Vorteil sein.

Durch den Einsatz von der Sprach und Gestensteuerung wird der Berufsalltag zukünftig für viele Handwerker erleichtert werden. Durch das einfachere Dokumentieren und Erfassen von Daten können viele Prozesse und Arbeitsschritte optimiert werden. Über kurz oder lang wird sich dieser Trend durchsetzen und in vielen Unternehmen zu finden sein. Die Technologie ist jedoch auch Bestandteil weiterer digitaler Assistenzsysteme. So nutzen mobile Endgeräte, Datenbrillen oder Robotersysteme ebenfalls die Technologie oder werden durch diese gesteuert. Durch die steigende Bedeutung der digitalen Assistenzsysteme im Handwerk, wird sich auch dieser Stellenwert als (Teil-) Disziplin der Sprach- und Gestensteuerung erweitern.

[Dorau, 2011]: Dorau, R.: Emotionales Interaktionsdesign, Gesten und Mimik interaktiver Systeme. Springer Verlag. Berlin/ Heidelberg. 2011

[Gallwitz, Niemann, Nöth, 1999] Gallwitz, F.; Niemann, H.; Nöth, E: Spracherkennung – Stand der Technik, Einsatzmöglichkeiten und Perspektiven. In: Wirtschaftsinformatik 41, 1999

[Kreifeldt, Roth, Preissner, Vöhringer-Kuhnt, 2012] Kreifeldt, R.; Roth, H.; Preissner, O.; Vöhringer-Kuhnt, T.: Bediensysteme mit Gestensteuerung – Stand der Technik und Zukunft, In: ATZ elektronik. Ausgabe 04/2012

[Vogel-Heuser, Bauernhansl, Hompel, 2017] Vogel-Hauer, B., Bauernhansl, T.; Hompel, M: Handbuch Industire 4.0 Bd.4, Allgemeine Grundlagen. 2. Auflage. Springer Vieweg. 2017