Neue Interaktionsarten: Geräte mit Bewegungen und Sprache steuern

Sprachsteuerung und Gestensteuerung: Sind das Gegensätze? Wo haben die Technologien Vor- und Nachteile, wo ergänzen sie sich und wie sieht es im Vergleich mit Touchscreen und Tastatur aus?

Sprachsteuerung

Die Sprachsteuerung gilt als einer der wichtigsten und größten Schritte im Bemühen um eine weitere Digitalisierung. Sprachassistenten wie Alexa oder Siri und die Sprachsteuerung im Auto sind die bekanntesten Beispiele für den Einsatz dieser Technologie. Im industriellen Einsatz finden Sprachsteuerungen zum Beispiel auch für die Bedienung von Smartglasses Anwendung oder in Projekten zum Einsatz von sprachgestützten Chatbots. Für spezifische Fachbereiche lassen sich eigene Vokabulare eintrainieren, z.Bsp. in der Medizin.

Heutige Spracherkennungssoftware nutzt, ähnlich wie unsere Gestensteuerung, zur eigentlichen Erkennung meist neuronale Netzwerke oder hybride Ansätze (neuronale Netzwerke + Hidden-Markow-Modelle).

Vorteile

  • Ausgereifte Technologie
  • Breite Verfügbarkeit
  • An Nutzer und Fachvokabular anpassbar
  • Einfache Bedienung
  • Auch komplexere Eingaben können effizient erledigt werden

Nachteile

  • Probleme mit lauten Umgebungen
  • Meist Serververbindung notwendig
  • Teils Probleme mit Dialekten
  • Privatsphäre / sensible Informationen können nicht eingegeben werden
  • Eingeschränkte Korrekturmöglichkeiten
  • Nicht geeignet für häufig wiederkehrende, „monotone“ Arbeiten bzw. Eingaben

Gesten- und Bewegungssteuerung

Die Gestensteuerung ist eine neuere Art der Interaktion, wenngleich bewegungsbasierte Steuerungen insgesamt schon seit längerem etabliert sind. Im privaten Bereich wurden Bewegungssteuerungen erstmals mit der Nintendo Wii einem größeren Publikum bekannt. Auf professioneller Ebene kommt insbesondere die Gestensteuerung es in verschiedenen Varianten zum Einsatz – als kamera- und als wearable-basierte Ausführungen. Die Anwendungsfälle reichen dabei von der Bedienung technischer Systeme wie Robotern bis zum Ersetzen klassischer Eingabemöglichkeiten in verschiedensten Szenarien.

Ein besonderes Potential versprechen sich viele von einer automatisierten Bewegungserkennung, mit der beispielsweise spezifische Arbeitshandlungen erkannt werden können. So könnte überprüft werden ob benötigte Bewegungen während eines Prozesses auch tatsächlich ausgeführt wurden oder auch bestimmte Bewegungen mitzählen. Das wäre zum Beispiel für das betriebliche Gesundheitsmanagement spannend. Auch hier ist man im privaten Bereich schon etwas voraus: Moderne Smartwatches zählen bereits Liegestütze und andere Fitnessübungen auf Nutzerwunsch mit. 

Vorteile

  • Einfache Steuerungsmöglichkeit
  • An Nutzer und Wunschgesten anpassbar
  • Einfache Bedienung
  • Bedienung kontinuierlicher Eingaben und durch Sprache nicht vermittelbarer Eingaben (z.B. Navigation in einem Plan oder auf einer Karte)

Nachteile

  • Nicht für komplexe Eingaben geeignet
  • Nutzer müssen Gesten lernen oder System trainieren
  • Anwendungen müssen meistens angepasst werden (kaum native Schnittstellen verfügbar)

Fazit

Die beiden modernen Benutzerschnittstellen Sprach- und Gestensteuerung ergänzen sich unserer Ansicht nach sehr gut und bereiten den Weg in eine digitalisiertere Welt. Gerade da, wo eine der Technologien Nachteile hat, kommen die Vorteile der anderen Technologie zum Tragen. Es wird zwar sicherlich viele Anwendungsfelder geben, die mit einer Eingabemethode auskommen; mächtige und gleichzeitig intuitive Schnittstellen werden aber mehrere Eingabemethoden kombinieren.

Newsletter

© 2020 Kinemic GmbH. Alle verwendeten Logos und Markenzeichen sind Eigentum ihrer jeweiligen Besitzer.