Mit Twincat Speech ergänzt Beckhoff seine Automatisierungssoftware um ein Modul zur Sprachein- und -ausgabe. Der Automatisierungsspezialist aus Verl will damit dem Maschinenbediener die Interaktion mit der Anlage vereinfachen. So kann dieser beispielsweise bei Arbeiten an einer Maschinenkomponente auch ohne herkömmliches Bedienterminal einfach erfragen, wie sich geänderte Einstellungen auf das aktuelle Steuerungs- oder Simulationsprogramm auswirken. Überschreitet eine Anlage vorher definierte Grenzwerte, können zudem entsprechende Alarmmeldungen akustisch ausgegeben werden.
Bei der Spracheingabe wird der gesprochene Text unter Berücksichtigung der jeweils gewünschten Sprache mittels Automatic Speech Recognition (ASR) erkannt und anhand von vordefinierbaren Grammatiken analysiert. Das Resultat wird dem Maschinenbediener zur Verfügung gestellt, damit dieser eine bestimmte Aktion innerhalb seiner Maschinenapplikation durchführen kann. Dabei kann es sich entweder um eine simple Aktion, wie das Einschalten einer Lampe, oder auch um den Start einer komplexeren Zustandsmaschine handeln.
Die Sprachausgabe hingegen transformiert einen Text in ein Audiosignal und gibt dieses bei Bedarf über eine angeschlossene Audio-Hardware, etwa einen Lautsprecher, aus. „Durch eine geschickte Kombination der beiden Funktionalitäten lassen sich mit Twincat Speech auch komplexe Workflows konfigurieren, wie man sie zum Beispiel aus einer Telefon-Hotline kennt. Als Ergebnis entsteht ein Sprachdialog mit der Maschine“, erläutert Sven Goldstein, Produktmanager Twincat, Connectivity & Automation Interface bei Beckhoff. Das Twincat-Modul soll insgesamt 26 Sprachen erkennen. Im deutschsprachigen Raum kann man dann mit Hans plaudern – so heißt auch der Firmengründer Hans Beckhoff.
Sprachsteuerung mit Twincat – auch offline
Besonders wichtig war dem Unternehmen, dass sich die Funktion auch ohne bestehende Internetverbindung, also offline, nutzen lässt. „Bei vielen Maschinenapplikationen ist eine ständige Onlineverbindung nicht erwünscht oder nur schwer durchsetzbar. Daher legen wir großen Wert darauf, dass unsere Produkte, wie Twincat IoT und Twincat Analytics, auch ohne Internetverbindung auskommen können“, führt Goldstein aus.
Die Sprachein- und -ausgabe wird offline durch eine Built-in-Funktionalität von Windows unterstützt. Für die Sprachausgabe kann der Kunde bei Bedarf aber auch auf Cloud-basierte Onlinedienste zurückgreifen, wie den Text-zu-Sprache-Dienst Polly von Amazon. In beiden Fällen werde mithilfe von Deep-Learning-Technologien eine realistisch klingende Sprachausgabe synthetisiert, heißt es. Möglich sind zudem unterschiedliche Stimmen sowie das Caching von online generierten Audiodateien. (nu)
„Twincat Speech ergänzt unser Automatisierungssystem“
2013 hat Beckhoff auf der Fachmesse SPS IPC Drives mit Google Glass einen Ansatz der freihändigen Maschinensteuerung vorgestellt – davon hat man nie wieder etwas gehört. Warum nun Sprachsteuerung?
Twincat Speech ergänzt unser Automatisierungssystem im Hinblick auf das, was ein Anwender als „natürlich“ empfindet: den Einbezug von Sprache und Hörvermögen in die Steuerung. Bei Technologien wie Google Glass werden zunächst Informationen visuell aufbereitet und dem Anwender zur Verfügung gestellt. Für das Nutzen dieser Informationen beziehungsweise das Reagieren darauf sind nach wie vor Gesten erforderlich, was keine wirkliche „hands-free“-Interaktion darstellt. Die Sprachsteuerung hat gerade in den letzten Jahren durch Technologien aus dem Consumerbereich (wie Amazon Echo oder Siri von Apple) Einzug in unser tägliches Leben erhalten und ist durch ihre einfache und natürliche Bedienung nicht mehr wegzudenken.
Steigt Beckhoff damit ins Geschäft der KI ein?
Zunächst möchten wir für die Sprachfunktionalitäten das nutzen, was uns das Betriebssystem auf unseren PC-basierten Steuerungen bietet. Bei den (in Twincat Speech optionalen) Onlinediensten möchten wir die Sprachdienste von Cloud-Anbietern integrieren, mit denen wir seit einigen Jahren durch andere Softwareprodukte wie Twincat IoT oder Twincat Analytics in Kontakt sind.
Für welche Anwendungsszenarien eignet sich Twincat Speech?
Die Anwendungsszenarien sind sehr vielfältig. So kann ein Maschinenbediener zusätzlich zur Visualisierung am standortabhängigen Bedienpanel auch akustische Informationen über den Zustand seiner Maschine bekommen oder diese gezielt abfragen. Auch im Bereich Gebäudeautomation lassen sich sehr schnell geeignete Anwendungsszenarien finden. Aber neben den klassischen und schnell greifbaren Szenarien, wird es für uns sehr spannend sein zu sehen, auf welche Ideen unsere Kunden für einen Einsatz der Technologie kommen werden.
Wann wird das Modul verfügbar sein?
Unsere aktuellen Planungen sehen vor, dass wir zur SPS IPC Drives 2018 (27. bis 29. November in Nürnberg) eine Beta-Version zeigen werden. Die globale Verfügbarkeit als Releaseversion wird dann voraussichtlich in der ersten Jahreshälfte 2019 erfolgen.
Wie sieht der Preisrahmen für das Modul aus?
Aktuell können wir leider noch keine Preisinformationen nennen. Wir werden uns bei der Preisgestaltung aber an unseren anderen sogenannten „Supplement“-Produkten orientieren.