Roboter lernen Small talk

Humanoide Maschinen sind in vielen Punkten schon sehr weit. In Alltagssituationen der Kommunikation versagen sie aber - noch.

Und kommst du heute noch mit in den Ausgang, Asimo? (Foto: Honda)
Autor:
Thomas Gräser

Beim Stichwort Roboter mag man einerseits an grosse Ungetüme denken, die in einer Fabrikhalle rund um die Uhr die selben Bewegungen ausführen. Andererseits aber an humanoide Roboter, die den Menschen immer ähnlicher werden.

Bei diesen humanoiden Robotern steckt die Fähigkeit, auf natürliche Weise mit Menschen zu kommunizieren, noch in den Kinderschuhen. Ein Gespräch in ruhiger Umgebung mit einem einzigen Menschen klappt schon erstaunlich gut. Bei mehreren Personen und bei Hintergrundgeräuschen funktioniert dies aber nicht mehr. Das Forschungsprojekt HUMAVIPS ist laut Pressetext Schweiz von der Europäischen Kommission mit umgerechnet knapp 4 Millionen Schweizer Franken gesponsert. Es soll den Robotern in den kommenden drei Jahren das plaudern, flirten oder gar den Small talk beibringen.

Gruppen und Gesten machen den Blechhaufen Mühe

Heutzutage gibt es noch keinen Roboter, der alle Feinheiten der menschlichen Kommunikation (richtig) zu interpretieren weiss. Dazu gehören Gesten, der Blickkontakt oder andere körpersprachliche Hinweise. Auch ist es für einen Roboter bisher kaum möglich, in einem Raum von mehreren sprechenden Personen zwischen irrelevanten Hintergrundgeräuschen und dem mit ihm sprechenden Gegenüber zu unterscheiden.

Mit dabei beim Forschungsprojekt ist auch Jean-Marc Odobez vom Schweizer Forschungsinstitut Idiap. Er bestätigt, dass hier noch viel erreicht werden muss. Zum einen in der Interpretation der nonverbalen Kommunikation des Gesprächspartners, andererseits aber auch in der eigenen Reaktion auf diese Aussagen. Der Mensch bleibt nicht stumm und starr, wenn das Gegenüber spricht, sondern geht mit Nicken, Kopfschütteln, Lächeln oder Kommentaren auf die Aussagen ein.

Die über die Kameras gesammelten Informationen müssen in Zukunft also nicht nur zur erfolgreichen Orientierung und Fortbewegung genutzt werden. Die über Mikrofone gesammelten Audiodaten werden analysiert, um Kommandos herauszuhören oder ein Gespräch führen zu können. Nimmt man nun noch die Analyse der visuellen Daten hinzu, darf eine enorme Steigerung der Kommunikationsleistungen eines Roboters erwartet werden.

Roboter in drei Jahren gesellschaftsfähig?

Da dieses Zusammenbringen von Audio- und Videodaten völlig neu ist, hat man sich im Projekt die Ziele gesetzt, dass der Roboter nach den drei Jahren in einem Raum mit vier oder fünf Menschen die Anzahl der sprechenden Personen bestimmen kann. Und er soll die menschliche Sprache von Hintergrundgeräuschen unterscheiden können.

Kommentar hinzufügen

Facebook