
Die Zukunft der Bots: Voice als primäre Computerschnittstelle
Zu meiner Studienzeit hatte ich ernsthafte Zweifel daran, dass Sprache jemals eine brauchbare Computerschnittstelle werden würde, aber die rasanten Fortschritte in der Bot- und KI-Technologie haben mich dazu gebracht, diese Haltung zu überdenken. Ich habe mit Martin Beeby, Technical Evangelist bei Microsoft, und Oscar Merry, Mitbegründer/CTO von Opearlo, darüber gesprochen, wie sie sich die Zukunft von Bots und KI vorstellen. Beide sind der Meinung, dass sprachgesteuertes Computing früher kommen wird, als viele erwarten.
Sehen Sie sich hier den Ausschnitt unseres Gesprächs an, oder scrollen Sie unter das Video, um die Abschrift zu lesen.
Voice als primäre Computerschnittstelle (Vollständiges Transkript)
Martin Beeby (Technischer Evangelist bei Microsoft): Nein, ich vermute, das Einzige, was ich über diesen ganzen Bot-Bereich weiß, ist, dass ich erst seit etwa sechs bis sieben Monaten wirklich an der Entwicklung von Bots beteiligt bin. Seitdem hat sich die Art und Weise, wie wir Bots entwickeln und wie wir unseren Kunden empfehlen, Bots zu entwickeln, stark verändert. Und ich vermute, dass dies eine sehr schnelllebige Branche ist.
Es entstehen ständig neue Kanäle, es gibt viele verschiedene Möglichkeiten. Ich glaube, wir stehen wirklich an der Schwelle zu dem, was als Nächstes kommen wird. Und ich vermute, dass die Dinge in sechs Monaten oder vielleicht in einem Jahr ganz, ganz anders aussehen werden, als sie jetzt aussehen.
Sam Machin (Nexmo Developer Advocate & Alexa Champion): Es geht definitiv sehr schnell voran. Was mich immer wieder überrascht, ist, dass ich jahrelang dachte, dass Sprache niemals eine Schnittstelle sein würde. Ich meine, wie lange gibt es schon Dinge wie DragonDictate oder diese Art von Idee, dass man mit seinem Computer sprechen kann, um... Ich erinnere mich an meine Schulzeit, ich meine, das ist 15 Jahre her oder so, die Idee, dass ich meinen Aufsatz nicht mehr abtippen muss. Ich könnte meinen Aufsatz einfach dem Computer vorlesen und er würde das Abtippen übernehmen. Und es hat nie funktioniert und so. Und jetzt...
Martin: Das ist genau wie die Touch-Metapher, die ich um 2004 herum verwendet habe, genau wie Touch-Schnittstellen waren. Viele Leute würden sagen, dass man Touch niemals als Haupteingabe für sein System verwenden kann. Man braucht immer Maus und Tastatur, so ist es nun einmal. Und dann hat sich herausgestellt, dass das nicht stimmt.
Und ich glaube, dass das Sprachproblem zwar viel schwieriger zu lösen ist, aber es wird gelöst werden. Und es wird sehr schnell gelöst werden. Und es wird ein Zeitpunkt kommen, an dem die Eingabe in Systeme generell durch Voice erfolgen wird. Ich denke, das ist beängstigend, aber auch sehr interessant, weil sich dadurch viele Dinge ändern.
Wenn man z. B. keine Geräte mit Bildschirmen mehr braucht, dann eröffnen sich viele verschiedene Szenarien. Und es verändert die Art und Weise, wie wir mit Technologie umgehen. Es ist nur eine Frage des Zeitpunkts, nicht des Ob, denke ich.
Es wird ein Zeitpunkt kommen, an dem die Eingabe in die Systeme im Allgemeinen durch Sprache erfolgen wird.
Sam: Interessant. Sie glauben also, dass wir am Ende mehr unsere Computer steuern werden, um unsere Arbeit zu erledigen, als nur über Sprachschnittstellen und KI-artige Assistenten oder...
Martin: Ganz genau. Das ist durchaus denkbar. Und das ist definitiv die Art und Weise, wie Sprachsysteme entwickelt werden. Sie versuchen, mehr und mehr natürliche Sprache zu verstehen, aber ich glaube, dass sie sich zu Ambient-Computing-Geräten entwickeln werden, bei denen man nicht unbedingt einen Bildschirm vor sich haben muss. Man muss nicht unbedingt eine Touch-Oberfläche haben. Es wird viel mehr sprachgesteuert sein. Ich sehe keinen Grund, warum das nicht in den nächsten 10 Jahren oder so erreicht werden könnte. Und das wird das Betriebssystem sein, Ihre Sprache wird Ihr Betriebssystem sein.
Ihre Sprache wird Ihr Betriebssystem sein
Sam: Cool und beängstigend zugleich, denke ich. Aber wir bekommen immer noch... es ist Star Trek.
Martin: Wenn man sich die großen Technologieunternehmen anschaut, dann investieren sie deshalb so viel in die Spracherkennung. Denn das ist die Art und Weise, wie sie ihre Betriebssysteme in Zukunft nutzen wollen. Deshalb ist es so wichtig und entscheidend, und deshalb fließen gerade jetzt Milliarden von Dollar in die Sprachforschung.
Sam: Oscar, gab es noch etwas, das du erwähnen wolltest?
Oscar Merry (Mitbegründer & CTO bei Opearlo): Ich denke, wir haben alles abgedeckt. Ich denke, eine Sache, über die ich immer spreche, wenn ich auf Meetings oder bei Vorträgen wie diesem bin, ist, dass ich glaube, dass die Zukunft, die Martin beschreibt, schneller kommen wird, als viele Leute denken. Ich meine, wir werden sehr schnell an einen Punkt gelangen, an dem jeder Haushalt einen digitalen Assistenten hat und die Menschen diesen als erste Schnittstelle zu ihrer Marke nutzen. Und ich glaube, das wird viel schneller passieren, als viele Leute denken.
Wir werden sehr schnell an einen Punkt kommen, an dem jeder Haushalt einen digitalen Assistenten hat und die Menschen diesen als erste ... Schnittstelle zu ihrer Marke nutzen.
Martin: Ganz genau. So war es auch bei Touch. Es dauerte buchstäblich nur ein Jahr, bis der Tastsinn nicht mehr miserabel, sondern ausgezeichnet war. Und ich denke, das wird auch mit der Sprache passieren.
Oscar: Ja. Und im Moment erkennen viele Leute nicht, dass das passieren wird oder glauben nicht daran, weil die Technologie noch nicht ganz ausgereift ist. Und die Menschen machen immer noch die frustrierenden Erfahrungen, über die wir gesprochen haben. Aber es wird der Moment kommen, in dem die Technologie plötzlich so gut ist, dass die Mehrheit der Menschen wirklich gute Erfahrungen macht. Und das wird der Fall sein.
[Anmerkung der Redaktion: Sehen Sie die vollständige einstündige Diskussion über den Stand der KI-Bot-Technologie.__]**