https://d226lax1qjow5r.cloudfront.net/blog/blogposts/cross-platform-bot-development/Bots-Clip8_800x300.jpg

クロスプラットフォームボット開発の期待と課題

最終更新日 May 7, 2021

所要時間:1 分

すべての主要なボットプラットフォームに展開できるテキストや音声のボットを構築することは、10年前にiOSやAndroid用のモバイルアプリを構築しようとしたのと同じではない。私は、Opearloの共同設立者兼CTOのOscar Merryとマイクロソフトのテクニカル・エバンジェリストのMartin Beebyに、開発者がクロスプラットフォームのボット開発にどのようにアプローチすべきか、また将来的にはどうなるのかについて話を聞いた。

この対談のビデオはこちらでご覧いただけます。

クロスプラットフォームボット開発の約束と挑戦(全文書き起こし)

サム・マチン (Nexmo Developer Advocate & Alexa Champion)です:いいですね。オスカー、皆さんは、特にプラットフォームに関してどんなことを発見しましたか?つまり、あなたは主にAlexaとGoogle Homeで開発しています。つまり、消費者向けの垂直プラットフォームです。プラットフォーム・ツールの環境はどうですか?

オスカー・メリー (オペアロ共同創設者兼CTO):音声のクロスプラットフォームがより重要になるにつれて、クロスプラットフォームの音声を実際に構築することが少し難しくなっています。そして、開発者が実際にクロスプラットフォーム向けに構築するのに役立つツールやプラットフォーム、SDKが追加され始めると思います。

クロスプラットフォームのVoiceを実際に構築するのは少し難しい。

今、私たちがアドバイスしているのは、あまり気にしないことです。Voice向けに開発したいのであれば、Alexaに集中することです。そして、1つのプラットフォームで音声のレッスンを学び、後日、GoogleやCortanaに拡張することができます。しかし、将来的にはクロスプラットフォームが本当に重要になると思います。そして今、それはちょっとした挑戦です。例を挙げると、Google HomeデバイスとGoogleのプラットフォームでは、Googleアクションを構築する方法が2種類あるため、開発者としては非常に混乱します。API.AIを使うか、Google Actions SDKを使ってボットプラットフォームを構築するかだ。そして、もしあなたがブランドなら、そこには消化すべきことがたくさんあります。これは、人々がすべての異なるプラットフォームで音声アプリを拡張するのを妨げる大きな要因だと思います。それを簡単にするための追加ツール、追加SDK、追加フレームワークが出てくると思います。

サム:iOSとAndroidしかなかった10年前と同じような感じかな。iOSとAndroidしかなく、どちらか一方に対応したものを作り、もう一方にも対応しなければなりませんでした。その後、PhoneGapのような、こういったビルドのためのプラットフォームが登場しました。PhoneGapやボイス・プラットフォームにとっても興味深い市場でしょう。

オスカー異なるプラットフォーム間で再利用できるものはたくさんあります。これまでお話ししたように、コンテンツをVoiceに対応させることで、デジタルアシスタントが音声で応答するコンテンツが意味を持つようになります。これらのことはすべて、プラットフォーム間で再利用することができます。そして、これらの学習はすべて1つのプラットフォームから得ることができる。しかし、私は間違いなく、この種のツールにはチャンスがあると思います。

マーティン・ビービー (マイクロソフト テクニカルエバンジェリスト):サム、あなたが言うほどひどいかどうかはわからない。というのも、iOSやAndroidはオペレーティングシステムに非常に深く根を下ろしており、クロスプラットフォームにするのは非常に難しいからです。クロスプラットフォーム化には開発者の多大な努力が必要です。グーグルホーム、アレクサ、コルタナの違いは、オペレーティングシステムにそれほど深く組み込まれていないことがほとんどです。少なくとも、AlexaからCortanaへのスキルの移植は、可能な限りシンプルで簡単なものにしようとしています。だから、誰かがもっとシンプルにするチャンスはあるかもしれませんが、iOSやAndroidのモバイルアプリのような問題領域にはないと思います。iOSとAndroidでは、それほど違いはありません。

サムインターフェイスであることに変わりはないよね。ただ受け渡しするだけなんだから。テキストを入れて、構造化されたリクエストを受け取って、レスポンスを構造化する。常にリクエスト・レスポンスで、同じように低レベルのものを扱うわけではないんだ。

マーティン:アプリケーションを再コンパイルしたり、まったく異なるシステムコールを作成したり、まったく異なるプロセス上に存在する可能性もありません。クロスプラットフォームの難易度はそんなものではありません。それよりもはるかに高いレベルです。誤解しないでほしいのですが、問題はまだあります。モバイルアプリの分野ほど、プラットフォームやチャネル、ボットフレームワークなどに緊密に結合しているとは思えません。

オスカーアプリケーションを移植することは、それほど重要ではないと思います。実際、かなりの数のAlexaスキルをCortanaに移植しました。あなた方のおかげで本当に簡単になりました。それよりも、音声アプリが稼動した後に何をするかが重要だと思います。私たちがクライアントのプロジェクトで発見したのは、音声アプリを公開したらすぐに、それは始まりに過ぎないということです。そこから、人々が何をしているのか、なぜ不満を感じているのかについて、本当の洞察を得ることができるのです。そして、バックエンドのコードやバックエンドのロジックを更新することができます。クロスプラットフォームで更新するのは問題ありません。課題は、Alexa Developer PortalのVoice Modelの一部を更新し、API.AIを通じてビルドされたGoogle Actionも更新し、Cortanaも更新したい場合です。ここで更新したっけ?と考えなければならないからです。また、さまざまなプラットフォームでVoiceアプリを公開した後の管理は、ワークフローとして管理するのが非常に厄介です。

Voiceアプリを公開したら、それは始まりに過ぎない。

サムつまり...おそらく、あなたはそれらを別個のものとして管理している。同じことをやっていても、実際には別々のアプリ、パッケージ、スキル、どんな呼び方でもいいんですが、それぞれを持つ必要があります。その機能はアレクサにはあるけど、コルタナにはまだないとか......」。

オスカー:バックエンドのロジックは再利用できるものが多いので、できる限り共有するようにしています。でも、アレクサやグーグル、マイクロソフトに渡す音声モデルの入力をどのように定義するかは別にしています。_

[編集部注1時間の 1時間のディスカッションAIボット技術の現状について]

シェア:

https://a.storyblok.com/f/270183/384x384/7fbbc7293b/sammachin.png
Sam Machinヴォネージの卒業生