従来のチャットボットよりはるかに自然なやりとりができるChatGPTなど、データの分析にとどまらず、あたかも人間のように新たな文章や画像、音楽などを生成する「生成AI」が注目を集めている。
そのインパクトについて、生成AIを開発する企業の日本代表を務めるジェリー・チー氏と、世界のテクノロジーとビジネスを目利きし、投資している山本康正氏に対談形式で聞いた(対談実施日:2023年3月8日)。
※本稿は、山本康正著『アフターChatGPT』(PHPビジネス新書)より内容を一部抜粋・編集したもので、『THE21』2023年6月号にも「生成AIは、私たちのビジネスと働き方をどう変えるのか?」として掲載されたものです。
――Stability AIは、どんなAIを開発しているのでしょうか?
【ジェリー】他の企業や組織と一緒に作ったStable Diffusionというディープラーニングのモデルを昨年8月に公開したところ、非常に大きな反響がありました。テキストを入力すると画像を自動で生成するものです。
そんなAIを自分のパソコンで使えることはそれまでなかったので、一種のパラダイムシフトだったと思います。生成AIのブームの引き金の一つになったのではないでしょうか。
その後もStable Diffusionの改善を続けていて、テキストを入力すると3Dモデルや動画をアウトプットするようにしたり、チャットボットも開発したりしています。言語は、英語と日本語の両方で開発しています。
――Stable Diffusionを使ったLINEのチャットボットは、日本でも広く話題になりました。
【ジェリー】テキストを入力すると画像を生成するAIは、Stable Diffusionの少し前に、OpenAIがDALL・E(ダリ)を発表しています。それとの違いは、Stable Diffusionはオープンソースであること。誰でも自由に無料でダウンロードできて、自由に改造できます。
――山本さんは、Stable Diffusionが発表されたとき、どう思いましたか?
【山本】面白いと思いました。
Midjourneyという画像生成AIも、ほぼ同じ時期に発表されましたよね?
【ジェリー】Midjourneyがちょっと早いです。
【山本】この二つが出てきて、飛躍が起こったなという感じが伝わりましたね。
テック企業の毎年の発表会では「AIでこんなことができるようになりました」という発表はよくあるんです。でも、それが一消費者に直接伝わる形で出てきたのが昨年の夏。ここから本当に変わったと思います。
――山本さんは、画像生成AIは新たなビジネスを生み出していくと思いますか?
【山本】ビジネスになるかどうかは一過性のブームで終わるかどうかによりますが、どうやら一過性ではなさそうです。
すると、事業を売却する、既存のプラットフォームと提携する、広告モデルで収益を上げる、消費者からの課金モデルで収益を上げるなど、様々な方法が考えられます。
ちょっと思ったのは、YouTubeが登場したとき、グーグルが対抗して自社製品で追い付こうとしたのですが追い付かず、結局、YouTubeを買収したようなことが起こるのではないかということです。
一方で、フェイスブック(現メタ・プラットフォームズ)は、ヤフーやマイクロソフトから買収の提案がありましたが、独自にやっていくことを選びました。
Stability AIも独自にやっていくことを今は選んだようですね。
――ジェリーさんは、どんなビジネスを考えているのですか?
【ジェリー】日本にはクリエイターが大勢いて、クリエイティブな企業や組織もたくさんあります。彼らの能力を拡張できるAIを提供していきたいと考えています。
例えば、ストーリーやキャラクターなどを考えるときのブレストにAIを使うと、一気に色々なアイデアが出てきます。人間だとブレストの内容を描く時間と労力がかかりますが、AIなら一瞬です。
最初は画像や動画を多く制作している企業にアプローチをしていきたいと思いますが、中長期的には、ほとんどの産業で生成AIの活用事例が出てくると思います。
更新:11月21日 00:05