#44「生成AI使ってますか?」
ChatGPTを皮切りにさまざまなAIツールが日常的に使われるようになりました。今回は簡単にAI関連のツールをふり返りつつ、どんなツールがWeb制作で使えそうかをざっくりお話ししました。
※ オフラインのため、音声ファイルを再生できません。ネットワーク状況をご確認の上、再度アクセスしてください。
加藤 : 皆さん、こんにちは! ミツエーリンクスの加藤です!
佐竹 : 佐竹です!
加藤 : はい、では今回もミツエーテックラジオやっていきたいと思います。ミツエーテックラジオは、株式会社ミツエーリンクスのスタッフが、Webデザイン、Webフロントエンドなどの、Web技術に関するニュースやツールをシェアするポッドキャストです。えー早速ですが今日はAIについて話をしたいなと思います!
佐竹 : うーん、このところ毎日のようにAIに関する新しいツールとか、AIをうまく使う方法!みたいな情報が出てきますよね。種類も多いのでどのAIをどう活用していったらいいんだろうというところが、まぁ最近の悩みどころにはなってます。
加藤 : はい、それはかなりありますよね。今回はいくつかのAIを取り上げてこんな使い方できるよねー、みたいな話をざっくりしていけたらいいかなーと思います!
加藤 : はい、ということで、えーまずはAIを使ったツールにはどんなものがあるのかっていうのをいくつか取り上げて簡単に紹介できたらなと思いますが、毎日のようにあのツールのアップデート情報が出てきているので、お話しする内容は収録時点での内容で、タイミングによっては古くなっている可能性があるので、そのあたりご注意いただきながら聞いていただければと思います。 で、今回は、AIの中でも文章や画像、音声を生成する機能を持ついわゆる生成AIと呼ばれるツールについて話せればと思います。
佐竹 : あー、AIという範囲になると今は家電にも含まれていて広大になってしまうので、Web制作で活用できそうな生成AI縛りでということですね。
加藤 : そうですね。
佐竹 : 加藤さんは普段よく使われてる生成AIって何かありますか?
加藤 : プログラミングに限らず、考え事をするときはやっぱりあの文章生成AI のChatGPTにはかなりお世話になってますね。分からないことがあったりとか、別の視点からの意見が欲しいときとかにも使ってます。
佐竹 : 私もChatGPTはよく使ってます。あの、チャットベースのUIだと入力も出力もコンスタントにやりとりできるんでいいですよね。あと他にChatGPTと似たようなツールだと、えーHuggingChatとかもありますよね。
加藤 : そうですね。HuggingChatは一応まだデモンストレーション目的としてしか使えなくて、私が以前使った時も日本語で入力しても回答が英語返ってくるみたいな状況でしたね。まぁただ返答内容は適切なものだったので、日本語の入力内容はなんとなく理解できているのかなと思います。
佐竹 : となると、英語に不安がある場合は翻訳ツールと一緒に使っていくっていうことにはなりそうですかね。これからどんな感じで成長してChatGPTとの差別化をどう図っていくのかという点に注目したいですね。
加藤 : うん、そうですね。ちなみになんか現時点だとHuggingChatとChatGPTは何が違うんでしたっけ?
佐竹 : そうですね。HuggingChatはHugging Faceという会社が作ってるツールで、オープンソースで開発されているのが大きな特徴かなと思います。
加藤 : うん、そうですね。ChatGPTはOpenAIが開発しているGPT-3とか、そのGPTシリーズの言語モデルを使ってますけど、HuggingChatは言語モデル自体もオープンソースのものを使ってるんですよね。
佐竹 : そうですね。言語モデルによってまぁ特徴があるみたいなので、そのあたりを理解して使うと、求めるものにより近いアウトプットが得られるかもしれないですね。
加藤 : でー、画像生成系だと去年の夏くらいにStable Diffusionっていうテキストによる画像生成に特化したモデルがオープンソース化されたことでかなり盛り上がってたかなーと思います。
佐竹 : あー、Stable Diffusionですかー。気になってはいたんですけど、ちょっと言い訳しちゃうとUI開発者なので画像を作ることが私は少ないんですよね…なのであの環境構築が必要だったり、学習コストがちょっと高めにみえたので、試してみるAIとしては優先順位は下げちゃってたんですねー。
加藤 : まぁ出てきた当初はやっぱそうでしたよね。まぁただそのーオープンソースされてから少しした後は、Stable Diffusionを簡単に使うためのWeb UIを用いたツールがいくつか出てきたりとか、今だと開発元であるStability.aiがブラウザで画像生成できるDreamStudioというアプリを公開していたりとか、あとは他にもスタンドアローンで使えるアプリとかもあったりするみたいですね。
佐竹 : 1年弱でそんなことになっていたんですね。いや、ほんとAIの進化ってすごいですね。
加藤 : そうですね笑
佐竹 : あと画像生成系でいうと、他にはAdobe Fireflyとかですかね。
加藤 : あーそうですね。Fireflyは言語モデルの学習データをAdobe Stockにある画像とか、あと他にもオープンライセンスで公開されている画像に絞っているらしいですね。
佐竹 : ですね。ギャラリーのページに例がたくさん載ってるんですけど、どういうテキストをもとに生成された画像なのかっていうのも一緒に見られるので、イメージしやすいなと思いましたね。
加藤 : そうですね。私は絵心全くないので、これはとてもイメージしやすくてありがたいです。他にもまぁGoogleのAIである「Bard」と連携するという発表があったりとか、画像だけじゃなくて、テキストベースで動画を作る機能っていうのも研究中らしいんで、Adobe Fireflyも今後期待できそうだなと思ってます。 で、最後は音声を生成するツールなんですけど、音声周りはまだ目立ったツールはなさそうですかね?
佐竹 : そうですね。ただOpenAIにはWhisperっていう音声認識に特化したモデルがあって、Audio APIをつかえば、音声ファイルをテキストに変換する、っていうような、いわゆる文字起こしをしたり、文字起こしをしながら特定の言語に変換するっていうこともできるみたいですよね。ちなみにHugging FaceにOpenAIのスペースがありまして、Whisperのデモページもあるので、そこで試してみることもできるみたいです。
加藤 : うん、このデモページは音声からテキストを生成するのに使われてますけど、逆にテキストから自然な合成音声を作るツールっていうのもすぐ増えてきそうな気がしますね。
はい。生成AIを使ったツールについてざっくり話したところで、ここからは少しWebサイト制作に寄せて、どんな使い方ができるのかを話していきたいと思います。
佐竹 : はい。
加藤 : これもほんとにいろいろあるんですけど、まぁデザインツールだとやっぱりFigma関連がかなり期待できそうですね。たとえば、ヘッドレスCMSのBuilder.ioっていう会社がGenerate Figma Designs with AIっていう名前そのままのFigma用のプラグインを出したんですけど、これたとえば「なんとか.comっぽいプロダクトページを作って」っていうテキストから、ページデザインが生成されたりとかするみたいなんですよね。
佐竹 : じゃあモック作成みたいなイメージを即、形にしたいときとかによさそうですね。
加藤 : そうですね。あとはデザインツールを作ってるDiagramという会社もいくつかAIを使ったFigmaのプラグインを出していて、テキストベースでアイコンや画像を生成できるMagicianとか、まだ公開されてないみたいなんですけどAIがペアデザインしてくれるGeniusとかっていうのもなんかイメージを見てるとかなりすごそうですね。
佐竹 : あーFigmaって人と人とではペアデザインするのはできますよね。えー、それをAIとやるっていうとどんな感じなんですかねー。
加藤 : うーんそうですね…やっぱり人が相手だと互いにその、都合の良い時間の調整をしないといけなかったりすると思うんですけど、AIが相手だったらいつでも好きなときにペアデザインできるし、そういった意味でデザインで悩む時間も減らせるかもしれないですね。
佐竹 : そうですね。あと使ってみないと分からないですけど、サイズだったり位置とかの数字を機械的に判断するのはやっぱり人よりAIの方が早いんじゃないかなって思ってるんで、その辺は期待したいですね。
加藤 : たしかにそれはありそうですね。ひとまず公開されたら試せるようにwaitlistに登録しておきたいと思います。
プログラミングに関していうとやっぱりGitHub Copilotとかですかね?実は私はまだあまり使ったことがないんですが。
佐竹 : そうですね。まだプレビューですけど、Copilot Xを見てると、かなり使えそうかなっていう印象ですね。とくにテストコードを書いてくれるのは便利そうだなーと思います。
加藤 : たしかにそうですね…テストケース考えたりするの結構難しかったりするので、そのあたりアシストしてくれると嬉しいですね。で、GitHub関連だとプルリクエストの説明文を勝手に書いてくれたりとか、コードレビューもしてくれるCopilot for Pull Requestsもとっても良さそうです。
佐竹 : それ、いいですね。当社だと主にGitLabを使ってますけど、GitLabではそういうAIはないんですかね??
加藤 : GitLabではまだ公開には至ってないんですけど、AIによるアシスト関連のページっていうのが用意されていて、そこに今後の方針がいろいろ書かれていたので、今後に期待って感じだと思います。
佐竹 : それは楽しみですね!
加藤 : はい。あとは、あのー社内でも、どういうときにAI使ってますかー?って簡単にアンケートとってみたんですけど、ChatGPTをつかって、正規表現とか、エスケープシーケンスとか、SQL文を作成していたり、あとは翻訳に使ったりとかしているみたいですね。
佐竹 : 皆さんやっぱりAIを取り入れていっているんですね。翻訳だとAIじゃないツールを使っていたんですけど、AIの方が精度が良かったりするんですかね?
加藤 : あー、なんかあのーより文脈に沿った翻訳をしてくれたりとか、あとは技術用語とか、たとえば略語を正式名称に展開して翻訳してくれたりとかするみたいですね。
佐竹 : あーなるほど。今イメージしたんですけど、翻訳のAIって海外の人がコメントするときに、あのー隣でわかりやすく意訳してくれる通訳さんみたいですね。
加藤 : あーたしかに。うん、そのイメージが近いかもしれないですね。
加藤 : はい、ここまで生成AIを使ったツールを活用する話をしてきましたが、今日話した内容が、ほとんどここ半年の出来事というのがやっぱり信じられないですね…。まだまだ話し足りないことはたくさんあるんですけど、今回はこの辺りで終わりにしようと思います。
佐竹 : はい。情報が溜まってきたらまたやりたいですね。
加藤 : そうですね。では最後に、ミツエーリンクスではスマートなコミュニケーションをデザインしたいUIデザイナー、UI開発者を募集しています。採用サイトではオンライン説明会やオンライン面接なども行っていますのでチェックしてみてください。
また、このPodcastはApple Podcast、Google Podcast、Amazon Music、Spotify、YouTubeで配信していますので、お好みのプラットフォームでフォローいただけると、最新のエピソードをすぐ視聴できます!こちらもぜひご活用ください。 「#ミツエーテックラジオ」でご意見、ご感想、こんなこと話してほしいというリクエストなどもお待ちしております。 それでは今日はこの辺で!ありがとうございました!
佐竹 : ありがとうございました!