昨今chat GPTを始めとする生成AIが世間をにぎわせています。様々な職種がAIに取って変わられる可能性が示唆されており、かく言う私もAIについてえも言われない脅威を感じております。とはいえ、ただ恐れているだけでは得られるものは何もありませんから、生成AIを実際に使ってみたり、AIの勉強会に参加してみたりと、少しずつ勉強を始めているところです。今週、AI×医療というテーマの勉強会に2つ程参加したため、そこで得た知識を交えて生成AIについてまとめていきたいと思います。
生成AIの基本
ここでは簡単に生成AIとその関連語句について概説します。
あくまで確認程度の項目になりますので、読み飛ばして頂いても結構です。
生成AIとは
生成AIは、人工知能(AI)の一分野で、主にデータから新しい情報やコンテンツを生成する技術を指します。このアプローチでは、機械学習やディープラーニングなどの手法が活用され、モデルは大量の入力データを学習して、それをもとに新しいデータを生成する能力を獲得します。今までの技術は主に「識別」や「予測」を目的にしていたものが、生成AIはその名の通り「生成」、つまり一から何かを作り上げることを目的としています。
このため、生成AIは、文章、コード、画像/動画、音楽/音声といった、実にクリエイティブなコンテンツを作成することが可能です。
機械学習とディープラーニング
AIの話で必ず出て来るのが機械学習とディープラーニングという単語です。機械学習とディープラーニングは、どちらも人工知能(AI)の一種ですが、学習方法や特徴に違いがあります。
機械学習とは、データからパターンを学習して、そのパターンに基づいて予測や分類を行う技術です。機械学習には、以下の2つの種類があります。
・教師あり学習:正解データと入力データの両方を与えて学習する
・教師なし学習:正解データを与えずに学習する
ディープラーニングは、機械学習の一種であり、人間の脳の構造を模したニューラルネットワークを多層に重ねて、複雑なデータから特徴を抽出して学習する技術です。ディープラーニングは、教師あり学習と教師なし学習の両方に用いることができます。
機械学習は、ディープラーニングよりもシンプルなパターンを認識できるため、比較的簡単なデータ処理に適しています。一方、ディープラーニングは、複雑なパターンを認識できるため、複雑なデータ処理に適しています。
機械学習とディープラーニングの違いをまとめると以下のとおりです。
項目 | 機械学習 | ディープラーニング |
---|---|---|
学習方法 | データからパターンを学習する | データから特徴を抽出して学習する |
特徴 | シンプルなパターンを認識できる | 複雑なパターンを認識できる |
応用例 | 画像認識、自然言語処理、音声認識、機械翻訳、医療診断など | 画像認識、自然言語処理、音声認識、機械翻訳、医療診断、創作など |
機械学習とディープラーニングは、生成AIの基盤となる技術であり、生成AIの進歩には、機械学習とディープラーニングの進歩が不可欠です。
具体的には、機械学習とディープラーニングは、生成AIの以下の部分で活用されています。
学習:生成AIは、大量のデータから学習することで、新しいデータやコンテンツを生成することができます。機械学習やディープラーニングは、大量のデータからパターンを学習する技術であり、生成AIの学習に活用されています。
生成:生成AIは、学習したパターンに基づいて、新しいデータやコンテンツを生成します。機械学習やディープラーニングは、複雑なパターンを認識できるため、生成AIの生成に活用されています。
今後、機械学習とディープラーニングの進歩により、生成AIはさらに進化していくことが期待されています。
生成AIの歴史
生成AIの歴史については、1950年代にアラン・チューリングが基本的な概念を提唱したことから始まります。その後、「人工知能(artificial intelligence)」という名前がジョン・マッカーシーによって名付けられました。
1960年からは第1次AIブームが到来し、コンピューターの「推論・探索」や自然言語処理プログラム「イライザ」が誕生しました。2000年代後半には、先述のディープラーニングの登場により、画像や動画処理、テキスト分析、音声認識などのタスクで進化と研究が進んできました。 2018年には、最初の生成的事前学習トランスフォーマー(GPT)が開発され、2019年にはGPT-2がこれに続き、教師なし学習を多くの異なるタスクに汎化する能力を実証しました。
そして、2023年には、Open AIが開発したGPT-3を用いたChatGPTが世界的に普及し、生成AIが急速に普及するきっかけとなりました
Chat GPTのインパクト
GPT-3は、OpenAIが開発した大規模な言語モデル(LLM)です。LLMは、大量のテキストデータから学習した言語モデルであり、テキストを生成する、言語を翻訳する、質問に答えるなど、さまざまなタスクを実行することができます。
ChatGPTは、OpenAIが開発したGPT-3を搭載したチャットサービスであり、日本語や英語によるプロンプト(指示や質問)に対し、人間のような自然な回答を返すことができます。チャットサービスといえば古いウィンドウズで出てきたイルカが有名ですが、何を入力しても頓珍漢な返事しか返ってこず、何の役にも立たなかったと記憶しています。時代的にこのイルカくんとChatGPTを比較するのは酷なような気もしますが、技術の進歩たるや凄まじいですね。
さて、このChatGPTのインパクトは凄まじく、2022年11月末に発表された後、公開後5日間で全世界のユーザーが100万人を超え、公開2か月後には月間のアクティブユーザーが1億人を超えたといいます。また、2023年にはOoenAIがより進化したGPT-4を開発しています。
その後、googleのBardやMicroSoftのBing、Perplexity AIなど、様々な生成AIモデルが続々と発表されており、まさに世は生成AIの戦国時代に突入しているといっても過言ではありません。
現在使用できる生成AI
ChatGPTのリリースを契機に様々な生成AIが発表されていますが、ここでは代表的なものを紹介していきます。
ChatGPT
ChatGPTは前述した通り、OpenAIが開発した大規模言語モデル(LLM)によるチャットボットです。
料金は以下の3プランがあります。
・無料プラン(メール登録のみ)=GPT3.5
・ChatGPT Plus(月額20ドル)=GPT4
・アプリ(無料版と有料版あり)
無料版、有料版ともに2023年4月までにWeb上にあったテキストデータの情報を基に回答をしますが、有料版の方が応答時間の短縮、回答のクオリティが高い、処理できる情報量が多い、といった違いがあります。
また、有料版では追加機能により、
・Brouse with Bing:AI自らインターネット検索をして最新情報で回答
・DALL E3:画像生成
・Advanced data analysis:グラフや表の解析、作成
といったことが可能となっています。
私は無料プランしか使ったことがありませんが、機能の違いを見ますと、本気でChatGPTを活用するのであれば有料版一択だと思います。
Bing
BingはMicrosoftが提供する検索エンジンで、Bing AIはBingにGPT-4搭載の「AIチャット」を組み込んだものを指します。 Bing AIは、リアルタイム性と情報の確実性の高さが特徴で、質問した内容はBingの検索結果の情報を参照して回答されます。
Bingはアカウント登録さえすれば使用できますし、画像生成といったテキスト以外の作業も可能です。
Bard
BardはGoogle AIが開発した大規模言語モデル(LLM)です。
ChatGPTはGPTをベースにしていますが、Bardはgoogleが開発したLaMDAをベースにしています。
googleも2021年からLaMDAを開発していたものの、ChatGPTに後れを取ったことで慌ててリリースをしたような形になりました。ChatGPTやBingの流行によりGoogle検索の権威が揺らぐことを懸念しての行動だったようです。
当初はウェイトリストに登録し、承認されたユーザーのみが使用できましたが、現在は試験運用中にはなりますが誰でも使用することが可能です。
google検索と連携でき、リアルタイムの情報を基に回答してくれるのがウリとなっています。私が普通に使った分には違和感はありませんでしたが、ネットでの評価は今のところはChatGPTに軍配が上がっているようです。
Perplexity AI
Perplexity(パープレキシティ)とは、無料で利用できる対話型AI検索エンジンです。正式名称は「Perplexity.AI」であり、日本語での質問・回答にも対応しています。GPT3.5モデルを搭載し、Microsoft Bingの検索機能を組み合わせています。
アカウント登録やログインなしで無料で使用でき、かつ回答に出典元が明記されるという点が特徴的です。
結局どれを使えばいいのか?
現時点では生成AIの比較は難しく、絶対的な正解はないと思います。発展スピードが速い領域であり、実際にChatGPTのリリースから目まぐるしく情勢が変わってきています。1-2年後には全く違った勢力図になっているということも十分に考えられます。
あえてオススメするのであれば、生成AIを使ったことがない人はまずはBingから触ってみるのがよいでしょう。無料でGPT-4を使用でき、かつ最新の情報をベースにしているというのは強味だと思います。
同じ質問をしても生成AIごとに回答の傾向が全く異なるため、複数の生成AIを併用するのも面白いです。複数の生成AIに同時に同じプロンプトを投げることができるChatHubというサービスもあるので、興味がある方は使ってみるとよいと思います。
上手なプロンプトの作り方
「質問」や「命令」、「指示書」など、生成AIが回答を生成するための入力をまとめてプロンプトと呼んでいます。生成AIは基本的には当たり障りのない無難な回答を行う傾向があるため、高品質な回答を期待する場合にはこのプロンプトを工夫する必要があります。
さて、この生成AIを使いこなす上でキーとなるプロンプトですが、有名な型として「深津式プロンプト」と言われるものがあります。これはNote株式会社CXOの深津貴之氏が考案したものであり、生成AIに「回答条件を与える」ことで回答の精度を高めようとするものです。
もしこれから生成AIを触ってみるという方は、最初に何も考えずにやりとりをした後、上記の深津式プロンプトに則ってプロンプトを作成してみてください。かなり回答の質が変わることを実感できるはずです。
また、どの生成AIも日本語入力は可能ですが、英語でプロンプトを入力した方がその精度は高いようです。
生成AIを使用する上での注意点
まず第一に、生成AIが作成したテキストの信頼性が挙げられます。大規模なトレーニングデータを元に学習するこれらのモデルは、時折不正確な情報を生成する可能性があります。これをハルシネーションと呼んでいます。驚くことに、時には存在しない論文を作り出してソースとして提示してくることもあるといいます。このため、利用者は生成されたコンテンツを慎重に検証し、確実性を求める必要があります。
また、閲覧の上で会員登録やライセンスが必要となるような情報については、生成AIがアクセスできないため情報源として用いることができない点に注意が必要です。我々医療者としては、生成AIを医療情報の検索に用いたい所ですが、論文やUpToDateなどの二次文献については無料公開されているものしか参考にできず、wikipediaやMSDマニュアルといった、簡単にアクセスできるサイトから情報を引っ張ってくる頻度が高いというのが現状です。このため、専門的な内容について質問する際には十分注意する必要があります。
個人情報の管理についても重要です。生成AIは入力されたデータから学習するため、個人情報を入力してしまうとそれがネット上に流布してしまうことになってしまいます。個人情報は基本的には入力せず、やむを得ず入力する場合も匿名化は必須です。
加えて、生成AIの利用範囲についても把握しておく必要があります。我々医療者と関係がある点としては、論文の利用に関する部分です。ジャーナルによっては生成AIを使用した場合に公表を義務づけていたり、そもそも生成AIの利用を禁止しているものもあります。各雑誌の投稿規定は必ずチェックする必要があります。
最後に、生成AIの透明性に関する問題も挙げられます。これらのモデルはブラックボックスとして扱われることが多く、その動作メカニズムや意思決定プロセスが理解しにくいという課題があります。将来的な発展に向けては、透明性を向上させる研究や取り組みが求められます。
総じて、生成AIは未来のテクノロジーに大きな可能性を秘めていますが、信頼性、倫理、不確実性、透明性といった課題を解決するためには、開発者、研究者、利用者が協力して前進する必要があります。これによって、より安全で効果的な生成AIの実現が期待されます。
生成AIの使い方
テキスト作成
やはり生成AIの強みとなるのはテキスト作成になるかと思われます。
人間と比較し遜色のない、むしろきれいなテキストを作成してくれます。プロンプトさえしっかり入力すれば簡単なスピーチ原稿やメールの返信も書いてくれるので、文章を書くのが苦手な人は是非活用してみるとよいと思います。
テキストの要約、翻訳、校正
既存のテキストの解析も生成AIの得意とする分野です。
長い文章を文字数指定をして要約させたり、英語などの外国語を日本語に翻訳できます。
逆に日本語を英語に翻訳したり、書いた英文が正確であるか校正してもらうことも可能です。
前述した通り、論文作成に利用する場合は雑誌の利用規約を確認する必要がありますが、将来的には英語ネイティブの英文校正に提出するというひと手間がなくなるかもしれません。
また、テキストの要約だけでなく、Youtubeの動画の内容を要約することも可能であったりします。長すぎて視聴する暇のない動画も、この機能でざっくりと概要を把握することができます。
情報検索
これまでのキーワード検索では、自分自身で巨大な図書館(インターネット)の中で必要とする本(情報)を探し当てる必要がありましたが、生成AIによる検索では、生成AIという司書に、巨大な図書館の中にある本を探してもらい、さらにそこに書いてある内容を要約して提示してもらえるわけです。
インターネットの普及により情報化社会が進みましたが、生成AIの進歩によりさらに情報が手近なものとなることが予想されます。患者さんの医療知識もどんどん増えていき、質問も専門的になっていくかもしれません。
現時点では医療情報へのアクセスには限界があることは押さえておく必要がありますが、この点は今後改善していく可能性が高いです。例えば、すでにDynamedでは専用のチャットボットが実装されており、Dynamed内の情報を基にChatGPTのような情報検索が可能です。今後はエルゼビアやUpToDateにも実装されると思われ、医療情報の検索の面でも生成AIが活用できるようになるはずです。
また、自炊した教科書をChatGPTに読み込ませて情報源とし、特製のChat Botを作る、なんてこともできるみたいです。特定の分野のガイドラインを集中的に読み込ませることで、生成AIを診療に役立てることもできそうですね。
このような生成AIの情報源をカスタマイズする使い方は今後普及していくものと思われ、もしかしたらApple storeのようなChat Bot Storeなるものができ、ほしいChat Botを購入する、なんて時代がくるかもしれません。
アイディア出し
何かを新しく考える時に、生成AIをサンプルやアイディアの例を提示することに使用することができます。臨床現場で使う場面は少ないですが、それ以外の雑務で役立ちます。例えば研修医採用面接の質問を考えたり、入局者を増やす方法を考えさせたり、プロンプト次第で多様な使い方が可能です。
著作権フリーの画像作成
これまでブログのキャプション画像を選ぶ際は著作権フリーの画像を探していたのですが、無料となると意外とレパートリーが限られます。かといってiStockなどの有料サービスを使うのは…と思っていたのですが、こういった際に生成AIは使えます。今回の記事のキャプション画像もbingに作ってもらいました。ただ、この生成AIで作成した画像の著作権がどうなるのかはまだコンセンサスが得られていないようであり、今後経過を注視する必要があります。
余談ですが、生成AIで画像生成をする際、“vector style”と併記するとアニメ調の画像を作成してくれます。どうもリアルな人間の画像にはAI独特の違和感が出てしまいます。それが嫌な人にはこちらを使ってみるのがオススメです。
最後に
ここまで生成AIについてまとめてきましたが、如何でしたでしょうか。
私自身IT関連についてはちんぷんかんぷんな状態で記事を書きましたので、多かれ少なかれ正確でない部分もあると思いますので注意してください。
また、情報は2023年12月19日時点のものです。繰り返しますが進歩の早い分野であるため、あっという間に情報が過去のものになってしまうと思われますのでご留意ください。
今後は少しずつですがAIの勉強を継続して行っていくつもりです。また何か新しい知見があればAIに関する記事を作成してみたいと思います。
参考
・医療者のためのChatGPT活用術5選 Antaa slide
Antaa slidehttps://slide.antaa.jp/article/view/643c738ca6284e50#25
今回の記事にはChatGPT、Bard、Bingを用いています。