今回ご紹介する本はこちら。
今年から始まったお仕事は、内閣府が管轄しているプロジェクトの推進役のお手伝い。そのプロジェクトというのが、医療データを活用するためのインフラやツールを開発するというもので、その手段の一つとして生成AIを活用するプログラムがあります。
AIとは人工知能のことで、Artificial Intelligenceを略してAIと呼ばれています。
「人工知能」という命名から推測できるように、人間の代わりにコンピューターが知的活動を行う技術のことをいいます。
ではこの「AI」と「生成AI」って何が違うでしょう。
「AI」は学習したデータを元に適切な回答を導き出す機能であるのに対し、「生成AI」は存在していないコンテンツを創成する機能であることが大きな違いです。
「AI」という技術開発は私が大学生の時に、友人が研究活動をすでにしていたのでかなり歴史があるんですね。
膨大なデータを処理して、すばやく最適解を導き出す能力がどんどん向上し、チェス、囲碁、将棋といったゲームではもう人間が叶わなくなってしまいました。
そんなAIの発展の最中に登場して世間をおどろかせたのが、OpenAI社が発表したchatGPT。生成AI時代の始まりです。
ゲームに応用されているAIは、それまでの対戦データをたくさん持っていて、そこから最適解を導き出しているのに対し、chatGPTはあたかも人間と話しているようにおしゃべりができる、というのが衝撃の機能でした。
あまりにも精巧なため、chatGPTとのおしゃべりが行き過ぎて、chatGPTに恋したり、自殺したりする人がでてきた、ということが話題になりました。
そんな生成AIの中でも「大規模言語モデル」(LLMと略されます)の開発が世界中で急ピッチに進んでいます。
これは、”圧倒的な”「コンピューターの計算量」と「データ」と「学習の深さ(ディープランニング)」が特徴です。
最近アメリカの株式市場でAI関連株によって株価が上がっている要因の一つに、NVIDIAという会社が取り上げられています。
この会社が生成AIを開発するために使われるGPUという半導体をほぼ独占で開発・生産しているんですね。
GPUってもともとは画像処理をするための半導体だったのですが、生成AIを開発に利用されるようになって、引っ張りだこになりました。
NVIDIAの企業価値は今や、マイクロソフト、アップル、サウジアラコム(サウジアラビアの国有石油会社)についで世界4位です。今年の2月段階で270兆円相当になった模様。すんごい(^^)
話が脱線しましたが、本書は
・LLMとはどういうものか
・LLMにはどんな課題があるのか
・LLM誕生の歴史
・LLMとの向き合い方
について解説してくれている、いわゆるLLM入門書、です。
著者の岡野原大輔氏は、生成AIの世界では日本でも第一人者の1人で、著者いわく「できるだけ技術用語や数式を使わずに解説することを試みた」とのことです。
とはいえ、全くの初心者にはハードルはそれほど低くはないので、ちょいと読むのに時間がかかるかもしれません。
しかし、「生成AIの世界ってどんなもの?」と疑問に思う人たちにとっては、結構ありがたい本でもあります。
LLMは言語を文字通り大規模に処理して新しいものを生み出すモデルですが、ほかに大規模マルチモーダルモデル(略称はLMM)というモデルもあります。
これはテキストだけでなく、画像や音声といった複数種類のデータを処理できるモデルです。
医療データの世界では、カルテに書かれた情報はLLMを活用しようという動きがある一方、レントゲンとかMRIといった画像などの活用にLMMを利用できないか、という研究もあります。
この業界にかかわるようになってまだ間もないですが、ものすごい勢いで研究開発が進んでいる印象があり、アップルも電気自動車の開発をやめてAIに資源を集中する、と決断したように、世界中で競争が激化する傾向です。
まだchatGPTを無料あるいは有料で活用するくらいかもしれませんが、そう遠くない時期にもっと多くのアプリケーションが身近に現れるかもしれません。
そんな時期を鑑みると本書のような入門書に目を通すのは無駄ではないように感じます。