記事にアフィリエイト広告を含みます

AI PCで何ができ、いつ使えるようになるのか

AI PCで何ができ、いつ使えるようになるのか
この10年、ディープニューラルネットワーク(DNN)をはじめとして人工知能(AI)が大いに話題になりました。その波はハードウェアにもおよび、スマートフォンでは2017年にiPhoneにNeural Engineが搭載され、パソコンでも昨年から今年にかけてNPU (Neural Processing Unit)が搭載され、Microsoftは一定以上のNPU性能を持つPCを”Copilot+PC”として優遇する姿勢を見せています。

スポンサーリンク

しかしながら、多くの皆さんは「NPUがあるとできるようになる機能って何?」とピンとこない状況ではないかと思います。現状、NPUはハードウェアが先行して整備されている一方で、ソフトウェアの整備が追いついておらず、これほどAI PCが宣伝されているのにNPUを使うアプリはほとんどないのが実情です。

そこで本稿では、「NPUがあると潜在的に何ができるようになるのか」「潜在的な可能性が具体的なアプリとして使えるようになるのはいつか」という2点について考えていきます。

“近年話題のAI”をざっくり理解する

近年話題になっているAIは、その原理を「入力xと出力yの対応付けを何に対しても行える、万能マッピング学習機」と理解し、そのマッピングの仕方で「分類AI」「改質AI」「生成AI」の3つに区分すると、AIで何ができるかというポテンシャルを理解しやすいと考えています。

入力xの種類より出力yの種類のほうが少ないものは「分類AI」といえます。近年のDNNのルーツに当たる研究は「手書き文字の文字認識の研究」ですが、これは書き手やコンディションによって多様に変わる手書き文字(入力x)を高々100種類程度のASCII英数字(出力y)に変換するものです。分類タスクと理解できるAIには、音声認識、画像中の人物と背景の分離などが挙げられます。

入力xと出力yが同程度の情報量を持つ場合は「改質AI」と名付けることができます。単純なところではノイズ除去や、その応用として「音楽からボーカルだけ取り出す/取り除く」といったようなAIがあります。カメラ用途では、低画質なウェブカムと高画質の高級カメラで同じ被写体を撮って両者の対応付けを学習させ、ウェブカム画像(入力x)からなるべく高画質に見える絵(出力y)を生成する、といった用途があります。

入力xより出力yの情報量が多い場合は「生成AI」と名付けることができます。生成AIは「xに対応するyが山ほどある中で、どうやって適切な答えを絞り込むか」という大問題をいかにうまくさばくかが鍵になります。画像生成AIが実用的になってきたのは、AIで生成してから不自然に見えるものをAIで弾く(学習を繰り返す)という手法の敵対的生成ネットワーク(GAN)でこの問題を突破し始めた頃でした。

なお「分類AI」「改質AI」「生成AI」という区分の仕方は、私がここで説明するため独自に導入したもので、一般語ではないことに注意してください(この区分による説明を他のところで使っていただく分には私は構いません)。

AI PCで何ができ、いつ使えるようになるのか

入力xの種類より出力yの種類のほうが少ないものを「分類AI」、入力xと出力yが同程度の情報量を持つ場合を「改質AI」、入力xより出力yの情報量が多い場合を「生成AI」として理解する場合の模式図(クリックで拡大します)

スマホとAI

AIの普及はスマートフォンのほうが早く、2017年にiPhoneにNeural Engineを搭載しています。これは、AIの中でも早く普及した「分類AI」「改質AI」がスマホの用途にマッチしていたから、というのが私見です。

スマホはキーボードがなく文字入力が非効率的なため、音声認識(Siri等)や、文字認識カメラアプリ(Apple純正Googleレンズ)が導入され、パスワードを打ち込む代わりの指紋認証や顔認証が普及しました。「分類AI」はこのようなタスクに最適です(そもそもDNNの元祖が文字認識です)。

なにより、スマホではカメラ画質は商品力に直結する要素であり、「改質AI」による画質向上は非常に重要でした。DNNを利用した画質改善フィルターの”Deep Fusion”素人目に見ただけでも改善が見て取れるレベルであり、今のスマホにとって不可欠なものになりつつあります。そのほか、ビデオチャットでも使われるような「分類AI」による前景・背景分離は、被写界深度によるボケ効果を模したフィルターにも効果的と考えられますし、手振れ補正時に安定させたい基準物の抽出などにも役に立つでしょう。

以上のように、スマホでは(おそらく10 TOPS程度を必要とする)「分類AI」「改質AI」が多用されており、電池持ち重視であるため省電力化のために専用プロセッサ(NPU)が搭載されることになります。

PCと生成AI

一方PCでは、カメラ画質はWeb会議用の最低限のものがあればよく、キーボードがあるため音声認識や文字認識はそれほど目を引く機能にはならず、ウェブ会議用の人物抽出なども電力に余裕があるためCPUで処理されていました。

この状況を一変させるのが生成AIです。画像生成にしろ大規模言語モデルにしろ、PCで行う生産的作業に有用であったためです。特にMicrosoftはその恩恵が大きく、考えうる用途だけでも、WordやOutlookの下書き、PowerPointのクリップアート生成、ExcelやVisual Studioのコード補完などが挙げられます。

スポンサーリンク

Microsoftの生成AI活用(可能性事例)はローカルアプリに組み込まれていないというだけで、すでにbingのオンライン機能を使えば活用可能です。下書き機能はEdgeのCopilotサイドバーで使えますし、Bing Image CreatorでPowerPointのクリップアート生成もできます。このクリップアート生成は少し工夫すると実用性がぐっと広がりますので、私がWeb上のサーバーサイドAIを活用している事例を一つ紹介します:

1.Bing Image Creatorで「(絵の内容)、モノクロ、ピクトグラム」と入力
2.ちょうどよい絵が出てきたらダウンロードする(そのまま使っても良い)
3.ダウンロードした絵をAIベクタ変換ツールのvtracerに投入
4.vtracerの出力をSVGファイルでダウンロード
5.ダウンロードしたファイルをPowerPointにドラッグ&ドロップ
6.右クリック→グループ化→グループ化解除でOffice図形オブジェクトに変換
7.色などを自由に操作できるようになる

AI PCで何ができ、いつ使えるようになるのか

トーン&マナーが安定したピクトグラム風イラストをPower Pointに取り込む方法(クリックで拡大します)

PowerPoint 2019以降で「挿入→図→アイコン」に入っているピクトグラム風のイラストは、汎用性が高く以前のクリップアートより使い勝手が良くて愛用しているのですが、ストックを検索することしかできないのでかゆいところに手が届かないことがあります。昔はSVG silhという投稿型・CC0(商用利用可)のクリップアートサイトで検索していたのですが、ここもストック数には限りがあり、現在は上記方法で生成することが多くなっています。

上記作業は全てオンラインAIなので外部に情報が洩れていいものしか使えませんが(アイコン、ピクトグラムで機密性のあるものはほとんどないでしょうが)、会社などでは機密情報が漏れるのはまずい(例えば個人情報が勝手に学習データなどに使われると法律的にまずい)ので、Microsoftの主要顧客も将来的にはこのような機能がローカル生成AIで使えるようになることを望んでいるでしょう。

生成AIについてはbing検索への適用をはじめMicrosoftが先行し、Neural Engineを先に導入したAppleなどは乗り遅れ気味の印象ですが、理由としては生成AIは計算量を多く必要とするためにスマホには向かないことが一つ、生成AIは生産的作業と結びついており、生産的作業は(現状)広い画面とキーボードとマウスを備えたPCでないと辛い、ということがもう一つ挙げられます。Copilot+PCの40 TOPSという数字も、最終的には生成AIに堪えうるものをという基準で決められたものでしょう。

Copilot+PCは急いで買う必要があるか?

MicrosoftのCopilot+PCは鳴り物入りで登場し、特に今年の年末にかけてのノートPC市場は「Copilot+PCにあらずんばPCにあらず」というほどの売られ方をしています。もうCopilot+PC以外買う価値はないのでしょうか?

その答えはかなり微妙なところです。少なくとも今現在、NPUで動くアプリはCopilotアプリ以外とメーカー公式or協賛で作られたサンプル的なアプリ以外はほとんどなく、かつCopilotアプリ自体もあまり充実していないからです。公式にCopilot+PC対応のSnapdragon X Elite搭載機(Vivobook, Yoga Slim 7x)のレビューでは、ウインタブを含め様々なレビュワーが、ペイントのCocreator機能にちょっと注目した程度でそれ以外はあまり興味を集められていない状況です。HX 370搭載機はCopilot+認証前で、動くアプリがほぼない状態でした。

そもそも、今のところローカル実行する生成AIは、PhotoShopやそれに類するアプリで「インペインティング」「生成塗りつぶし」と呼ばれる機能が良く使われているほかは、GPUで実行するもの含めてもStable Diffusionなどの画像生成系が一部の好事家に使われている程度で、大規模言語モデル(LLM)で普及したローカルアプリはなかなか見ず(LLaMA CPPが話題になる程度)、音楽も実質的なIntel謹製サンプルのAudacityプラグインがある程度です。

2024年内にNPU普及の切り札となるようなキラーアプリが出てくる可能性はほぼなく、2025年ですら怪しいといった状況に見えます。いつかは猫も杓子もローカルAIを使うような時代が来るとしても、今年買ったパソコンを次に買い替えるまでに「NPUがないので仕事にならない」となる可能性はなかなか想像しにくいのが実情です。欲しかったPCが運よくCopilot+PCだと嬉しいなという感じはするけれど、何が何でもCopilot+PCにしなければならないとか、強くお勧めするといった状況ではないというのが個人的な意見です。

AI PCで何ができ、いつ使えるようになるのか

AudacityのOpenVINO音楽生成の実行中の様子。Meteor lakeのNPUはフルで回っても10W程度だが、10TOPSは生成AIには重いらしく時間がかかる(クリックで拡大します)

関連リンク

CPU情報 記事一覧
H428’s channel:渋谷H YouTubeチャンネル

スポンサーリンク

コメント

  1. 渋谷H より:

    これまたセルフ突っ込みですが、途中で出てくる「独自分類」は、Tech Tour 2024のAIのセクションで、Transformer Modelの説明でエンコーダが主のClassification(分類)、エンコーダとデコーダが等しいTranslation(改質)、デコーダが主のGeneration(生成)という区分がされてるので私独自ということではなさそうで、普通に使ってよいようです。