【DXの本質】「後から検索」の限界を破る!データエントリー時にLLMを使う新常識

みなさん、こんにちは。

日本のものづくりや医療の現場で、ずーっと言われているのが「DXの停滞」です。

私が手掛けているIoTシステムでも、
「データはたくさんたまっているのに、なぜか現場の成果や次の研究に活かせない…」
そんな壁にことあるごとに跳ね返されています。

今回は、その原因と、いま大注目の「LLM(大規模言語モデル)の正しい置き場所」について、考えてみたいと思います。


データはあるのになぜ繋がらないのか?

2026年版ものづくり白書」によると、製造業でデータを「取れている」企業は66.0%もあるそうです。しかし、「効果が出ている」のは43.9%で、各プロセスを跨いだデータ連携にいたっては、たったの1〜2割しかできていないとのことです。

参考:データは取れるがつながらない ものづくり白書に見る製造業DXの課題(MONOist)

医療の現場でもまったく同じで、電子カルテのおかげでデータは山ほどあるのに、それが新しい発見や研究に活かされにくくなっているのが現状です。おそらく根本原因は、「人間にしか理解できない形(自由なメモやナラティブ)のまま、データが眠っているから」でしょう。

製造現場の「最新版_final_修正2.step」みたいなCADデータや、医療の自由記載カルテは、後からシステムで自動で繋ぎ合わせようとしても、意味が分からなくて迷子になってしまう場合が本当に多いのです。


流行りの「後からAIで探す(RAG)」が失敗するワケ

いま、多くの企業では「たまったデータを、後からAI(RAGなど)に読み込ませて、検索や構造化をすれば意味のある情報になるはずだ」と考え、試行錯誤を繰り返しています。でも、ここには大きな落とし穴があります。

  • 「書かれなかった文脈」はAIでも復元できない
    AIがどれだけ優秀でも、数年経ったデータから、「その時、なぜ設計者がこの形にしたのか」「なぜ医師がこの言葉を選んだのか」という当時の生々しい意図(文脈)を復元することはできません。
  • ゴミを入れたら、ゴミしか出てこない(GIGO)
    元のデータが文脈をそぎ落として痩せていたら、いくら三つ星シェフ(高性能AI)を呼んできても、美味しい料理(価値あるデータ)は作れません。結果、AIが嘘をつく原因(ハルシネーション)にもなります。

発想の転換!データ登録(エントリー)の瞬間にLLMを噛ませる

研究者やAI関係の企業人の多くはデータを後からつなぎあわせるよい方法を日夜必死に研究しています。しかし、これだという有効な方法は見つかっていないはずです。

私も、なんとかつなぎあわせるよい方法があるはずだと考え、いろいろな文献をあさってはダメを繰り返していました。そんな時に、ふと目に止まったのが以下の記事です。

記事の著者の清水亮氏がズバリ指摘するように、AIを「出口(検索窓)」ではなく「入り口(データ入力時)」に置くという発想の転換が、まさに希望の光のように見えました。

データが生まれたその瞬間こそ、人間の頭の中に一番「目的」や「意図」がフレッシュに残っていますよね。記事ではそのタイミングでLLMにデータを読ませて、「人間の豊かな表現」はそのまま残しつつ、機械が読める「タグ」を裏側にピッと貼り付けて保存することが提唱されています。

記事ではそこまででしたが、このアプローチは、仕事のタイプに合わせて2つのやり方に使い分けるとうまくいくのではないかと閃いたのです。

目的ドリブン(量産現場・一般診療など)

  • 業務の性格
    ゴールや「型」が決まっていて、繰り返しが多い。
  • LLMの動き
    現場の雑多な音声やメモ(「アームがガタついたからグリス塗った」など)からサッと情報を抜き出して、システムがすぐ処理できる綺麗なデータ(JSONなど)にその場で翻訳してくれます。

意味ドリブン(R&D・臨床研究・新価値創造など)

  • 業務の性格
    すぐには目的が分からない「想定外の気づきや失敗」に宝が眠る。
  • LLMの動き
    データを無理やり特定の型にハメて大事なノイズを捨ててしまうのはNG。
    「生データ(1階)」を100%そのまま残しつつ、LLMの目で見つけた「かすかな違和感や前後の文脈(2階)」をセットにしてパッケージ(カプセル化)保存

表にするとこんな感じです。

区分主な対象領域LLMのエントリー時の振る舞いデータの保存形態
目的ドリブン量産・生産管理・一般外来雑多な入力から情報を抽出し、定義されたフォーマットへ即時構造化テンプレート化されたデータ
意味ドリブンR&D・新材料開発・臨床研究生データに、その時の人間の思考やAIが気づいた伏線を多次元タギング2階建て構造(Raw+文脈カプセル)

日本の医療DX(標準電子カルテ)へのヒント

日本の「標準電子カルテ」の議論は、医師の入力負担を考えて、ガチガチの構造化を諦めて「ナラティブ(自由記載)を大事にしよう!」という方向に進んでいます。これは現場のストーリーや直感を殺さないという意味で、すごく大事な決断です。

参考:電子カルテ情報共有サービスの導入に関するシステムベンダ向け技術解説書 v2.0.0

でも、そのまま放置すると「後から研究に使えない…」という困ったことになります。

だからこそ、この「ナラティブ+エントリー時タギング」が効いてきます。 医師には今まで通り自由にナラティブを書いたり喋ったりしてもらう。その瞬間に、裏側でLLMが「医師の言葉を奪う」のではなく、「その言葉の裏にある、将来の医学の発展のための伏線タグ」をリアルタイムに生成して、そっと裏に貼り付けておくわけです。

これなら、「医師のラクさ(ナラティブ)」と「データの未来への活用(構造化)」が、入力のその瞬間に100%両立できます!


AIを「答える役」から「知識を作る役」へ

これまでのAI活用は、人間の質問に答える「チャットボット」や「検索の高度化」ばかりに目が向いていました。でも、それは散らかった部屋のあと片付けをAIに頼むようなものです。

本当のDXは、データが生まれる「入り口」の仕組みを変えること、人間が熱量を持ってアウトプットしたその瞬間に、AIを最高の「知識のレコーダー」として動かすこと、そこにこそ価値が宿るのではないでしょうか。

この「入り口のパラダイムシフト」にいち早く気づいてシステムに取り入れたところが、これからの時代をリードしていくと私は考えています。みなさんは、どうお考えでしょうか?

本日も最後までお読みいただきありがとうございました。

それでは、よいDXライフを!

カテゴリ: その他

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール