熟練工の「両手の動き」を1秒単位で見抜く動画解析AI
小宮:現場では、ベテランの退職による熟練の技能の損失が深刻です。フィジカルAIは、いわゆる「職人の勘」をどう受け継ぐのでしょうか。
田中:ロボティクスの世界には「モラベックのパラドックス」という言葉があります。高度な論理計算はAIにとって容易でも、子供でもできるような「転がってきたボールを掴む」といった身体的な動作は極めて難しいという意味です。
日立では、これを「深層予測学習」という手法で突破しようとしています。熟練者がロボットを遠隔操作して手取り足取り教えることで、ロボットはそのときの力加減や微妙な調整をAIモデルとして学習します。これを言語化(形式知化)する必要はありません。AIが「動き」そのものをモデルとして持つことで、配線作業のような複雑で繊細な作業も自律的に行えるようになります。
小宮:言葉にできない「暗黙知」をそのままデジタル化するのですね。一方でロボット分野以外の判断や対応が求められる現場業務で、具体的にどのような現場で活用が始まっているのでしょうか。
滝川:代表的な例の一つが、社会インフラなどの「障害対応」です。これまでのAIは過去のデータから故障を予測するまででしたが、HMAXではさらに踏み込みます。
たとえば、現場に不慣れな作業員がいたとしても、AIエージェントが「過去の類似事例ではこの部品が原因だった」「図面上のこの装置をチェックすべきだ」と、ベテランさながらのアドバイスをリアルタイムで行います。さらにフィジカルAIを搭載したロボットが現場を撮影し、状況を判定してバルブを閉める、といった一連のアクションまでをサポートすることを目指しています。
LLMは汎用を使い、ナレッジで差別化する
小宮:日立は「大規模言語モデル(LLM)自体は自社で作らず、徹底的に使い倒す」という戦略をとっています。その真意はどこにありますか。
滝川:2022年頃、生成AIの波が来た際に、日立が勝負すべき領域はどこかを徹底的に議論しました。インターネット上の汎用的な知識を学ぶモデルの開発は、OpenAIやGoogle Cloudなどのテックジャイアントに任せる。日立が提供すべき価値は、そのモデルに「日立にしか持てない現場のドメインナレッジ」を掛け合わせることだと確信したからです。
私たちはこれを「カスタマーゼロ(自らが最初の顧客になる)」というアプローチで実践してきました。自社の工場や保守現場で実際に生成AIを使い、どこでつまづくのか、どう情報を引き出せば現場が動くのかを泥臭く試行錯誤しました。その蓄積が、今のHMAXのUIやロジックの精度につながっています。
小宮:自ら汗をかいて得た「使いこなしのノウハウ」こそが商品だということですね。
滝川:その通りです。たとえば、複雑な保守マニュアルや膨大な障害記録から、今必要な情報だけを抽出する技術などは、まさに現場の苦労を知っているからこそ開発できたものです。現場の「観察のプロ」がどう判断しているかを分析し、それをAIのアルゴリズムに組み込むことで、単なるチャットボットではない「現場の戦力」としてのAIを作り上げています。
