将来の事業創出を見据えたデータ資産の統合
寺部:こうしたデータサイエンスの基盤を整備する上では、現場との連携も不可欠だったのではないでしょうか。
北西:そうですね。決して容易ではありませんでした。部門ごとにデータ管理の意識や入力形式が異なり、従業員データ一つを取っても、名前だけで管理されていたり、表記ゆれがあったりする。Excelファイルの内部でセル結合が行われていたり、複雑なマクロが組み込まれていたりと、業務の都合で積み重なってきたデータ管理の課題が多くありました。こうしたデータを、横断利用を前提としたマスターデータへと整備し直すには、相当な作業が必要でした。
寺部:現場も多忙な中で、方向性を合わせるのは簡単ではありませんよね。
北西:大きな転機となったのは、IT部門と初期段階から一体となって動くようになったことです。3年、5年単位のシステム刷新のタイミングに合わせ、将来のデータ活用を前提とした設計を議論してきました。後から手当てをするのではなく、最初から活用を見据えて設計するという発想です。
同時に、検索性と網羅性を兼ね備えたデータカタログ「SERENDA」を整備し、全社のデータ資産を中央化しました。ただし、すべてのデータを網羅的に管理する方針は取っていません。全社横断で繰り返し利用される、いわば企業の中核となるデータに絞って集中的に管理しています。一方で、業務部門特化のデータについては、各部門で管理・活用するという整理です。
特徴的なのは、「誰が、いつ、何の目的で、どのデータを使うのか」を申請時に登録し、「どのような結果を得たのか」まで記録している点です。仮に担当者が退職したとしても、どのデータを用いてどのような分析を行い、どのような示唆が得られたのかを追跡できます。過去の取り組みの「続き」から始められるため、同じ分析や報告を繰り返す無駄は大きく減りました。
塩野義製薬に根付くデータ駆動の文化
寺部:全社的なデータ重視の文化は、どのように形成されたのでしょうか。
北西:組織規模が比較的コンパクトで、組織長同士が直接対話できる環境にあったことは大きいと思います。また、経営層も一貫して前向きでした。
象徴的なのが、意思決定の背景を文章で残す決裁システムです。誰がどのような背景やロジックで意思決定を行ったのか──そのプロセスを文章として記録する仕組みで、いわば意思決定の“記憶”が蓄積されています。5年以上の運用を通じて、質の高いテキストデータが蓄積されてきました。生成AIの時代においては、これ自体が重要な資産になります。
こうした思想の根底には、臨床統計学の蓄積があります。
臨床統計で最も重要なのは解析計画とサンプルサイズ設計です。どの程度の症例数を集め、どの項目のデータを取得すれば、薬の有効性や安全性を統計的に示せるのか。実薬とプラセボの割り付け比率や用量設定まで含め、仮説に基づいて設計します。これを誤れば、莫大な投資が無駄になりかねません。だからこそ、「このようにデータを集めれば、こうした結論に到達できる」という見通しを持ってデータを設計し、収集するという文化が根付いていました。
寺部:時間をかけて設計・収集してきたデータを強みに、どのようなビジョンを描いていますか。
北西:AI時代の鍵は、人とAIの役割分担にあると考えています。暗黙知を活用するような高度な判断は人が担い、構造化できる領域はAIに委ねる。効率化によって創造的な業務に集中できる環境を整えられれば、新たな価値が生まれます。効率化と価値創出は対立するものではなく、つながっていると考えています。
