仮説を評価するための2軸とバイアスの回避とは

栗原:仮説のプロセスでは、まず仮説マップを描くのが重要とのことですが、その作業を生成AIが代替することはできるのでしょうか。
馬田:部分的には可能ではないでしょうか。ただ、その反面、生成AIは仮説を出力しすぎる問題があるように思います。たしかに、人間以上に細かい分析は可能なのですが、現時点では優先順位や重要度を考慮せずに大量の仮説を並列的に出力してしまう印象です。
先ほども述べたとおり、検証には行動が必要ですから、リソースの制約という観点からも仮説の優先順位は意識せざるを得ません。仮説マップの足りない部分を補足するといった使い方はできると思いますが、仮説マップの作成全体を生成AIに代替させるのは難しいように思います。
栗原:ということは、その部分は人間が担わなければいけないと。
馬田:そうですね。もちろん、あらゆる人が仮説マップの作成が得意というわけではありませんが、仮説の優先順位や重要度を見極めるうえでは、人間の知識や経験は有効なツールになります。
栗原:そうした優先順位や重要度は、具体的にどのように見極めるのでしょうか。
馬田:本書では仮説を正しく評価するために、適切な評価軸の設定が必要だと唱えています。たとえば、今、「フィギュアスケートの審査をしてください」と言われたら、一部の競技経験者を除けば、ほぼ全員が困ってしまうでしょう。それはフィギュアスケートを審査するための評価軸を持ち合わせていないからです。仮説の評価についても同様で、何が良い仮説なのか、どの仮説が重要なのかを判断するための「ものさし」がなければいけません。
また、仮説の標準的な評価軸として「影響度」と「確信度」を提示しています。影響度は「仮説の正誤が事業に与える影響(インパクト)の大きさ」、確信度は「仮説が正解である自信の大きさ」です。この2つを縦軸と横軸に設定したグラフに複数の仮説をプロットすることで、相対的な重要度や検証の優先順位を明らかにできます。

具体的には、「影響度は高いが、確信度は低い」という仮説については、優先的に検証して確信度を高めるべきですし、その逆に「影響度は低いが、確信度は高い」という仮説は、確実性はあっても事業への影響は小さいため、優先順位は相対的に低くなります。

仮説の評価においては、こうした手法に則った理性的な判断が必要です。仮説を正しく評価するには経験と技術が求められます。経験とは特定の業界やビジネスなどへの知見、一方で技術とは評価軸の設定や調整などのスキルを指します。そして、技術はその体系を言語化して学ぶことで習熟が可能です。逆に、経験は豊富だったとしても、評価のスキルを学ぼうとせず直感にばかり頼っていては、仮説を正しく評価する能力は向上しません。意識的に評価の手法を学び、仮説を見極める能力を身に付けるべきだと思います。
栗原:経験は必要だが、それだけでは仮説を正しく評価できないと。
馬田:ビジネスセンスに長けた人は、直感的な評価が多少得意な印象はあります。ただし、それでも限界は存在します。たとえば、人間はリスクを避ける傾向にあるため、評価の2軸のうち、自然と影響度よりも確信度を高く評価しがちです。しかし、確信度に偏った評価を続けていると、仮説は影響度の少ない、小さくまとまったものになってしまいます。そうしたバイアスが人間には備わっていることを知り、影響度を意図的に高く評価するといった調整が求められるわけです。この調整のようなスキルを身に付けるためにも、評価の手法の学習が必要になります。