なぜかと言えば、あなたが私を評価した場合、その評価があらわにするのは、私についてよりもあなた自身についてだからだ。あなたが、「チームに明確なビジョンを設定している」と私を評価するとしたら、そこからわかるのは、そのビジョンについて私のほうがあなたよりも理解している、ということだ。逆に、この点で私に対するあなたの評価が低ければ、あなたが――私との比較においてのみ――明確なビジョンを持っているとわかる。

 これは、あなたが私の行動を評価するどの質問に対しても当てはまる。「マーカスはすばやく意思決定を行う」と評価すれは、それは私があなたよりも意思決定が速いことを意味する。「マーカスは優れた聞き手だ」と評価すれば、私があなたよりも優れた聞き手かどうかがわかる。こういった質問は、私の身長について評価するようなものだ。「私の背が高い(低い)」とあなたが考えるかどうかは、あなたの身長次第なのだ。

 つまり、私の行動を評価する時、あなたは客観的ではない。統計用語で言えば、信頼性に欠ける。あなたは不適切なデータを提供していることになる。

「いや、かまうものか。君を評価する人間は私だけじゃないんだからね」とあなたは言うだろう。「私の評価に客観性が欠けているとしても、それは他の人たちの評価によって補える」と。

 もっともらしく聞こえるが、やはり説得力はない。他の人たちも、評価に関しては同じように信頼性に欠けるのだから。誰もが不適切なデータを提供している。残念ながら、不適切なデータにさらに不適切なデータを加えても、集まるのはひどいデータばかり。優れたデータを得られるはずがない。

 これを避けるただひとつの方法は、測定しようとする能力を完全に代表するサンプルを評価者集団として確保することだ。世論調査はこの方法をとり、年齢、人種、地域、性別、支持政党などで国民を代表する1000人程度のサンプルが注意深く抽出される。世論を測定する場合には、この方法は無作為に10倍の人数を調査するよりも信頼性が高いことが証明されている。

 しかし、360度評価の評価者は、測定される能力を代表するように注意深く選出されたサンプルではない。無作為に選出されたわけでもない。たまたまあなたの同僚か部下であるだけの集団なのだ。統計学的にはこれは「ゆがんだサンプル」と呼ばれる。彼らの評価を積み上げたところで、あなたのリーダーシップ行動の正確で客観的な尺度にはならない。定量化された噂話を集めているだけだ。

 幸い、この問題に対する解決策は単純だ。あなたが私の行動に対する信頼性の高い評価者ではないとしても、あなたは自分の気持ちや感情については、きわめて信頼性の高い評価者である。「マーカスは、チームのために明確なビジョンを設定している」と私を評価しても、その評価に信頼性はないが、「私は、自分のチームのビジョンが何であるかを知っている」といった設問に関して自分自身を評価する場合には、完全に信頼性がある。同じように、「マーカスは優れた聞き手だ」というあなたの評価が不適切である一方で、「私は自分の意見が相手に届いていると感じる」というあなた自身についての評価は、優れたデータである。これはどのような設問についても該当するため、あなたに自分自身についての評価を求めていることになる。

 このように、信頼性の高い360度評価を行うためには、他者の行動を評価させるあらゆる設問を削除し、代わりに、評価者に自分自身や自分の気持ちについて評価するような設問を用いる必要がある。

 これによって、360度評価は誰もが信頼できるツールに変わるだろう。しかし、それが実現するまでは時間つぶしにすぎない。


HBR.ORG原文:The Fatal Flaw with 360 Surveys October 17, 2011