COLUMN

エンゲージメントサーベイという「測定の幻想」——数字が組織の病理を隠蔽するとき

物理学者ヴェルナー・ハイゼンベルクが1927年に提出した不確定性原理は、量子系における観測行為そのものが系の状態を変容させるという事実を定式化した。この知見は量子力学に限定されない認識論的含意を持つ。観測することと観測対象が独立して存在するという前提そのものが、特定の条件下では成立しない。私がエンゲージメントサーベイという企業慣行を考察するとき、最初に想起するのはこの観測問題である。

現代の組織マネジメントにおいて、従業員エンゲージメントの測定は一種の信仰に近い地位を占めている。Gallupが四半期ごとに公表するグローバルデータは経営層の意思決定に参照され、HRテクノロジー市場は年率10%超で成長を続ける。しかし2023年のGallupレポートが示す数字は、この20年間の「測定の努力」とは不釣り合いな現実を突きつける。グローバルの従業員エンゲージメント率は23%に留まり、1990年代から数値の実質的な改善はほぼ見られない。測定が改善の前提条件であるという命題が正しいなら、なぜ測定し続けても何も変わらないのか。

答えの一端は、測定行為が何を「現実」として切り取るかという問題にある。しかし私の関心は、そこからさらに深い層に向かう。エンゲージメントサーベイが機能しない理由は、測定ツールの技術的不完全さだけに帰着しない。それは人間の脳が「自己報告」という形式に対してどのように機能するかという神経科学的問題であり、組織という複雑適応系がフィードバックループをいかに処理するかという動力学的問題であり、そして何より、心理的安全性の欠如した環境において測定そのものが病理の症状となるという逆説的問題である。

このコラムでは、エンゲージメントという概念の定義と測定の歴史から出発し、なぜ現行のサーベイ設計が構造的に機能しないのかを、神経科学・心理測定論・組織精神医学の複数の軸から解体する。これは批判のための批判ではない。測定という行為が何を照らし、何を暗闇に置くかを正確に理解することが、次の問いを立てるための前提条件だと考えるからである。

エンゲージメントという概念——その定義の多義性と測定の困難

「エンゲージメント」という語が産業・組織心理学の文脈で最初に定義されたのは、ウィリアム・カーンの1990年論文「Psychological Conditions of Personal Engagement and Disengagement at Work」(Academy of Management Journal)においてである。カーンは、個人が仕事の役割においてどの程度自己を表現・投入するかという概念として、認知的・感情的・身体的の3次元からエンゲージメントを定義した。この定義において注目すべきは、エンゲージメントが静的な属性ではなく、文脈依存的な動的状態として位置付けられていた点である。

その後、測定ビジネスの台頭とともに概念は急速に収斂した。Gallupの「Q12」、ヒューイット・アソシエイツの「Say-Stay-Strive」モデル、ウィリス・タワーズワトソンの「Sustainable Engagement」など、各社は独自の測定フレームワークを構築したが、いずれも異なる構成概念を「エンゲージメント」と呼んでいる。2011年にMacLeodとClarkeが英国政府向けに行ったレビューでは、エンゲージメントの定義が50以上存在することが確認されており、同一の語を用いながら異なる構成概念を測定している可能性が示されている。

産業・組織心理学の観点から最も厳密な構成概念妥当性を持つとされるのは、Schaufeliらが2002年に提唱したワーク・エンゲージメント(Work Engagement)の概念であり、活力(Vigor)・献身(Dedication)・没頭(Absorption)の3因子構造として定義される。これを測定するUWES(Utrecht Work Engagement Scale)は17項目版と短縮版が開発され、多数の翻訳版で信頼性・妥当性の検証が行われている。ただし、UWESでさえ自己報告式であるという根本的な制約からは逃れられない。

ポイント:「エンゲージメント」は単一の科学的概念ではなく、商業的文脈で多義的に流通してきた構成概念群である。異なるサーベイのスコアを直接比較することは、測定論的に無効である。

測定のパラドックス——ホーソン効果とグッドハートの法則

1924年から1932年にかけてウェスタン・エレクトリック社ホーソン工場で行われた実験群は、観察されることによって被観察者の行動が変容するという現象を記録した。この「ホーソン効果」は、職場研究における観察介在の問題として今日も参照される。ただし現代の再解析(Levittら、2011年、American Economic Review)は、当初報告された効果量の多くが統計的人工産物であった可能性を示しており、ホーソン効果の実態は単純ではない。重要なのは、観察という行為が社会的相互作用を伴う文脈において系の状態を変容させうるという、より一般的な命題である。

エンゲージメントサーベイに固有の問題として、私が特に注目するのはグッドハートの法則である。経済学者チャールズ・グッドハートが1975年に提示したこの法則——「ある指標が目標として設定された瞬間に、それは良い指標でなくなる」——は、組織の測定慣行において深刻な帰結をもたらす。エンゲージメントスコアが人事評価・予算配分・管理職の処遇に連動した瞬間、それは従業員の心理状態の反映ではなく、管理すべき指標となる。管理職はスコア向上のための「エンゲージメント施策」を実施し、従業員はその意図を察知して回答を調整する。この過程で測定は現実を反映する窓から、現実を歪める鏡へと変質する。

社会学者クロード・ド・ケルコーブが指摘した「測定の政治学」という視点から言えば、何を測定するかという選択は中立的な技術的決定ではなく、何を組織内の「現実」として承認するかという権力的行為である。エンゲージメントサーベイが「仕事に誇りを持っているか」「上司を信頼しているか」という項目を問うとき、それは既存の権力構造を所与とした問いの立て方であり、構造そのものへの問いを排除する設計になっている。

自己報告の神経科学——なぜ脳は「正直に答えない」のか

エンゲージメントサーベイが内的状態の正確な測定として機能しない最も根本的な理由の一つは、自己報告という形式が依拠する脳の情報処理機構にある。アントニオ・ダマシオが提唱したソマティック・マーカー仮説は、感情的・動機的状態が身体信号として内受容感覚を通じて脳に表現され、意思決定の基盤となることを示した。腹内側前頭前野(vmPFC)は、過去の感情的経験に基づく身体状態の予測と統合において中枢的役割を担う。

しかし、アンケートの質問項目に対して「1〜5のスケールで回答する」という形式は、この動的・身体的プロセスを言語的・意識的なチャンネルに強制変換する。認知神経科学の知見が示すように、内省的自己報告は前頭前野内側部(mPFC)による高次認知処理を介するが、このプロセスは複数の系統的バイアスに晒される。

第一に、社会的望ましさバイアス(Social Desirability Bias)。前帯状皮質(ACC)と内側前頭前野が関与する社会的規範への同調傾向は、匿名性が保証されていても完全には除去できない。メタアナリシス研究(Nederhof, 1985年;Tourangeau & Yan, 2007年)は、社会的に望ましい回答への偏りが自己報告データに一貫して存在することを示している。

第二に、アフェクティブ・フォアキャスティングの不正確性。Daniel GilbertとTimothy Wilsonによる一連の研究は、人間が将来の感情状態を予測する能力が系統的に誤っていること(特に「免疫無視」による過大評価)を示した。現在の感情状態への自己報告も同様の認知的再構成を経ており、実際の経験サンプリング法(ESM)データとの乖離が報告されている。

第三に、心理的安全性の欠如による回答抑制。組織心理学者エイミー・エドモンドソンの研究は、心理的安全性の低い職場環境では、従業員が否定的フィードバックを回避するよう行動することを示した。扁桃体—前頭前野回路における脅威評価が活性化した状態では、自己開示のコストは主観的に上昇する。エンゲージメントが低い職場ほど、エンゲージメントサーベイへの正直な回答が脅威として知覚されるというこの逆説は、サーベイの有効性を最も必要とする環境で最も機能不全に陥るという構造的欠陥を意味する。

Medi Faceが産業現場で繰り返し観察するのは、エンゲージメントスコアが高い部署で同時期にメンタルヘルス不調者が増加するという解離現象である。この乖離は測定の失敗ではなく、測定が設計通りに機能した結果として生じている可能性がある。スコアは「組織が求める回答」を正確に収集したのである。

複雑適応系としての組織——なぜ線形因果モデルは失敗するのか

エンゲージメントサーベイの設計論理の多くは、暗黙の前提として「入力(施策)→測定→出力(エンゲージメント向上)」という線形因果モデルを採用している。しかし現代の組織科学は、組織を複雑適応系(Complex Adaptive System)として記述する。複雑適応系においては、個々の構成要素の相互作用から創発的特性が生じ、小さな介入が非線形的な結果をもたらす。エントロピー増大則が示すように、閉じた系は時間とともに秩序を失う方向に進む。組織において「エンゲージメントの維持」は、散逸構造理論(イリヤ・プリゴジンによる非平衡熱力学)が示す意味での能動的エネルギー投入なしには達成されない。

年1回の断面調査であるエンゲージメントサーベイは、この動的システムの一時点のスナップショットを提供するに過ぎない。しかも、そのスナップショットは前節で述べた理由から系統的に歪んでいる可能性が高い。このデータに基づいて因果推論を行い、施策を立案することは、非線形系に線形のモデルを適用するという方法論的誤りを犯している。

組織行動学者Karl Weickが提唱したセンスメイキング理論は、組織のメンバーが曖昧な状況に意味を付与するプロセスを記述する。エンゲージメントサーベイの結果は、そのままフィードバックされることで組織内の特定のナラティブを強化・固定化する働きをする。「エンゲージメントが低い部署」というラベルは、その部署に対する管理層の認識を変え、所属メンバーのアイデンティティを変容させ、それが実際のエンゲージメントに影響するという二次ループを形成する。測定は対象を記述するだけでなく、対象の構成に参加する。

バーンアウト・うつ病・ディスエンゲージメントの鑑別——臨床的観点から

産業医の立場から不可欠な問題として、エンゲージメントの低下と臨床的疾患の鑑別を論じなければならない。エンゲージメントサーベイは、回答者が臨床的なバーンアウト状態にあるか、うつ病に罹患しているかを判別する機能を持たない。これは深刻な見落としを生む構造的問題である。

バーンアウト(職業性燃え尽き症候群)は、ICD-11(コード:QD85)において「慢性的な職場のストレスに適切に対処できなかった結果として生じる症候群」として定義され、Maslachらによる古典的な3次元モデル——情緒的消耗(Emotional Exhaustion)、脱人格化(Depersonalization)、個人的達成感の低下(Reduced Personal Accomplishment)——に基づく。MBI(Maslach Burnout Inventory)はバーンアウトの標準的測定ツールであるが、エンゲージメントサーベイとは設計論理が根本的に異なる。

大うつ病性障害(MDD)(DSM-5:296.2x/296.3x)との鑑別において、バーンアウトの情緒的消耗は仕事という文脈に限定される傾向があるのに対し、MDDにおけるアネドニア(快感消失)は生活全般に及ぶ。神経科学的には、MDDにおいては腹側線条体(報酬系)の活動低下、海馬容積の縮小(ストレス由来のグルココルチコイド過剰による神経毒性)、前頭前野—扁桃体間の機能的結合の変容が報告されている。バーンアウトでは、HPA軸(視床下部—下垂体—副腎系)の過活動から低反応への移行(コルチゾールの日内変動パターンの平坦化)が特徴的とされる(Rotsenberberら、2021年)。

特徴 バーンアウト(ICD-11 QD85) 大うつ病性障害(DSM-5) ディスエンゲージメント
主な文脈 職業的ストレスに限定 生活全般 組織・役割への態度
コア症状 情緒的消耗・脱人格化 抑うつ気分・アネドニア 関与の引き下がり・無関心
神経生物学 HPA軸低反応・コルチゾール平坦化 海馬萎縮・腹側線条体活動低下 非特異的(多因子性)
臨床介入 職場環境調整・認知行動療法 抗うつ薬・精神療法 組織マネジメント介入
サーベイでの見え方 低スコア(後期は高スコアも) 低スコア(無回答が増える) 低スコア

この表が示す通り、エンゲージメントスコアの低下は3つの異なる状態に共通するアウトカムであり、スコアだけから鑑別することは不可能である。特に重要なのは、バーンアウトの後期や重症うつ病においては、無気力・感情麻痺の結果として「まあそれなり」という中間回答が増加し、スコアが人工的に「正常化」する現象が生じうることである。臨床的に最も深刻な状態が数値上最も問題なく見えるというこの逆転は、サーベイの医療的限界を象徴している。

心理的安全性の神経科学——なぜ「正直な回答」は安全コストを要求するのか

エンゲージメントサーベイが機能しない最も実践的な理由は、回答という行為が従業員にとってゼロコストではないことにある。この問題を理解するには、社会的脅威処理の神経科学的機序を参照する必要がある。

神経科学者Matthew Liebermanは著書Social: Why Our Brains Are Wired to Connect(2013年)において、社会的排除や否定的評価が身体的疼痛と同一の神経基盤(背側前帯状皮質:dACC)を活性化することを示した。Kipling Williamsの「サイバーボール実験」等の研究は、社会的排除の知覚が扁桃体および背側前帯状皮質の活動を増加させることを示している。これは、「ネガティブな評価をすることで組織から排除されるかもしれない」という知覚が、文字通り痛みとして処理されうることを意味する。

職場における心理的安全性(エドモンドソン定義:対人リスクを取ることが安全であるという信念)の欠如は、この脅威処理システムの慢性的活性化状態をもたらす。扁桃体の持続的活性化は、前頭前野への抑制的影響を通じて高次認知機能——複雑な問題解決・創造的思考・率直なコミュニケーション——を阻害する。この神経回路のダイナミクスにおいて、「正直なネガティブ評価を記入する」という行為は前頭前野の実行機能を必要とする一方、扁桃体が生成する脅威信号によってその機能が抑制されるという競合が生じる。

匿名性の保証はこの問題を部分的にしか解決しない。組織行動学の実証研究は、小規模チームや特定のロールプロファイルを持つ回答者が、匿名であっても特定可能であるという現実的懸念を持つことを示している。また、Naomi Eisenbergerらの研究(Science, 2003年)が示すように、社会的脅威の神経的処理は意識的な認知評価に先行して起動する。「匿名だから安全」という知的判断が「危険かもしれない」という身体的脅威反応を完全に上書きすることは、神経科学的に難しい。

測定から探索へ——何が機能しうるのか

ここまでの議論は批判として読まれうるが、私の意図は構造的問題の精確な記述にある。批判の後に「では何をすべきか」という処方を続けることは、このコラムの目的ではない。しかし、測定論としての代替アプローチについて言及することは、議論の完全性のために必要である。

経験サンプリング法(ESM: Experience Sampling Method)は、Csikszentmihalyiが1970年代に開発した方法論であり、ランダムなタイミングでのリアルタイム自己報告によってアフェクティブ状態を捕捉する。断面調査と異なり、ESMは個人内変動と個人間変動を分離して分析できるため、状態としてのエンゲージメントを動的に追跡できる。スマートフォンを用いたEMAアプリケーションの普及により、職場での実装可能性は高まっている。

生理的指標(心拍変動:HRV、コルチゾール日内変動、睡眠ポリソムノグラフィーに代わるウェアラブルデバイス計測)は、自己報告バイアスを回避する客観的指標として研究が進む。HRVは自律神経バランスの指標として、前頭前野—扁桃体の制御効率と相関することが示されており、慢性的ストレス負荷の客観的マーカーとしての有用性が検討されている。ただし倫理的問題——プライバシー・データ主権・測定の目的——は解決を要する複雑な課題を残す。

質的・対話的アプローチとしては、Bohm Dialogueに代表される非評価的対話構造や、ナラティブ分析を用いた組織診断が、定量的サーベイとは異なる情報を提供する。これらは測定論的厳密さでは劣るが、複雑適応系における文脈依存的な意味構造を捉えうるという点で補完的な価値を持つ。

ポイント:エンゲージメントサーベイを廃止することが目的ではない。現行のサーベイが何を測定でき、何を測定できないかを正確に理解した上で、複数のデータソースと質的情報を統合する認識論的な謙虚さが求められる。

まとめ

  • 「エンゲージメント」は単一の科学的概念ではなく、商業的文脈で多義的に発展した構成概念群であり、異なるサーベイ間の比較は測定論的に無効である。
  • グッドハートの法則により、エンゲージメントスコアが組織的目標に設定された瞬間、それは内的状態の指標から管理すべき指標へと変質する。
  • 自己報告式測定は、社会的望ましさバイアス・アフェクティブ・フォアキャスティングの不正確性・心理的安全性の欠如による回答抑制という3つの系統的バイアスに晒される。
  • 扁桃体の脅威処理機構により、心理的安全性の低い職場ほどエンゲージメントサーベイへの正直な回答コストが上昇するという構造的逆説が存在する。
  • エンゲージメント低下・バーンアウト(ICD-11 QD85)・大うつ病性障害(DSM-5)は、サーベイスコア上で類似のプロフィールを示すが、神経生物学的機序・臨床介入が異なり、スコアのみによる鑑別は不可能である。
  • 重症バーンアウトやうつ病の後期においては、無気力・感情麻痺によりスコアが人工的に正常化する現象が生じ、最も深刻な状態が数値上最も見えにくくなる逆転が起きる。
  • 組織は複雑適応系であり、年1回の断面調査データに基づく線形因果モデルによる施策立案は方法論的に不適切である。
  • ESMや生理的指標など、自己報告バイアスを回避する代替測定法の研究が進んでいるが、倫理的課題と実装コストの問題が残る。

Closing Note

測定は常に存在論的な介入である。何かを数値化するという行為は、数値化される「現実」を選択し、残余を不可視化するという権力的作用を伴う。ルートヴィヒ・ヴィトゲンシュタインが『論理哲学論考』において「語りえぬものについては、沈黙しなければならない」と記したとき、彼は言語の限界について論じていた。しかしこの命題は測定にも応用できる。測定しえないものについて、われわれは組織的に沈黙する——あるいは、測定できるものだけを「現実」と呼ぶ慣行を選択する。

エンゲージメントサーベイが機能しない「本当の理由」は、ツールの不完全さでも実施頻度の問題でもなく、測定という認識論的行為が持つ根本的な限界と、それを超えて使用し続けることへの組織的無自覚にある。脳は正直に答えるよう設計されていない。組織は線形に動かない。そして測定は、観測対象から独立して存在しない。この3つの命題を出発点に置かない限り、より洗練されたサーベイツールを導入しても、同じ構造の問題は別の形で再現する。

AIドクターのメンタルチェック

AIドクターの
メンタルチェック

AIドクターとのメンタルチェックは、5分〜10分程度です。AIドクターとお話ししながら、あなたのメンタルをチェックします。

AIドクターの診断を受けてみる
← コラム一覧へ

President Doctor

代表医師・著者

近澤徹

近澤 徹

Medi Face代表医師、精神科医、産業医

北海道大学医学部を卒業後、慶應義塾大学病院で研修を経て、名古屋市立大学病院の客員研究員として臨床と研究に従事。医師であり経営者として、医療とテクノロジーを融合させた次世代ヘルスケアを推進中。在学中に創業したMedi Face社では、オンライン診療システム「Mente」を開発し、全国の患者への診療サービスを提供。また、100社以上の企業にAIドクターを導入し、自身も産業医として社員のメンタルケアを日々支援している。「下医は病を治し、中医は民を治し、上医は世を治す」を信条に、医療の枠を超えてヒトと社会を診る。