政府と民間の経済予測精度を比較するのは無意味

ニッセイ基礎研究所の斎藤太郎氏が「経済予測はどのくらいはずれるのか」というレポートで、1回目は政府と民間調査機関の経済予測精度の比較、2回目は(政府とは独立しているが)日本銀行と民間調査機関の経済予測精度を比較している。いずれも民間の方が優秀だという結論を出しているが、本稿では3つ理由からそのような比較はナンセンスであることを論じる。

レポート概要

レポートの第1回では、政府経済見通し(正式名称:経済見通しと経済財政運営の基本的態度)は楽観的であることが多く、その予測精度が上がっているとも言い切れないと示した上で、ESPフォーキャスト調査の実質GDP成長率見通しと比較すれば、その平均絶対誤差は1980~2018年度で民間の26勝13敗と示している。

ニッセイ基礎研究所「経済予測はどのくらいはずれるのか(1)~政府経済見通しの精度を検証する~」2019年12月19日

第2回では、実質GDP成長率予測値の需要項目別に見ると、政府・民間いずれも民間需要が過大予測、公的需要と純輸出が過小予測であるが、民間の方が誤差が小さいとした上で、民間の予測は景気転換点の判断は遅れるが、成長率見通しの修正方向の転換と景気転換点が近いことを示した。更に日本銀行の展望レポート(正式名称:経済・物価情勢の展望)の実質GDP成長率と消費者物価上昇率の予測は過大傾向があり、2004~2018年度で民間と比較すると、実質GDPで民間の9勝6敗、消費者物価が民間の10勝5敗であると示した。

経済予測はどのくらいはずれるのか(2)~民間調査機関の予測精度と特徴~

目標VS予測

そもそも、政府経済見通しも展望レポートも当てる事が目的ではない。無論、標準的なシナリオやモデルが存在し、それに準じた見通しを立てるというプロセスは取られるが、特に政府経済見通しでは「目標」としての性質が強い。

例えば令和元年12月18日の閣議了解において令和2年度の経済見通しについては、

 令和2年度については、総合経済対策を円滑かつ着実に実施するなど、後段で示す「2.令和2年度の経済財政運営の基本的態度」の政策効果もあいまって、我が国経済は、雇用・所得環境の改善が続き、経済の好循環が進展する中で、内需を中心とした景気回復が見込まれる。

 物価については、景気回復により、需給が引き締まる中で緩やかに 上昇し、デフレ脱却に向け前進が見込まれる。

 この結果、令和2年度の実質GDP成長率は 1.4%程度、名目GDP成長率は 2.1%程度と見込まれる。また、消費者物価(総合)は0.8%程度の上昇と見込まれる。

内閣府「令和2年度の経済見通しと経済財政運営の基本的態度(本文)」

とあるように、あくまでも総合経済対策を行った上で実現させるという努力目標としての意味合いがある。これは以下のように複数の百科事典でも指摘される。

見通しは予測というだけでなく政策意図も含み、原案を内閣府(旧経済企画庁)がつくり、財務省(旧大蔵省)、経済産業省(旧通産省)と意見調整をして閣議決定する。

コトバンク/ブリタニカ国際大百科事典「政府経済見通し」

見通しは予測というだけでなく政策意図も含み、原案を内閣府(旧経済企画庁)がつくり、財務省(旧大蔵省)、経済産業省(旧通産省)と意見調整をして閣議決定する。

コトバンク/日本大百科全書「政府経済見通し」

斎藤氏も、

1998年7月に経済企画庁長官に就任した堺屋太一氏が、「政策目標としての経済見通し」から「当たる経済見通し」への転換を図った

ニッセイ基礎研究所「経済予測はどのくらいはずれるのか(1)~政府経済見通しの精度を検証する~」

事を指摘し、その上で予測精度は向上していない(楽観的なまま)と分析しているが、程度問題はあれば目標として位置付けられる事に変わりはなく、そのまま民間と比較しても仕方がない。

日本銀行の展望レポートについても、参議院の「経済のプリズム」にて以下のように記述される。

(Q)日銀の経済見通しは当たるのでしょうか?

(A)そもそも当てようとして作成したものではありません。あくまで現在日銀が想定した標準的なシナリオが実現すれば達成するだろうと各政策委員が考えた見通しにすぎません。

参議院『日銀の展望レポート』「経済のプリズム」第128号(平成26年6月

要するに、政府も日銀も当てることが第一でないのに、当てる事を第一とする民間調査の予測と比べて「民間の方が優秀だ」と述べているわけである。民間調査機関としてはそう言いたい理由は分かるが、ナンセンスであることに変わりはない。

ブレンドモデルの優秀性

民間調査機関が優秀というよりかは「ブレンドモデルが優秀」という事は言える。斎藤氏が取り上げた民間予測は日本経済研究センターの「ESPフォーキャスト調査」だが、これは約40人の民間エコノミストの予測値を平均したものである。

民間エコノミストがどのように予測値を出しているかまでは分からないが、似ている部分があると言え、予測値が異なる以上、異なるモデルやパラメータを利用しているはずである。

合議制というものは全体としては優秀で、異なるモデルの予測値を平均すると優秀になる傾向は様々な場面で見られる。

これは機械学習などでも同じで、複数のそこそこの精度のモデル(弱学習器という)の予測値を単純に平均すると、精度が高いモデル(強学習器)ができることは多い。これは機械学習コンペのKaggleなどでもよく使われる手法である。

もっと分かりやすい例で言えば複数の女性の顔写真の平均顔が美人になるというものがある。これもある程度顔が整った人の顔(弱学習器)を平均させれば、パーツの位置が平均化されてより整った顔(強学習器)になるというものである。

ESPフォーキャスト調査はこの意味では優秀と言え、多数の民間エコノミストの予測値を平均することは弱学習器から強学習器を作ることに等しい

但し、これをもって政府より民間の方が優秀というのは飛躍である。ESPフォーキャスト調査は民間調査の一つに過ぎないし、政府経済見通しとそのまま比較するのは「政府VS民間の合議制」ということになり、フェアな比較ではない。

日銀展望レポートは9人(総裁1人、副総裁2人、審議委員6人)が予測値を出し、その最大値・最小値を除去したものが予測範囲、中央値が公式予想とみなされている。中央値と平均値は異なる。前節のように当てることが目的ではない上、モデルブレンドには該当しないので精度が相対的に低くなるのは致し方無い。

指標の注目度の違い

ブレンドだろうとなんだろうとESPフォーキャスト調査の方が精度が高いのだから民間調査機関の予測の方が優秀で有用だと言いたくなるだろう。しかし、指標としての重要性(=注目度)が全く異なるので、結果論で比較しても意味が無い。

「○○という指標が有用」という情報が広まってから、それを指標しても投資がうまくいかないように、ある予測値が「重要なもの」として公開された時点で、それは予測値としての有用性は下がってしまう。(そもそも目標や標準シナリオとしての意味合いであり、予測が目的でないのは前述の通りだ。)

ESPフォーキャスト調査の方が優秀だったとして、仮にそれが多くの人に認識され、それを基準に経済活動が行われるようになれば、その精度は低くなるかもしれない。

以上のように、そもそも政府や日銀の予測は当てることが目的ではないし、ブレンドモデルである特定の指標と取り上げて「民間予測の方が優秀」というのは乱暴であるし、また注目度も全く異なるので、単純に比較するのはフェアでないどころか無意味である。

       

この記事の著者 HAL について

金融・マーケティング分野の機械学習システム開発や導入支援が専門。SlofiAでは主に海外情勢に関する記事、金融工学や機械学習に関する記事を担当。

HAL の記事一覧 SlofiAのtwitterアカウント@slofia_finance