2014年01月25日

中国統計とのつきあい方

1月20日,国家統計局の馬建堂局長が2013年の経済成長率を中心に記者会見を行いました(ここ)。

記者会見の中で,信頼性に関する質問が毎年でます。今回国家統計局が出したジニ係数0.473についても質問がでました。そこから読み取れる中国経済の数字,そしてつきあい方を考えてみたいと思います。

1.ジニ係数は信頼できる?

鳳凰TV(フェニックステレビ)のレポーターが昨年から発表するようになったジニ係数について一部専門家の推計(注)よりも過小評価されていないか,とツッコみました。

(注)昨年,西南財経大学が2012年12月にジニ係数を0.61と発表して話題をさらった。(例えば,http://j.people.com.cn/94475/8053174.htmlなど。)


馬建堂は答えます。

「(国内の)一部の専門家や世界銀行による推計と大きくは離れていない,ジニ係数は統計データというよりも統計データから推計される数値である,その数値は基礎データに依存する。全体として統計局が推計した0.473は中国の実情に適合している」(要旨)と。

そして,ジニ係数を計算するためのサンプル調査も詳しく解説します。曰く,重要なのはサンプル数とサンプル分布と代表性,そしてサンプル自体の信頼性。統計局では,40万戸のサンプル(16万は国家レベルのサンプル,24万戸が地方サンプル)をとっていること,第6次人口センサスから科学的に抽出していること,各サンプルに日ごと月ごとに記帳してもらっていること,を強調しています。

続けて馬局長は

「いずれにせよ,0.473というジニ係数は低くはないし,国際的には所得再分配に改善の余地が多いのは事実である。私たちは所得再分配への改革に力をいれるべきだ」

としています。


2.中国統計の読み方

この馬建堂の記者会見のやりとりから以下の二つの事実を指摘しておきたいと思います。

まず1点目。国家統計局のアクセスできる一次データは大量であり,そのため他の国内外の研究機関よりも有利な立場にあるという点です。

ジニ係数の解説でも触れられているように,国家統計局は40万戸のサンプルを持っています。西南財経大学が自分たちの調査データから推計してジニ係数が公式数値よりも大きいことを示して話題をさらいましたが,サンプル数という点では国家統計局にはかないません。その他の数値についても,圧倒的に大量なデータを背景にもっています。

2点目。数値が正確ということよりも,その数値をどう解釈するかが重要です。たしかに中国のジニ係数が信じられないという人もいるかもしれません。でも信じられなくても,国際的に警戒レベル,0.4より高いのはほぼ間違いないでしょう。となると,数値が0.49であろうが,0.45であろうが大きな意味はなく,馬建堂が指摘するように所得再分配をやらないといけないという結論について多くの人が一致するところではないでしょうか。数値の小数点以下すべて正確であるというよりも,一般性をもつ解釈を導き出すことが重要なように思います。


3.中国統計をどう利用すべきか?

中国統計に対する信頼性はいろいろ議論されるところです。毎年,統計年鑑を見てみると,各地域のGDPの合計は全国よりも10%程度大きくなります。毎度のことですが,中国のGDP(全国と各地方)が発表されるたびに,地方政府の水増し!(産経)とか信頼性が問題!(ロイター)と記事がでます。(このネタは毎年の恒例行事になっているので,正直GDP以外のネタで統計の信頼性と地方政府の水増しの事例を報道してもらいたいぐらいです。)

古いところではロウスキーのエネルギーとGDP統計の議論(Rawski2001)から最近では地域のGDPで星野さんの議論(Hoshino2011)などがあり,学問分野でも中国統計の信頼性は議論されているのは事実なので,信頼性をある程度加味しながら中国統計は見ていかないといけないと思います。


中国のミクロ,マクロ統計を組み合わせて作成される中国の産業連関表と20年つきあって得た,中国統計の付き合い方について私見を3つほど紹介します。


まず,正確性を割り引く,ということ。中国の2013年GDPが56兆9000億元と発表されました。さまざまな数値を推計し,積み上げてGDP統計ができますが,その推計過程においては56兆8000億元になる可能性も57兆元になる可能性もあります。この積み上げ過程で政治的な思惑が働く可能性があるのかもしれませんし,ないかもしれません。このあたりは統計の外部利用者にはわからないところです。

100%正しいとするのではなく,95%の確率で確からしいと考えて利用しましょうということです。例えば,1000回GDPの推計作業が行われるとして,950回以上はほぼ56兆9000億元前後になる(平均値)とします。まれに間違いが発生する,あるいは政治的な介入があるがその確率は非常に小さい(5%以下)と考えるわけです。このように正確性を5%割り引いて考えてみようと。100%正しいというのではなく95%ぐらいの正確性を感覚として持つことだと思います。

なぜ5%かって?とくに根拠はありませんが,統計局が公式に世界に発信するわけですから,本当は99%以上の確信はもっているかもしれません。でも,利用者側としてもう少し割り引いて考える,つまり社会統計的に一般にこれだけあれば有意だろうとみられる5%水準を採用しているというふうに考えています。


次は,比率を利用する,ということです。統計数値そのままだと不安だという場合,相対化すると見えてくるものがありますし,変化をとらえることが可能になります。

昨年より増えたか減ったか,その比率をみてみると今まで上昇傾向にあったのが減少に転じたりします。ずっと上昇しているというのならとくに問題はありませんが,傾向(トレンド)に変化が出た場合,背景として何かそれを説明できる出来事や裏付けがあるかどうか,なければ統計数値に疑いがでるということになります。

リーマンショックという明らかな事件があれば,貿易の伸び率が減少あるいはマイナスになるのは自然なことと解釈できますが,何もないのにトレンドが変わるというのは数値に注意ということです。

時間軸(過去と現在),空間軸(沿海と内陸),相対の軸(都市と農村)を用いた比率を利用することによって,数値の「傾向(トレンド)」に気をつければ,データの絶対値に左右されない使い方が可能です。


最後に,もっとプラクティカルなことをいえば,信頼性のあるようにいじる,ということがあげられます。信頼性が高い数値をコントロールトータル,つまりこの数値を基本として他数値を調整するということです。

一般に,有名なところでは貿易統計,政府財政(関税など)のような報告統計は全数調査なので信頼されますし,中国の場合地方統計局よりも国家統計局の方が物・財・人の面で統計作業に有利なので,国家統計局が発表するものをコントロールトータルにします。

例えば,GDPであれば国家の数値をコントロールトータルとして,各地域のGDPを参考情報にして,各地域のシェアで按分して利用するという方法です。信頼できる(と思われる)数値に基準をおいて,ちょっと計算しなおして利用する,こういう方法もあります。


私たちはただ単に中国統計の信頼性について盲目的に批判,あるいは不安をもっていたりします。でも現場の統計局の人たちは優秀です。海外との統計機関(日本では経済産業省や内閣府統計局など)での研修や相互交流を通じて,統計手法を改善してきました。国際的にも国連が推奨するSNA基準に従ってすでに20年以上になり,ノウハウも蓄積してきています。

GDPとかジニ係数とか政治的に利用されやすい数値は発表前にトップによる「意向」が働く可能性は無視できないとは思いますが,批判するだけでなく,また無批判に利用するだけでもなく,適度な距離をおいて,中国の統計とつきあっていく必要があるといえます。


<参考文献>
Hoshino, M. (2011) ‘Measurement of GDP per capita and Regional Disparity in China 1979-2009’, RIEB Discussion Paper Series, DP2011-17, Kobe University
Rawski, T. G. (2001)'What is happening to China's GDP statistics?' China Economic Review, 12(4) pp. 347-354
posted by okmtnbhr at 08:00| 埼玉 ☔| Comment(0) | TrackBack(0) | 岡本式中国経済論 | このブログの読者になる | 更新情報をチェックする