統計の信憑性

産經新聞のニュースに,クレジットカード統計がこっそり修正されていた,という記事があげられていました.私の研究室では,統計情報に基づいて,個票データを復元する,というプロジェクトを推進していますが,統計データに合わせたからといって,それが必ずしも信用できるものではない,ということが残念ながら明らかになってしまいました.記事の中にも書かれているように,利害関係が発生する統計情報には,正確な情報があがってこないため,正確でない可能性があることがわかります.統計情報が正確でない場合,社会シミュレーション的には次の2つのスタンスで統計情報を用いる必要があるだろうと思います.

1.統計情報の真偽に関わらず,その情報に基づいて動く業界の動きを推定する.
2.報告された統計情報と社会シミュレーションとして推定した数値との差の原因を追究する.

1の立場からは,「偽」情報であったとしても,その情報に基づいて行動する業界があるのであれば,その情報が「真」であると仮定して,シミュレーションを行う必要があります.しかし,その場合,実態と推定の条件にズレがあるため,推定が正しくなることがありえません.

また2の立場からは,モデルが正しく同定されている場合には,統計情報に問題がないかどうかをチェックすることができますし,統計情報が正しい場合には,モデルに不備があると考えられます.差の原因を追究することは困難でありますが,この差を追究する姿勢を保ち続けることが,統計とモデルの正しいつきあい方であろうと思います.

記事の中でも,家計調査などの政府統計について言及されており,それらを参考指標として用いている,とあります.どこかに推定をいれているのか,検算のみに用いているのかが不明ですが,それらの政府統計自体にも誤差が入っていることを念頭においておかなければいけません.統計をどこまで信じるのかは難しい問題ですが,統計と正しくつきあう方法を考えさせられた記事でした.

http://www.sankei.com/economy/news/150514/ecn1505140004-n1.html

*カードの画像と記事とは関係ありません.

cards2

This entry was posted in 社会シミュレーション. Bookmark the permalink.

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

当てはまる数字が認証コードになります. *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>