毎月勤労統計調査の問題に関しての、いくつかの知識

remcat.hatenadiary.jp
見ながら。

精度

https://www.mhlw.go.jp/toukei/itiran/roudou/monthly/dl/maikin-chousa-seido.pdf
にあった。
www.mhlw.go.jp
の、「調査結果の精度」から辿れる。

全ての標準誤差率等を計算されている訳ではないが、PDF内にある時期の標準誤差率が入っている。が、500人以上の場合には計算されていない。


目標精度の場合には、「これを使って標本設計を行う」ものであり、実際どうなのというと案外ズレとるがな(目標精度に達していない)という話になる気が。
どうにも用語定義の割に、使っている式が共分散使ったりしていて、標準誤差率と呼んでいいのかなあとは思うが、この手の事は多いので気にしない。


ただし、この資料では「回収率」という言葉は出てこないのだが、
http://www.soumu.go.jp/main_content/000594893.pdf
には、「回収率を元に誤差率を~」と記載がある。何かしら厚生労働省の説明に矛盾があると思われる。

回収率は、「生で実際に採取した事業所のサンプル」に基づく為問題なしとしている、のであれば、そもそも目標として据えていた精度が何のために設定されていたのか、という事が問題になると思われる。東京都だけ重みとして三倍換算されるのであれば、真のデータからのズレを示すような指標であるはずなので、考慮は必要ではないかと思われる。

復元方法

http://www.soumu.go.jp/main_content/000594893.pdf
に記載がある。
www.soumu.go.jp
からのリンク。
厚生労働省にはない。

東京都だけ1/3にしていたので3倍にしたという事のようであるが、500人未満の事業所でも東京都だけ別処理されている為、こちらは復元されているのか不明。

あと欲しいもの

プログラム設計書を出せ。
説明資料と実装が乖離している可能性がまだありそうだ。
それが無理なら、GitHubにプログラム公開してほしい。

雑感

統計上問題ないとかの逆張りは、あんまりオススメしない態度なのであるけども、なんだかそういう表明をする人が多いなと思っている。
どれくらいの精度が必要なのか、という事に関しては、統計知識が判断する事はない。必要とされる精度に対しては答えが出せるが、数%違うのが問題なのかどうなのかは、「その差に実際の意味があるかは統計が決めない」ので。
ただ、前年度比で給与が上がってるとか労働時間がとか言う際には、1%も変わってなかったりするので、これ0.1%のオーダーでもズレると様々な判断変えないといけないのではないかなと思う。


実際に公表されている事と違う事やってた問題については、正直これ「中の統計家の勇み足」であったのだろうとは思う。
恣意的にやり方を変えた、のではなく、おそらく目先の費用感を抑える為にやったのではないかなと思う。よく見積の条件として、数を出される為、一つあたり単価みたいなのを出す訳だけど、要件から数削られると受ける側が減額させられるという。
実際には1/3になったからと言ってやる作業が大きく減るわけではないんだけど、絞ろうとする会社はあの手この手で金額減らそうとするよねえ・・・・・・
プログラムの発注をせず内部で改修していた、という事についても、コストカットの一貫ではある。
けど、これ、予算を増やしたからと言って、この体質がすぐに変わる訳ではない。
統計の所で、「バケツでウラン」のような事が行われてしまった訳なので、職業倫理の再構築みたいなのまで必要になってくるだろう。
内部告発で発覚した訳でもないし、ホント自分たちが何やらないといけないのか理解出来ていないんだなあ。困った事に。