統計

だ・か・ら、IDのハッシュ変換を、「非識別化」とか言うなってーの。

「http://www.yomiuri.co.jp/net/news0/atmoney/20130906-OYT1T01013.htm」を見て。 「DoCoMo→DoCoMoの子会社(調査会社)」間のデータ保全が万全であるという前提で、当然「外の会社に売られるのは解析結果」(k-匿名化)という事「のみを持って」一応問題…

そういや、統計用語ってJIS規格あるのご存知ですか?

みんな知らないだろうなあ。 (´・ω・`)JIS規格の最大の欠点は、「著作権を残している為に、小銭は稼げてるんだけど使われない規約は本当に使われない」という所な気がしている。 まあとにかく使いづらい。だって、全文切り出して提示したいような内容「しか…

統計の罠、というのは色んな所に含まれている。

1942年に行われた最初の実験以降、シュマイドラー教授は10年以上にわたって実験を繰り返し、最終的には約25万回に及ぶ透視実験を行った。 その結果として羊群の的中率は適正期待値のプラス約0.4%、山羊群はマイナス約0.3%であり、両者の差異は、偶然比で1…

ビッグデータ活用の話をぼんやりと。

やまもとい***氏のメルマガをこれの話目的で読んでいるんですけど、まあぼんやりした話になってるなあとは思いました。 まあ仕方ねえなあという気はしますが。だいたいは、「ビッグデータって言うほど便利じゃないしデータ大きいだけ苦痛」というお話で、…

ビッグデータ解析で何がしたいのかが分からないなと思いつつ。

「[徳力] 統計学が最強の学問である (西内啓)を読んで、あらためて統計や分析を学ぶことの重要性を再認識中です。」を見て。 ■標準誤差を算出する 標準誤差というのがどういったものかというと、サンプルから得られた割合に対して標準誤差の2倍を引いた値…

たまには、SASの宣伝でも。

SASは以前より大学に導入し易い&購入費用が抑えられることもある、ということで。現在、アカデミックパックみたいなのの、大学の全学向けライセンシーみたいなのがあり、かつてみたいに 「SASマジクソたけえ」 という状況ではない。いや、それでも高いとか…

統計を見る時の諸注意

メモメモ。 統計は原則として差を見るもの 対照が隠れていることがある 統計のデータだけを見て推定することは無理 データにはあらわされない測定値の性質などが隠れていることがある。 予測の限界の範囲はある。少なくとも最小値〜最大値。 中央極限定理に…