だ・か・ら、IDのハッシュ変換を、「非識別化」とか言うなってーの。

http://www.yomiuri.co.jp/net/news0/atmoney/20130906-OYT1T01013.htm」を見て。
DoCoMoDoCoMoの子会社(調査会社)」間のデータ保全が万全であるという前提で、当然「外の会社に売られるのは解析結果」(k-匿名化)という事「のみを持って」一応問題が薄いかな、という事ではあるけど。
EU辺りだと訴訟起こされる程度の発想なので、わりとガラパゴスな仕様ではある。

解析結果というのは、二重三重にサマライズした後のはずなので、生データ・加工データを売っている感じではない。

通信ログ
→一人一人が独立であるレベルのデータ
→各種のカテゴリ(それぞれのカテゴリが集団になっているもの)に対してのカウントや平均値などのデータ
というような形で、
最後にID含まない統計結果しか出さないんだったら、中でIDをそのまんま使うのでもあんま問題ないです。所詮中のロジックなだけなので。

ただ、日本独自なセンスなのかな、「非識別化」とかいうの、単なるIDのハッシュ化だし、「個人識別性がない」という時の「個人」「識別」という言葉は政治用語になりつつある、センスのない言葉なのでどうにかした方がいい。
匿名化処理とやらを重ねるのは意味があるのか、と言われるとそんなにないと思うのだけど(どうせDoCoMoの業務委託して出た成果物を子会社が買って外に販売する、というやり方とさして変わらん)。
結局の所、ハッシュも含まれない集計結果として売るのならばこれに起因する個人情報漏れは気にしなくていいだろう。
ただ、どんだけハッシュとか混ぜようが、一意特定出来てしまうものなら、他の何かのシステムのデータと結び付けて特定出来る可能性は捨てられない。
あと、駅周辺だと、人の流れ一ヶ月ぐらい外で見てたら分かりそうなもんだけど。主にコンサル屋さんのハッタリのネタにしかならんと思うのよねえ。