何故「CSVで出してほしい」という願いが残念な形で叶うのか。

twitter.com
はてなブックマーク - 内閣府の「国民の祝日」のCSVがひどい。

このCSVは、「Excelファイルをcsv形式で保存」した場合に出来る何かの可能性が大きい。

人間が、人力で、手作業で出している。
そして、その元となるExcelファイルは、おそらくAD連携頑張ってる役所の奥深くのファイルサーバに、粛々と保管される。
そのファイル名は、shukujitsu.xlsであろう。


f:id:houyhnhm:20170223101831p:plain


因みに、Excelではその上に乗っかったデータはほぼCSVで保存される。
ただし、Excelの独特のルールで保存される。
結合されたセルにあるテキストは、左上のセルにあるものとして保存される。
セル結合は解除されたような状態になる。

原因の憶測。

多分、データ作成者は、List形式でもさして問題はないと思う。脚注入れないでいいだけだし、コピペ編集を横方向ではなく縦方向にすればいいだけなのだから。
ところが、データ検証の段階になり、正しく日付が入っているかという表をという事になると、この横並びの方が都合がいいわけである。A4横1枚に収まるし、横方向を見て去年との比較も出来る。


つまり、目で見て問題ないと判断してという部分について、この表は優秀なんである。
・・・・・・ただ、どう考えても「データとして扱うのが面倒」という事を除けば。

どうしてこうなるのか。

基本的な所では、本邦のシステム化というものは、「人間の作業のコンピュータ化」であるからだ。
だから、「別の会社の作業が面倒なんですが」という所については極めて弱く、データ交換規約は固定的で成長しづらい。
何世代前だよというような形式がまかり通る。
iCalender形式で出せよという事はホントに無理なの。


なんでか上の会社がシステム設計やると、システム間連携をCSVにするとかザラすぎてげんなりする。CSVと言いつつ、なんでか改行コード平気で入れてくるし。

とはいえ。

  1. 更新は年一回程度

なので、パーサー作る方が時間の無駄になるんで、パーサーは作られないと思いますね。
システム的には断裂が出来やすく、しょうもなく人手が必ずかかるものですが。
何故か拡張性の低いパーサーを作る人達がいるのですが、どう拡張されるか分からんので、そのプログラムが来年使えるとは限らないのです。まあ、年一回なのでそんなの余裕とかいいんですが、それって、コピペより手間かけてますよね。バカじゃないですかねえ。


てかなー、せめてDBレイアウトにしてほしい。
あと、もう少し日本でも表とデータの分離は意識されてほしい。
いい加減MVC的な発想が出てほしい。