昨年の8月(2021年8月)、警察庁が交通事故統計情報をオープンデータとして公開したようです。現在、過去2年間(2019年度、2020年度)のデータが公開されています。全国の交通事故を分析するのに非常に有益なデータだと思います。早速、三井住友海上が、このデータを使い、交通事故オープンデータマップを作っています。
「世界最先端デジタル国家創造宣言・官民データ活用推進基本計画」に基づいて、公開がなされているようですが、オープンデータの世界では日本は世界に大きく遅れをとっており、分野にもよるのでしょうが、米国と比べると50年は遅れているように思います。
日本は、データに基づいて物事を合理的に判断、評価、改善することを嫌がり続けた「後進国」だとの認識があります。日本は、国民に公告されている「官報」に掲載されている情報を、より国民が検索しやすくなるようサービスを作ると、「そのサービスを停止しなさい」と国家が「命令」してくる「野蛮な国」でもあります。
「遅れていて野蛮な国」日本で、しかも、情報公開を最も嫌う警察庁がデータを広く国民に公開したことは歓迎すべきことです。「データが公開される」そのことだけでも、この国にとっては大きな一歩だと思います。
しかし、単にデータが公開されただけでは、何の役にも立ちません。データを使い、分析、視覚化するなど、ヒトの判断、評価、改善に資するよう、データをヒトの役に立つ形にする必要があります。
公開された「交通事故統計情報」の問題点や改善してほしいところを触れたいと思います。
1.ファイル内の「データ」に対応する形の「各種コード表」があるのですが、この「各種コード表」がPDFファイル形式で公開されています。PDFファイル「でも」公表するのはよいのですが、PDFファイル「だけ」公開されると、その後の機械可読や機械処理が困難になります。機械処理ができるよう、少なくとも「各種コード表」は、TXT形式で公開をしてほしいです。
2.CSV「でも」データを公開されるのはよいのですが、CSVに加えて、多くの大学や研究機関が分析で使用しているパッケージSPSSやSAS形式でデータを公開して欲しいです。そうすると、研究者がデータをすぐに分析に取りかかれます。
3.「データ」「各種コード表」も含め、日本語だけでなく、英語「でも」公開して欲しいです。こういったデータを使って分析したい海外の研究者はいるでしょうし、その研究成果は、日本国民の利益になります。
4.現在、2018年、2019年の2年間のデータが公開されていますが、最低でも過去10年のデータを公開して欲しいと思います。過去に交通事故が何回も発生している場所が、データに載っていません。公開されているデータが正しいのであれば、たまたま2018年と2019年に事故が発生していないのだと思いますが、ある一定の期間のデータがないと、交通事故のような低い頻度で発生するような事象を分析する際、分析目的によりますが、限界がどうしても出てきてしまいます。
5.ウェブページに公開されたデータを見ますと、警察庁には、統計やデータを扱う教育を受けた職員が、少なくとも、このオープンデータの現場には配置されていないように感じます。統計やデータ分析ができる専門の職員を配置するか、総務省の統計研究研修所に統計教育を行うプログラムがありますので、職員の研修や教育をして欲しいと思います。オープンデータの現場の職員とお話をしましたが「多変量解析」「ロジスティック解析」という学部の学生であれば誰でも知っているような基本的な用語も聞いたことがないという職員が配置されてます。「世界最先端デジタル国家」を創造するのであれば、真剣に人事に取り組んでもらいたいものです。ちなみに警察庁の名誉と、その職員の名誉のために付け加えますが、これは「後進国」日本では、珍しいことではなく、役所、しかもデータを取り扱う現場では、普遍的に見られることで、決して、警察庁が怠慢だとか、その職員の知的レベルが低いというわけでありません。データの「集計」から先の「分析」を業務で求められることがないので、「後進国」である日本では、「多変量解析」「ロジスティック解析」を知らない職員が、データを扱う部門にいても、必要な業務を行える十分な知識と技術を持っているとされています。いくつかの自治体では、統計が大好きな課長のもと、一般職員も交え課全体がデータ分析をし、学会などで発表するなどしておりますが、そういった自治体は、後進国の日本では、とても珍しいことです。日本が「先進国」の仲間いりをするためにも、公的機関の職員に対する、統計やデータ分析の教育は取り組まなくてはいけない課題だと感じています。
このうち4について、警察庁に問い合わせました。2017年以前のデータについては公開する予定がないとのことです。2017年以前のデータについて、入手できないか、現在調査を進めています。2021年度のデータ(交通事故統計情報)については、2022年8月に公開予定とのことです。