昨年の8月(2021年8月)、警察庁が交通事故統計情報をオープンデータとして公開し、現在、過去2年間(2019年度、2020年度)のデータが公開されています。公開されている項目は、事故の発生年月日、時間、場所、死傷者数など全部で58項目あります。
オープンデータとして公開になっている58項目は、警察庁が収集している交通事故に関する項目の全てなのでしょうか?
調べたところ、警察庁は全国の交通事故のデータを「全事故ファイル」「死亡事故ファイル」との名称のファイルに記録を行っており、記録している項目は約3倍の156項目であることがわかりました。言い換えれば、オープンデータとして公開されている項目は、わずか3分の1ということになります。
この156項目ですが、PDFファイルで公開されているために、データの機械可読や再利用が行いにくい形になっています。もともと紙で記録されていたものを、WEBに公開するために、PDFで公開したのでしょうが、人間だけが読む前提ではなく、機械処理「も」することを前提に、PDFに加え、少なくともCSVファイル形式で公開してほしいと思います。
警察庁の方で「全事故ファイル」の機械可読用のデータ項目を公開してないので、機械可読用のデータ項目を作ってみました。番号は項目に応じて割り振った番号で、全部で156番まであります。左の「公開」の列は、公開されている交通事故統計情報のオープンデータの項目と照合し、含まれている項目は「○」、含まれていない項目は「X」、含まれてはいるがデータの精度が落ちているものは「△」で示しています。
データの精度が落ちている「△」は「重傷者数」「年齢」です。「全事故ファイル」では「重傷者数」「軽傷者数」と分かれていますが、オープンデータでは「負傷者数」として、まとめられています。「全事故ファイル」では、年齢を1歳刻みで記録していますが、オープンデータでは24歳以下は1つの集団として取り扱い、25歳から75歳までは10歳刻みで、それぞれ集団として取り扱っています。
オープンデータとしてデータを公開する以上、様々な角度から分析や仮説の検証ができるデータ精度が欲しいと思います。オープンデータでは24歳以下は、同じ集団として扱っていますが、これでは、例えば、子どもの交通事故の傾向分析が困難になります。子どもは、学齢が1つあがるごとに、できることが劇的に変わります。学齢ごとに遭遇する事故の傾向が異なるように思いますので、24歳以下を同じ集団として取り扱うのは、せっかく貴重なデータをオープンにしているのに、分析で得られる結果が限られ、もったいないと感じます。今回はここまで。
公開 | 番号 | 項目 |
---|---|---|
○ | 1 | 都道府県警察署等コード |
X | 2 | 原票作成年 |
X | 3 | 原票作成月 |
X | 4 | 原票作成日 |
○ | 5 | 事故内容 |
○ | 6 | 死者数 |
△ | 7 | 重傷者数 |
△ | 8 | 軽傷者数 |
X | 9 | 乗車人員(第1当事者、第2当事者) |
○ | 10 | 路線コード |
○ | 11 | 地点コード |
X | 12 | 交差点ード |
○ | 13 | 市区町村コード |
○ | 14 | 発生年 |
○ | 15 | 発生月 |
○ | 16 | 発生日 |
○ | 17 | 発生時分 |
○ | 18 | 昼夜 |
○ | 19 | 天候 |
○ | 20 | 地形 |
○ | 21 | 路面状態 |
○ | 22 | 道路形状 |
○ | 23 | 信号機 |
○ | 24 | 一時停止規制(第1当事者、第2当事者) |
○ | 25 | 車道幅員 |
○ | 26 | 道路線形 |
○ | 27 | 衝突地点 |
○ | 28 | ゾーン規制 |
○ | 29 | 中央分離帯施設等 |
○ | 30 | 歩車道区分 |
○ | 31 | 事故類型 |
X | 32 | 特殊事故(第1当事者、第2当事者) |
X | 33 | 性別(第1当事者、第2当事者) |
△ | 34 | 年齢(第1当事者、第2当事者) |
X | 35 | 国籍・地域別コード(第1当事者、第2当事者) |
X | 36 | 居住地コード(第1当事者、第2当事者) |
X | 37 | 職業コード(第1当事者、第2当事者) |
X | 38 | 免許証番号(第1当事者、第2当事者) |
X | 39 | 運転資格(第1当事者、第2当事者) |
X | 40 | 事故車種の運転免許経過年数(第1当事者、第2当事者) |
X | 41 | 当事者種別(第1当事者、第2当事者) |
X | 42 | 車両番号(第1当事者、第2当事者) |
○ | 43 | 用途別(第1当事者、第2当事者) |
○ | 44 | 車両形状等(第1当事者、第2当事者) |
X | 45 | オートマチック車(第1当事者、第2当事者) |
X | 46 | サポカー(第1当事者、第2当事者) |
X | 47 | 通行目的(第1当事者、第2当事者) |
X | 48 | 選任事業所等(第1当事者、第2当事者) |
X | 49 | ライト点灯状況(第1当事者、第2当事者) |
X | 50 | タイヤ等の状況(第1当事者、第2当事者) |
X | 51 | 反射材等使用状況(第1当事者、第2当事者) |
○ | 52 | 速度規制指定のみ(第1当事者、第2当事者) |
X | 53 | 初心運転者標識(第1当事者、第2当事者) |
X | 54 | 高運転者標識(第1当事者、第2当事者 |
X | 55 | 危険認知速度(第1当事者、第2当事者) |
X | 56 | 飲酒状況(第1当事者、第2当事者) |
X | 57 | 携帯電話等の使用状況(第1当事者、第2当事者) |
X | 58 | カーナビ等の使用状況(第1当事者、第2当事者) |
X | 59 | 自動運行装置の使用状況(第1当事者、第2当事者) |
X | 60 | 法令違反コード(第1当事者、第2当事者) |
X | 61 | 事故要因区分コード(人的要因(第1当事者、第2当事者)、車両的要因(第1当事者、第2当事者)、環境的要因(第1当事者、第2当事者) |
X | 62 | 行動類型(第1当事者、第2当事者) |
X | 63 | 当事者の進行方向(第1当事者、第2当事者) |
○ | 64 | 車両の衝突部位(第1当事者、第2当事者) |
○ | 65 | 車両の損壞程度(第1当事者、第2当事者) |
X | 66 | 自体防護(第1当事者、第2当事者) |
X | 67 | プロテクターの装着(第1当事者、第2当事者) |
○ | 68 | エアバッグの装備(第1当事者、第2当事者) |
○ | 69 | サイドエアバッグの装備(第1当事者、第2当事者) |
○ | 70 | 人身損傷程度(第1当事者、第2当事者) |
X | 71 | 人身損傷主部位(第1当事者、第2当事者) |
X | 72 | 損傷主部位の状態(第1当事者、第2当事者) |
X | 73 | 人身加害部位(第1当事者、第2当事者) |
X | 74 | 自宅からの距離(第1当事者、第2当事者) |
○ | 75 | 地点 緯度(北緯) |
○ | 76 | 地点 経度(東経) |
X | 77 | 予備項目1(第1当事者、第2当事者による妨害運転の有無や運転中の携帯電話利用等、道路交通に係る事項) |
X | 78 | 予備項目2(第1当事者、第2当事者による妨害運転の有無や運転中の携帯電話利用等、道路交通に係る事項) |
X | 79 | 予備項目3(第1当事者、第2当事者による害運転の有無や運転中の携帯電話利用等、道路交通に係る事項) |
X | 80 | 性別(第3当事者以下) |
X | 81 | 年齢(第3当事者以下) |
X | 82 | 国籍・地域別コード(第3当事者以下) |
X | 83 | 居住地コード(第3当事者以下) |
X | 84 | 職業コード(第3当事者以下) |
X | 85 | 当事者種別(第3当事者以下) |
X | 86 | 用途別(第3当事者以下) |
X | 87 | 車両形状等(第3当事者以下) |
X | 88 | 乗車別(第3当事者以下) |
X | 89 | 乗車等の区分(第3当事者以下) |
X | 90 | サポカー(第3当事者以下) |
X | 91 | 通行目的(第3当事者以下) |
X | 92 | 自動運行装置の使用状況(第3当事者以下) |
X | 93 | 自体防護(第3当事者以下) |
X | 94 | エアバッグの装備(第3当事者以下) |
X | 95 | サイドエアバッグの装備(第3当事者以下) |
X | 96 | 人身損傷程度(第3当事者以下) |
X | 97 | 人身損傷主部位(第3当事者以下) |
X | 98 | 損傷主部位の状態(第3当事者以下) |
X | 99 | 人身加害部位(第3当事者以下) |
X | 100 | 免許証番号(第3当事者以下) |
X | 101 | 運転資格(第3当事者以下) |
X | 102 | 事故車種の運転免許経過年数(第3当事者以下) |
X | 103 | 車両番号(第3当事者以下) |
X | 104 | ライト点灯状況(第3当事者以下) |
X | 105 | 危険認知速度(第3当事者以下) |
X | 106 | 行動類型(第3当事者以下) |
X | 107 | 反射材等使用状況(第3当事者以下) |
X | 108 | 当事者の進行方向(第3当事者以下) |
X | 109 | 車両の衝突部位(第3当事者以下) |
X | 110 | 車両の損壊程度(第3当事者以下) |
X | 111 | 自宅からの距離(第3当事者以下) |
X | 112 | 備項目1(第3当事者以下) |
X | 113 | 予備項目2(第3当事者以下) |
X | 114 | 予備項目3(第3当事者以下) |
X | 115 | 高速道路_発生地点 |
X | 116 | 高速道路_道路管理者区分 |
X | 117 | 高速道路_道路区分 |
X | 118 | 高速道路_曲線半径 |
X | 119 | 高速道路_縦断勾配 |
X | 120 | 高速道路_トンネル番号 |
X | 121 | 高速道路_特殊事故 |
X | 122 | 高速道路_当事車両数、 |
X | 123 | 高速道路_行動類型(第1当事者、第2当事者) |
X | 124 | 高速道路_事故類型、 |
X | 125 | 高速道路_車両単独事故の対象物 |
X | 126 | 高速道路_臨時速度規制の有無 |
X | 127 | 高速道路_速度規制臨時のみ |
X | 128 | 高速道路_停止表示器材表示の有無 |
X | 129 | 高速道路_交通障害 |
X | 130 | 高速道路_高速道路走行距離(第1当事者、第2当事者) |
X | 131 | 高速道路_速度抑制装置装状況(第1当事者、第2当事者) |
X | 132 | 高速道路_予備項目(第1当事者、第2当事者) |
X | 133 | 入力年月日 |
X | 134 | 計上月 |
○ | 135 | 曜日 |
○ | 136 | 祝日 |
X | 137 | 計上年 |
X | 138 | 免許の種類(第1当事者、第2当事者) |
X | 139 | 免許取経過年数(第1当事者、第2当事者) |
X | 140 | 交通違反回数(第1当事者、第2当事者) |
X | 141 | 交事故回数(第1当事者、第2当事者) |
X | 142 | 免許停止回数(第1当事者、第2当事者) |
X | 143 | 免許取消回数(第1当事者、第2当事者) |
X | 144 | 無事故.無違反期間(第1当事者、第2当事者) |
X | 145 | 優良・一般・違反の別(第1当事者、第2当事者) |
X | 146 | 認知機能検査経過日数(第1当事者、第2当事者) |
X | 147 | 認知機能検査果(第1当事者、第2当事者) |
X | 148 | 認知機能種別(第1当事者、第2当事者) |
X | 149 | 高齢者講習経過日数(第1当事者、第2当事者) |
X | 150 | 高者講習種類(第1当事者、第2当事者) |
X | 151 | 高者講習種別(第1当事者、第2当事者) |
X | 152 | 実車指導評価結果(第1当事者、第2当事者) |
X | 153 | 運転技能検査種類(第1当事者、第2当事者) |
X | 154 | 運転技能検査点数(第1当事者、第2当事者) |
X | 155 | 運転技能検査経過日数(第1当事者、第2当事者) |
X | 156 | 運転練習の方法(第1当事者、第2当事者) |