まとめ
- 国、都道府県、市町村といった全ての地方自治体が統一されたフォーマットや粒度でデータを提供することが求められます
- オープンデータを活用したアプリケーションの公開やBIツールでの可視化のメリットを広く普及させる必要があります
- オープンデータを通じて相互補助の概念が広まることが望まれます
東京都オープンデータコミュニティ
私が今回のイベントに参加した理由は、最近Tokyo Innovation Baseのイベントに参加する機会があり、その際に本イベントの情報を目にしたためです。また、以前e-Statを利用した際にいくつかの意見を持ったことから、それについて話し合う機会になればと考えました。
イベントでは5名の登壇者がオープンデータに関連した活動を共有し、パネルディスカッションやQ&Aセッションが行われました。その後の懇親会では、オープンデータに関する課題について活発な議論が交わされましたので、ここでまとめてみたいと思います。
課題感
今回の登壇された方ほぼ全員が指摘していたのが、データの取り扱いに関してでした。
これに関しては私も課題感を持っており、QAセッションにて質問もさせていただきました。
データ形式について
現在提供されているオープンデータの多くはCSVやExcel形式で数値データが提供されていますが、エンジニアやデータサイエンティストにとって扱いにくいケースが多々あります。例えば、日付と人口のデータを扱う際、Excelなどでグラフ化しやすいように日付を列として提供すればよいにも関わらず、行として提供されるデータが未だに見受けられます。
データの質について
オープンデータカタログで特定のキーワードで検索すると、複数の選択肢が出てくることが多く、それらを手作業で精査するのは非常に時間がかかります。また、データがどのように取得されたのかといったメタ情報が不足しているケースも散見されます。地方自治体の情報のフォーマットが統一されておらず、また法改正やデータ取得方法の変更により時系列データの中に外れ値が生じることがあります。こうした背景情報が提供されていないため、データの分析に多大な時間がかかることが問題視されます。最近ではOpen
データの提供方法に関して
私自身は主にe-Statを利用していますが、他の地方自治体のデータ提供方法については詳しくありません。少なくともe-Statに関しては、CSV/Excel形式やAPIを経由してデータを取得することが可能です。しかし、APIの仕様がe-Stat独自の形式であり、OpenAPIなど業界標準の形式で提供されていないため、利用しにくいのが現状です。また、提供されるデータの品質も上述した課題を抱えており、そのまま活用できるケースは少ないと感じています。データがJSON形式で提供されれば、より効率的に加工・利用できるのではないでしょうか。
最後に
懇親会での議論の中で、オープンデータ活用の根本的な課題として、地方自治体が情報提供に積極的でないこと、また職員がデータの有用性を十分に認識していないことが挙げられました。解決策として、地方自治体がデータの積極的な活用を推進するために、データサイエンティストの採用やデータ分析基盤の構築を進めることが求められます。これにより、自治体と民間の双方が恩恵を受けられる環境を整えることができるのではないでしょうか。