公共交通に関する情報をオープンデータとして公開しようと思いますが、セキュリティ面は大丈夫なのでしょうか。。
データ自体に機密情報が含まれていなければ問題ありません
オープンデータとは
最近、国や自治体が保有する統計データなどを、広く「オープンデータ」として公開し、自由に利活用してもらおうとする動きが進んでいます。また、公共交通の運行に関する情報(運行路線、系統、経路、時刻表、運賃など)についても、2012年のロンドンオリンピックの開催に合わせてロンドン市交通局のデータが公開されたあたりから世界的にオープンデータ化の動きが進んでおり、我が国でも、公共交通に関するデータが統一されたフォーマットで提供されるようになってきています。公共交通データをオープンデータとすることで、様々な関係者がそのデータを使って様々なアプリやWEBサイトを構築することができ、その情報が利用者にスムーズに伝わることで、さらなる公共交通の利用促進が期待できます。
オープンデータとは、デジタル庁から発表されている指針では以下のように定義されていています。
- 営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの
- 機械判読に適したもの
- 無償で利用できるもの
この中の機械判読については、同指針によるとCSVやXML等のフォーマットでの公開が原則と書かれていますが、これはデータの活用を意識した考え方です。データやファイルの種類によってはこれらの形式での用意が難しいこともありますが、その場合にもデータの活用を意識して、なるべく二次利用しやすい形で公開することが大切です。
具体的には、何かのPDFファイルを公開する場合でも、画像ではなく文字が読み取れる方式で公開することや、PDFファイルと一緒に元のWordファイルやExcelファイルを公開することも良いでしょう。上記で紹介したデジタル庁の指針もPowerPointファイル形式でそのまま公開もされているのが、正にその考え方ではないでしょうか。
データの活用という面では、データを使う人が安心して利用できるようデータの利用範囲をルールとして定めておく事も大切です。このルールの事を「ライセンス」と呼び、国際的な規格も有ります。この規格についてはこちらのページに解説がかかれていますので参考にしてみてください。また、機会がありましたら「公共交通トリセツ」でも解説をしたいと思いますので、皆様からのリクエストをお待ちしております。
オープンデータ化を進める上での誤解
公共交通のオープンデータに関する活動をしていると、市町村や交通事業者からデータを公開できない理由として、以下のような意見を耳にします。
- 特別なセキュリティ対策が必要で、お金がかかるのではないか?
- データが悪用される可能性があるのではないか?
- バスの運行に関する機密情報が、外部に漏れてしまうのではないか?
こういった問題のほとんどが誤解ですので、この機会に解説をしていきます。
特別なセキュリティ対策が必要で、お金がかかるのでは?
結論から申し上げると、オープンデータの公開に特別なセキュリティ対策は必要ありません。
個人情報や機密情報が入ったファイルをオープンデータとして公開すると「情報セキュリティ」という観点では大きな問題です。しかし、個人情報が含まれていないファイルを公開しても個人情報が流出することはありません。
「ファイルを公開する為には、サーバーに特別なセキュリティ対策が必要」という話をされる方もいますが、皆さんの所属する組織のホームページには、PDFファイルがダウンロード(DL)出来る形で置いてあったり、ホームページ上に画像が使われていないでしょうか?それらのファイルが差し替えられる「改ざん」と呼ばれる被害が出ていればセキュリティ対策は必要ですが、そうでなければ現状のセキュリティレベルでHP閲覧者がファイルをDLすることに問題はないので、新たに特別なセキュリティ対策をする必要はないでしょう。
気を付けておかなければならないこととして、自治体の担当者や交通事業者がホームページやサーバー等に関して知識がない事を逆手に取り、システム会社などが「オープンデータの公開にはセキュリティ対策が必要」とお金を請求してくるケースがあることです。その場合には「どういった理由で、どのようなセキュリティ対策が必要か?」という点について、詳しい説明を求めるようにしましょう。怪しい説明をされたり、過剰なセキュリティ対策に関する話をされた場合には「そのセキュリティ対策は不要です」と、お伝えください。
データが悪用される可能性があるのではないか?
「データの悪用」にあたるケースを考えてみましょう。
オープンデータとしてGTFSデータ等公共交通の運行に関わるデータが公開されると、公共交通のダイヤやバス停の位置などが(少し知識があるだけで)誰でもはっきりと分かるようになります。このこと自体を問題と捉える交通事業者もいるようですが、自社の輸送サービスの情報を分かりにくくしたまま放置している事の方が大問題です。バス停や運行時刻が分かりにくい状態のままで、使いたいと思う人が増えるでしょうか? 利用者に分かり易く情報提供を行う為の一つの手段としてオープンデータの活用を捉えるべきです。バス停やダイヤの情報がはっきりわかることは、データの悪用を招くものではなく、データの「善用」につながると言うべきでしょう。
バスの運行に関する機密情報が、外部に漏れてしまうのではないか?
GTFSデータでバスのダイヤを公開すると「1日に何名の運転手で業務を行っているか」などの機密情報が外部の会社にバレてしまうと警戒される事業者もいらっしゃいますが、こちらが機密情報にあたるかどうかは事業者により判断が異なるかと思います。運転手の業務に関する情報はGTFSデータには含まれていませんし、バスの時刻情報はGTFSデータが無くても利用者向けに公開されている情報であり、誰でも入手可能ですから、GTFSデータを公開しない理由にはなりません。
GTFSデータのような運行計画に関するデータではなく、利用実績データについてはどうでしょうか。ICカードなどのログデータにはカード保有者に関する情報が含まれている場合もありますから、公開する実績データの中に個人を特定できる情報が含まれていると犯罪などに悪用されるケースも考えられます。したがって、取得したままのログデータの中身を確認しないでそのまま公開することは絶対に避けるべきです。もし、公開する場合には情報は個人を特定できない形にしたり、公開したくない項目はあらかじめ削除するなどの加工をしてからデータを公開するようにしてください。オープンデータにするからといって、保有するあらゆるデータの全てを公開しなければいけないわけではなく、公開する側が公開するデータを選択し、適切な公開の範囲を定めることが大切です。
さいごに
バスを中心として公共交通のオープンデータは全国で普及し始めていますが、データを活用する立場から見ると、地域を運行する公共交通機関のデータが網羅的に揃っていなければ、カバーできる移動手段が実勢とあっておらず抜け落ちが生じてしまうことから、その地域をカバーするアプリやサービスが作りにくい状況となります。また、飲食店やお買い物情報、チェックイン機能でポイントが溜まるサービスなど他分野のサービスと公共交通を組み合わせたアプリ等を検討する際も、地域内のデータが網羅されていない為に中途半端な連携になったり、そもそも公共交通機関に関する機能が外されてしまうなどのケースも存在します。
1つの公共交通事業者だけが情報発信に努めたところで、その効果には限界があります。地域を運行する他の交通事業者も巻き込み、地域一体でオープンデータ化を進めることで、地域のデータを地域の資産として活用したサービスを検討していただければと思います。