セムカンでは、議会の皆様がご自身の手でデータを自由に扱えるよう、ベンダーロックイン(特定のシステムに依存して抜け出せなくなる状態)を避ける設計を重視しています。その一環として、登録された政務活動費の情報をCSV形式でエクスポートできる機能をご提供しています。
しかし最近、「CSVをダウンロードしてExcelで開いたら文字化けしてしまった」というお問い合わせがいくつか寄せられるようになりました。今回はその原因と、セムカンがどうしてこのような仕様を採っているのか、背景とあわせてお伝えします。
セムカンでは、CSVをShift_JIS形式で出力することも技術的には可能です。しかし、あえてそうしていないのには理由があります。
Shift_JISは日本独自の文字コードであり、扱える文字が限られているうえに、環境によって表示が不安定になることがあります。たとえば、「髙(はしごだか)」や「𠮷(つちよし)」などの文字が文字化けする、あるいは開けない、といった問題が発生する可能性があります。
また、政務活動費の情報は、議会だけでなく市民や外部の第三者とも共有される可能性があります。その際、UTF-8のような国際的に通用する標準形式であることが、将来的な可搬性や再利用性を高めると考えています。
もちろん、「とにかくExcelで開ければいいからShift_JISで出してほしい」というご要望もあるかもしれません。しかし、私たちセムカンは、将来にわたって持続可能で透明性のある情報公開を支えるために、「その場限りの対応」ではなく、「本質的な対応」を重視しています。
仮にShift_JISで出力して問題が解消したとしても、他のシステムとの連携、MacユーザーやGoogleスプレッドシート利用者での不具合など、新たな問題が発生するリスクがあります。
私たちは、その都度の環境に合わせて形式を変えるのではなく、普遍的に信頼される形式(UTF-8)を貫き、運用側での対応方法を丁寧にご案内することが、長期的には皆様の負担を軽減することにつながると信じています。
文字化けを回避するためには、ExcelでCSVファイルを開く際に以下の手順をお試しください。
この方法を用いることで、セムカンから出力したCSVを正しく表示することができます。
また、事務局内でよく使うパソコンが固定されている場合は、この手順をマニュアル化しておくと便利です。
セムカンは、単にデータを見せるだけでなく、「使えるかたちで公開する」ことを目指しています。文字コードの選択一つをとっても、私たちは長期的な視点に立ち、将来の市民・議会・第三者の利用にとって最も良いかたちを追求しています。
今回のように一見すると不便に思える場面でも、そこにある意図や背景を共有することで、議会の皆様とともにより良い情報公開を“育てていける”と信じています。
引き続き、皆様のご理解とご協力をお願いいたします。