1999.10.4

半角カタカナ

 2000年問題で騒いでいる世間であるが、僕は日本の「データベース」を使用している業界で、もう1つの問題を考えている。

 それは、半角カタカナを使用しているデータベースである。

 現在の金融業界を含む顧客データベースを使用しているところでは、ほとんどのふりがながカタカナである。それも半角カタカナで格納している所が多い。中には、ふりがなしかデータベース上には無い所もある。紙の書類ではどちらも記載されているのだが、コンピューター上ではふりがなしかないということだ。
 インターネットが流行りだしてからは、全角カタカナを使用する所も多くなったようだが、やはり主流は半角カタカナである。
 元々、全角表示ができない端末を使用している所が多かったのが原因だが、日本独自のデータベースが少なかったのも原因の1つである。
 JISや S-JISや EUC等の全角を表示する規格が浸透(もしくは存在)していなかったのだ。日本で作られたデータベースならともかく、アルファベット圏の場合、1バイト文字(半角)で、すべてのものを表すことができる。まだ中国も発展途上でコンピューターの利用率も低かった。日本のためだけに2バイト仕様に拡張するのでは費用がかかりすぎ利益が出ない。
 そのため、簡単に拡張できた半角カタカナが使用されていた。半角カタカナの場合、1バイトで1文字になっているので、通常のバイナリーデータが格納できるデータベースなら表示は別にして根本的な変更が必要なかったからだ。
 また、ひらがなや漢字を表現する場合、2バイト必要になる。簡単に考えても半角カタカナの2倍必要なのだ。これも西暦4桁を2桁しか持っていない理由と同じで、記憶容量の節約が考えられる。昔のコンピューターも記憶容量が貧弱で処理できなかった。

 膨大な顧客データベースを持っている企業は、すぐには全角のふりがなや漢字を使用することはできない。顧客データベースは全て入力しなければ意味がないので、最終的に全てを入力するための手間(費用)は膨大になる。

 まあ、ふりがなだけなら、全て自動的に変換できるので、手間は少なくてすむだろう。たぶんほとんどの企業はふりがなだけは処理しているか、する予定であると思う。

 あと、世界的な展開をしている多国籍企業、もしくは海外の企業の日本法人などの場合は、困っているに違いない。アルファベット圏のデータは全てアルファベットだけですむので1バイトデータの方が効率がいいし、昔からのデータベースを全て変更するのも非常に手間なので、アルファベット(1バイトデータ)しか扱えないシステムがほとんどであろう。元々アルファベットのみしか扱えないシステムでも、1バイトの 0x00〜0xFFまでのデータを扱えるようにするのはそう難しいことではない。1バイト 256分を扱えるようにすれば半角カタカナは使用できる。これを2バイトデータを扱えるようにするのは非常に手間である。データ自体を修正するのは簡単だが、表示端末を変更するのが大変なのだ。全ての表示端末を変更しなければ2バイトデータを表示することができない。1バイトデータなら最悪表示が乱れる程度ですむだろう。

 以上、簡単だが、今後の情勢では発生するであろう、ただし世間的(マスコミ等)にはあまり問題視されないであろう問題を書いてみた。