川の流れのようなチラシの裏
にちゃんねるのこと、パソコンのこと、プログラミングのこと、(・∀・)mmo!のこと、、、、などなど。 日記みたいに書くこともあるし、思ったことをいきなり書くこともある。
201705<<123456789101112131415161718192021222324252627282930>>201707
スポンサー広告スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
--/--/--(--) --:--:--| スポンサー広告| トラックバック(-) コメント(-)
パソコン - 総合Unicodeに対応してないフリーソフト多すぎ

Windows2000から(?)、OSがUnicodeベースになりました。これを知って、フォントさえあればどんな文字(「どんな」は御幣あるけど。)でも表示できるし、フォントがなくても画面上で文字化けするだけで済む、こういう世界だとパソコンを買う前は思ってました。しかしそうはいかないようですね。

文字コードについて単純化して簡単に説明します。

パソコンで、全世界のどのパソコンでも使える文字の集合がありました。ASCIIコードです。単純に言うと、ABCなどの半角のアルファベットや.,;:@などの半角の記号です。ここに全ASCII文字列の紹介があります。全世界で使えるので、URLやメールアドレス、HTMLのタグ、各種プログラム言語、さまざまなプログラムのファイル名・フォルダ名、などなどで広く使われています。

しかしASCIIだけだとアルファベットしか使えないので、国・地域・文化ごとに文字コードが生まれました。日本で言えばJIS、シフトJIS、EUC-jpですね。生まれた文字コードはたぶん全てがASCIIコードを含む形で作られています。日本で作られたテキストファイルでも、基本的にASCIIコードの文字だけは世界のどのパソコンでも読むことが出来ます。

そしてUnicodeが作られました。簡単に言うと、Unicodeは全世界の文字をひとつの文字コードで表すための新しい文字コードです。アラビア文字と漢字を混在させることなども可能です。

現在の多くのOSは、Unicode対応です。Unicode対応とは、たとえばファイル名・フォルダ名を内部でUnicodeで扱っていたりとか。
OSだけではなく、ソフトウェアのUnicode対応も非常に重要です。例えば、Windows2000以降?についているメモ帳はUnicode対応です。
メモ帳はUnicode対応
文字が重要なフリーソフト(テキストエディタなど)では、Unicode対応と謳っているものが多いです。しか私に言わせると、真にUnicode対応なソフトのほうが少ないですね。

真にUnicode対応のソフトとそうではないソフトの違い、それは内部処理です。エセUnicode対応のソフトは、Unicodeで保存されたファイルは開けるんだけど、(日本語Windowsの場合)シフトJISに内部で変換しているんです。シフトJISには含まれないがUnicodeに含まれる文字は、なんらかの形で切り落とされてしまいます、こんな感じで。このソフトはK2Editorというソフトです。
K2Editorの場合
きちんとUnicodeに対応しているアプリかどうかを確かめるには、メモ帳などきちんとしたUnicode対応アプリでシフトJISにない文字を使って作ったテキストファイルを、テストしたいアプリで開いてみることでそのアプリが真にUnicode対応かどうかが分かります。

そして、文字が重要ではないソフトにも、実はUnicode対応と非対応があります。これは意外と知られていません。
シフトJISにない文字をファイル名に含むファイル
こんな感じで、Unicodeに含まれてシフトJISに含まれない文字をファイル名に使ってみます(この場合áがシフトJISに存在しない)。このファイルを適当なソフト(ファイル名が重要なので、mp3でなくてもよい。)で開いてみよう。
strling 開けない

kbMediaPlayer 開けない
あれ、ファイルが開けません。ファイルパスに含まれるシフトJIS外の文字は強制的に変更されてソフト渡され、ソフト側はそのファイルパスでWindowsにファイルオープンを求める、と。んでWindowsは「そんなファイルはないぞ」と。ソフトは「そんなファイルないってさ」と。
具体的な名前を出して2つソフトを挙げてしまいました。ターゲットになったソフトの作者さんすみません。ぶっちゃけ、開けないフリーソフトのほうが多いですね。

そんな文字を使う場合は限られている、そんな細かいことでソフトのよしあしをきめるな、そんな声が聞こえてきます。まあ一般的には正しいですね。が、私の場合は結構重要だったりします。
私は Ricky Martin という歌手が好きです。彼はスペイン語圏で、曲名もスペイン語が使われることがあります。スペイン語には、アクセント記号つきアルファベットがあります。上で挙げたファイルも Ricky Martin の曲です。やっぱファイル名は正しく付けたいじゃん。わがままかな。それ以外で使うことはあんまりないけど「使えるけど使わない」と「使えないから使わない」では結構違うと感じます。
というわけで、unicode対応ソフトが増えてくれることを願います。

追記・修正 2005/6/20

スポンサーサイト
コメント
この記事へのコメント
web開発でも文字コードの問題は切っても切れない関係。

http://d.hatena.ne.jp/huixing/20050601
docomoの顔文字がUTF-8の普及の阻害になっているという話。

基本的にwebアプリケーションで日本語を扱う場合は開発はEUC-JPで統一になるので
SJISしかダメな携帯コンテンツは色々面倒な事が多い。

別の国の人まで対応した大規模なサイト制作でもない限り、
まだまだUTFベースでwebアプリケーションを開発することはなさそう。
2005/06/18(土) 23:58:24 | URL | マナ #-[ 編集]
コメントを投稿する
管理者にだけ表示を許可する
トラックバック
この記事のトラックバックURL
この記事へのトラックバック
copyright © 2004 Powered By FC2 allrights reserved
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。