なんそ、この文字コードは・・・orz
- カテゴリ:パソコン/インターネット
- 2011/01/28 01:27:44
今日、お仕事で妙な文字コードのファイルに出くわした。
一見、シフトJISっぽいんだけれど、本来、文字の割り当てられていないはずの領域に
文字が割り当てられていて、そのおかげで、別の文字コードに変換しようとしても、途中で
エラー終了してしまうという自体に・・・・orz。
ダメもとで、シフトJISX0213を指定したら、なんとかUTF8に変換できたはいいものの、
変換結果を見ると、なにやら発音記号のような文字が・・・・。データの内容からすると、
間違ってもそんな文字が入っているはずのないファイルなのだけれどねぇ~。
いろいろ調べた感じからすると、原因となっている文字の一つは「㈱」の文字らしいことが
わかったけれど、なんでそんな通常の割り当て領域とは違う所に割り当てられているのか
が謎。
・・・データの出処からすると、汎用機のコード系じゃないかという気もするのだけれど、
もしかすると、まだ、整理される前のメーカーによってバラバラだった時代のシフトJISの
どれかかもしれないのだが・・・・。
いずれにしても、うちにはそんな変なコードからの変換ツールなんかないぞ、一体どう
してくれようか・・・orz。
nkfでもダメですか?