文章がおかしな文字で埋められている

友人から来たメールや、NetNews に投稿された文字がおかしくなっていて読めないということはないでしょうか。ここではこうした『文字化け』している文章を読めるようにする方法を書きます。

まず、その文字化けした文章はファイルにしてください。文字化けをおこしているファイル名を仮に test.txt として話をすすめています。


目次


less

lessはファイルを表示させるツールです。単純に
% less test.txt
としてみてください。

スペースで次へスクロールし、バックスペースで前に戻ります。q で less を終了させることができます。


nkf

nkfは漢字コードの変換などをしてくれます。

DOSやMac、Windows上で作った文章の多くはsjisです。この文章をUNIXにもってくると文字が化けます。これは、UNIXの漢字コードが EUC のためです。

% nkf -de test.txt
とすれば読めるようになると思います。結果を画面ではなく、ファイルに保存したいのであれば
% nkf -de test.txt > test2.txt
としてください。これで test2.txt に結果が保存されます。

nkfはほかにも MIME の解読ができます。メールのサブジェクトなどが『=?ISO-2022-JP?』ではじまるものなどが解読できます。

^D は Ctrl を押しながら d を押すという意味です。

% nkf -m
^D
ほかにも MIME base64 stream や MIME quoted stream も解読することができる。

rjis

NetNewsで多く見られるのが MSB 落ちや ESC 落ちである。rjisはこれらのファイルを復元してくれます。

これには3つのパターンが考えられます。慣れればすぐどのツールを使えばいいのか分るのですが、分からないうちは下のツールを順番に使って復元できるまでやってみてください。

% rjis test.txt
% rujis test.txt
% rejis test.txt
同時に後に | less をつけるとよい場合もあります。
% rjis test.txt | less
結果をファイルに保存がしたいのであれば
% rjis test.txt > test2.txt
としてください。

以上の方法で読むことができない

恐らくその文章は複数の漢字コードが混在している文章だと思います。残念ながらそれを復元する方法を私は知りません。
ONLINE MANUAL
webadmin@hokusei.ac.jp