文字コードと改行コード
現在、日本語を表す文字コードとしては、"JIS", "S-JIS", "EUC-jp", "Unicode"などが使用されています。また、改行コードとしては"CR(キャリッジリターン)", "LF (ラインフィード)", "CR-LF"が使用されています。
一般的なOSで作成されるテキストファイルの文字コードと改行コードは、下記の通りです。
- MacOS - S-JIS, CR
- Windows - S-JIS, CR-LF
- Unix - EUC-jp, LF
- BeOS - Unicode(UTF-8), LF
BeOSではUnicodeにより日本語を含む複数の言語を扱うことができますが、文字コードの相違によりMacOSやWindows系のOSで作成されたテキストファイルを直接読み込むことはできません。テキストファイルの文字コード変換にはコマンドラインで「xtou」を使用するか、StyledEditのファイル選択ウィンドウで文字コードを選択した後にファイルを開く必要がありますが、これにはもとの文字コードを知っておく必要があります。
KEditは上記の4つの文字コードと改行コードを自動判別し、Unicode(UTF-8)として表示・編集・保存することができます。ただし、文字コードの性質上、自動判定は不確実であり、特に日本語部分の少ないテキストファイルでは判定不能となることがしばしばあります。判定不能の場合は、上記のOSの対応表からテキストファイルの文字コードを予測し、xtou等の文字コード変換ユーティリティで適切なコードに変換した後、KEditで開いて下さい。
インデックスに戻る
この文書に関するお問い合わせはkarino@drycarbon.comまで。