テキストエンコーディング・改行コード
テキストエンコーディング・改行コード
テキストエンコーディング・改行コードは、テキストをファイルに保存するときのデータ形式です。
現在では、テキストエンコーディングはUTF-8、改行コードはLF(Windowsの場合はCR+LF)が主流です。
- テキストエンコーディングは、ツールバーのボタン、または、メニューからで選択できます。
- 改行コードは、ツールバーのボタン、または、メニューからで選択できます。
- 新規ドキュメントのデフォルトは、モード設定→「編集」タブにて設定できます。
ファイルを開くときのテキストエンコーディング・改行コードの認識
ファイルを開くとき、テキストエンコーディング・改行コードは自動認識されます。
テキストエンコーディングを認識できない場合や、エラー文字があった場合、「テキストエンコーディング選択ダイアログ」が表示されます。正しいテキストエンコーディングを選択してOKボタンを押してください。
手動でメニューからを選択して、「テキストエンコーディング選択ダイアログ」を表示することもできます。文字化けして表示された場合などは、を選択してください。(ただし、編集を行う前のみ可能です。)
- ダイアログを閉じた後でも、編集前であれば、メニューからを選択することで、テキストエンコーディングを選択し直すことができます。
- いずれの選択をした場合でも、ドキュメントを保存せず閉じれば、ファイルは元のままのデータが維持されます。
- ダイアログの「エラー文字一覧」ボタンを押すと、エラー文字の一覧を表示できます。
また、ダイアログを閉じた後でも、メニューからを選択することで、同様の一覧を表示できます。 - UTF-8を選択した場合で、一部にUTF-8として正しくない文字(バイト)がある場合は、その旨表示され、UTF-8 として正しくない文字を「?」(U+003F)に変換するかどうかのチェックボックスが表示されます。エラー文字一覧には、そのバイトのHEXコードが表示されます。UTF-8として正しいかどうかはRFC3629規格に基づいています。
なお、ツールバーのボタンや、メニューのは、保存時にどのテキストエンコーディングで保存するかを選択するためのメニューです。これらを選択しても、選択したテキストエンコーディングでファイルを再読み込みすることはできません。
既存ファイルのテキストエンコーディングの判定方法
ファイルを開くと、テキストエンコーディングは次の優先順位で判定されます。
- 前回そのファイルをmiで保存したときのテキストエンコーディング
- テキストの内容に基づいて判定(charset指定や、各テキストエンコーディングの特徴に従った判定)
- モード設定「編集」タブで指定した、デフォルトのテキストエンコーディング
- UTF-8
上記のいずれのテキストエンコーディングでもエラーが発生する場合は、ひとまずUTF-8が選択され、テキストエンコーディング選択ダイアログが表示されます。
アプリケーション設定「テキスト」タブの「エラー文字があっても指定されたテキストエンコーディングで開く(フォールバック)」がONの場合は、一部にエラー文字があっても、エラー文字を変換して開きます。
この場合も、「エラー文字があった場合はダイアログを表示する」がONであれば、テキストエンコーディング選択ダイアログが表示されます。