参考資料
改行コードに関する技術情報と参考文献
改行コードの歴史
改行コードの起源は19世紀のタイプライターに遡ります。キャリッジリターン(CR)は紙を元の位置に戻す操作、ラインフィード(LF)は紙を1行上げる操作を表していました。コンピュータのテキスト処理では、これらの制御文字がそのまま改行の表現として採用され、現在に至るまで基本構造は変わっていません。
ASCII制御文字
改行コードに使われるCR(0x0D)とLF(0x00A)は、ASCII文字コードに含まれる制御文字です。ASCIIは1963年に策定された文字コード規格で、128の文字を定義しています。この中には制御文字が32個含まれており、CRとLFはその代表的なものとして現在も広く使われています。
Unicodeとの関係
UnicodeではCRとLFは制御文字ブロックに収録されています。LFはU+000A、CRはU+000Dとして定義されており、あらゆるプラットフォームで同じコードポイントを持ちます。改行コードの違いは文字コードの問題ではなく、テキストファイルの改行表現方法の違いであるという点が重要です。
関連する技術標準
改行コードに関する技術情報は、UnicodeコンソーシウムやIETFのRFCで定義されています。特にRFC 2046(MIME)では、テキストデータの改行コード処理に関するガイドラインが定められています。これらの規格を理解することで、改行コードの基本的な仕組みと、なぜプラットフォームごとに異なるのかを深く理解できます。
改行コードを変換しませんか?
改行コード変換ツールで変換する