全角半角変換のリファレンスとして、主要な文字のUnicode対応表をまとめています。全角英字のUnicode範囲はU+FF21からU+FF3A(大文字)およびU+FF41からU+FF5A(小文字)であり、対応する半角英字はU+0041からU+005AおよびU+0061からU+007Aとなります。全角数字はU+FF10からU+FF19、半角数字はU+0030からU+0039です。この基本情報を覚えておくと、変換ロジックの理解が深まります。
主要な変換対象文字
カタカナの全角範囲はU+30A1からU+30F6で、半角カタカナはU+FF65からU+FF9Fです。全角カタカナには濁音・半濁音が含まれますが、半角カタカナでは濁点が独立した文字として表現されます。記号類では、全角の「、」(U+3001)は半角の「,」(U+002C)に、「。」(U+3002)は「.」(U+002E)に変換されます。また、全角の「(」(U+FF08)は半角の「(」(U+0028)に変換されます。
実際の変換処理においては、これらのUnicodeコードポイントの差分を計算して変換を行います。全角から半角への変換では、対応する半角コードポイントとの差分を引くことで変換が完了します。ただし、全ての全角文字に半角対応があるわけではなく、変換不能な文字はそのまま保持されます。このリファレンス情報は、変換ツールの動作原理を理解し、正確なデータ処理を行うための基礎知識として活用してください。