2014年5月17日土曜日

姓名漢字とコンピューター漢字の関係

2014/5/17
書斎、宛名印刷、漢字、戸籍統一漢字、コンピューター漢字

年賀状の宛名印刷において、姓名には難しい漢字がある。
たとえば、浜田太郎の場合。浜の漢字にはいろいろある。
浜田
濱田
濵田

そこで、名前の漢字とコンピュータで表示できる漢字との関係を調査した。

戸籍に使える姓には、戸籍統一文字に登録されている漢字が使用できる。
法務省戸籍統一文字情報に詳細情報がある。約5万6千字あり一番大きい領域です。
kosekimoji.moj.go.jp/

住民登録で使用する、住民基本台帳ネットワーク統一文字は約2万字で戸籍統一文字との番号互換性はない。

一方コンピューターで出力できる漢字には制限がある。
以下のJIS第一水準から第四水準、補助漢字、Unicodeをすべて加えたとしても戸籍統一文字に満たない。
JIS X 0208の第一水準、第二水準、6,879文字。
JIS X 0208で定められている包摂基準では同一の漢字として取り扱われる一点しんにょうと二点しんにょうを明確に区別する必要がある[7]など、
JIS X 0213(第三水準、第四水準)11,233文字。
JIS X 0212(補助漢字)、6,067文字を使用可能な文字に加えても、
JIS X 0221Unicode)96,447文字を使用したとしても戸籍文字に必要な条件を満たすことは出来ない。
かつコンピューターのOSにより、出力できる漢字に制限がある、また環境依存文字が存在する。
Windowsでは、JIS基本漢字(JIS X 0208)コードの保留領域である09区~15区および85区~94区の一部、ならびに、JIS漢字の範囲外である95区~114区の一部に、機種依存文字を配置しています。これらの文字は、このままインターネットで使用してはいけませんが、Unicodeに含まれていれば、文字参照を用いて記述できます。

PC上で文字が表示されるには次の3つが必要です。
・Windows自体の対応

Windows2000からすでにJIS第3第4水準の文字(を含むUnicode1面以上)に対応済みです。(ただし設定不要になったのはXPから)
・ソフトの対応

Unicodeに対応していても1面以上に非対応のソフトがあります。
・フォントの対応

MSゴシック・MS明朝がJIS第3第4水準の文字に対応したのはWindowsVistaからです。
結論windowsのXP以上なら、MS明朝フォントでほとんどの漢字が表示できる。

ウェブフォーム入力やメール等外部とやり取りする場合は、機種依存文字を使用しないこと。
旧漢字・異形字の一部はフォームからの送信メールでは文字化けします。この原因は、フォームから送信されるメールでは、仕様としてJIS第一水準の漢字(常用漢字2965文字)しか扱えないからです。ですから、画面上では正しく表示されていても、機種依存文字をフォームへ入力すると、送信される段階で文字化けします。
よくある文字化け例、旧漢字が文字化け
文字コード        備考
髙橋 {・エ 髙→「967E」 いわゆる「はしごだか」通常は高。
山﨑 山zア 﨑→「9433」 いわゆる「たちざき」通常は崎。
濵野 {M野 濵→「952E」 いわゆる「まゆはま」通常は濱。
濵【952E】と濱【5F40】は違います。濱野なら文字化けせずに送信可能。

具体例では、
「はまだ」の「はま」で戸籍に使える漢字は、以下の5種類ある。
浜 戸籍統一文字コード 197181、JIS水準 1、Unicode 6D5C、子の名に使える文字、常用漢字
濱 戸籍統一文字コード 208950、JIS水準 2、Unicode 6FF1親字は「浜」
濵 戸籍統一文字コード 208960、JIS水準 3、Unicode 6FF5親字は「浜」
「 」戸籍統一文字コード 210040、JIS水準  、Unicode     親字は「浜」
「 」戸籍統一文字コード 197090、JIS水準  、Unicode     親字は「なし」

果一覧
トップ > 文字検索 > 一覧
検索条件
読みはま
読み条件
画数
部首
種類
JIS水準
文字コード
検索結果
5件中1-5件目を表示

197090

197180

208950

208960

210040
← 検索条件入力に戻る

0 件のコメント: