幽霊の正体見たり・・・!?
2026年03月08日
日本語の「書き文字」は、漢字、ひらがな、カタカナの3種類を組み合わせ、縦書きと横書きの双方で表現される独自性の高い体系で、無限の組み合わせで得られる語彙は細かなニュアンスまでも写し出し、特に漢字は単体で意味を成すことが可能な書き文字の根幹となる文字であります。
漢字が日本に伝来し定着しだしたのは、遥か昔の4世紀末~5世紀初め(西暦約400年後半から500年前半頃)と言われています。
漢字はその数を増やしていき、現在常用漢字2136文字+人名漢字863文字の約3000文字が基本漢字として生活のあらゆる場所、ものに定着しています。
更に水準別に細分化されており最大級の漢字辞典においてはその数18万字以上ともされています。
実際は生きているうちに目にする漢字は専門職でない限り常用漢字だけだと思います。
しかし、日本の漢字の中には実は典拠不明の漢字というものが密かに存在します。
1978年に制定されたJIS基本漢字には、当時は典拠(どの資料から採ったか)が明示されていませんでした。
その後、1997年の改定時に全漢字の出典調査が行われたところ、
「規格に入っているのに、元の資料が確認できない」
「誤写の可能性が高い」
「原典がすでに存在しない」
という漢字が見つかりました。
そのうち、最終的に“典拠不明”として残った12字が、いわゆる
《幽霊12文字》と呼ばれる漢字です。

以下、タイプ別に整理します。

1,誤写疑惑型(写し間違いの可能性)

「躇」の誤写説が有力。

「廛」や「㕓」系の崩れた写し。

本来は「栩(とち)」系を木偏→手偏に誤写。

「杲」などの誤写説。

「橳(ぬで)」や「棬」周辺の誤写。

「橦」などの誤写説。

地名「祢」を衣偏に誤写。

「閏(うるう)」の王と玉の取り違え。
このタイプの共通点は
地名・人名資料から採字、
手書き資料を版下にした、
偏や旁が崩れて読めなかった、
写植工程で別字に見えた、
つまり、「人間の目と手」が作った幽霊なんですね。
2,原典消失型(追跡不能タイプ)

滋賀県の地名資料由来とされるが、元資料確認不能。

保険会社系漢字コード表由来とされるが原本未確認。

日本生命の人名漢字表が原典とされるが現存せず。
このタイプの特徴は
「どこから来たか」は記録にある、
しかし元資料がすでに消失、
実物確認ができない、
まさに失われた書類の亡霊です。
3,完全不明型(真の幽霊)

対応分析結果に存在せず、
元資料も発見できず、
明確な誤写元も特定不能、
12字の中で最も“幽霊”らしい存在。
「彊」などの誤写説はあるものの、確証なし。
現在も「なぜ収録されたのか分からない」唯一の字とされています。
なぜこんなことが起きたのでしょうか・・・
1978年当時は手作業の字形管理、コンピュータ黎明期、典拠明示の義務なし、民間企業の人名コード流用という背景がありました。
今のUnicodeの厳密管理からは考えられないほど、アナログな世界だったのです。
では、幽霊文字は本当に「存在しない」のか?
面白いことに、多くの幽霊文字は中国古字書や仏典などに偶然同形の字が見つかっています。
これを「暗合(あんごう)」と呼びます。
つまり、JISに入った理由は不明ですが、しかしどこかには似た字が存在するという不思議な現象が起きています。
幽霊文字は単なる「誤字」ではありません。
それは文字行政の歴史、手書き文化の名残、そして日本の情報化初期の混沌を映す存在なのですね。
幽霊文字とは、結局のところ『幽霊の正体見たり枯れ尾花』的な感じ(漢字)だと思います。
調べてみれば多くは人的ミス。
だが一度規格に刻まれれば、それは正式な一字となる。
怖さはない。
ただ、文字と人間の関係の不完全さが、少しだけ面白い。
でも・・・これを現代の人間✕AIに置き換えると・・・笑えない。
幽霊文字は、人的ミスの産物だったけど現代のそして未来のAIの時代には、誤りはより自然に処理され、より大量に発信され、より速く世界中に広がる。
問題は技術ではなく、それをどう管理するかという人間の側にあるのではないか。
幽霊を作るのも、見破るのも、結局は人間なのです・・・。
《タカダ》
漢字が日本に伝来し定着しだしたのは、遥か昔の4世紀末~5世紀初め(西暦約400年後半から500年前半頃)と言われています。
漢字はその数を増やしていき、現在常用漢字2136文字+人名漢字863文字の約3000文字が基本漢字として生活のあらゆる場所、ものに定着しています。
更に水準別に細分化されており最大級の漢字辞典においてはその数18万字以上ともされています。
実際は生きているうちに目にする漢字は専門職でない限り常用漢字だけだと思います。
しかし、日本の漢字の中には実は典拠不明の漢字というものが密かに存在します。
1978年に制定されたJIS基本漢字には、当時は典拠(どの資料から採ったか)が明示されていませんでした。
その後、1997年の改定時に全漢字の出典調査が行われたところ、
「規格に入っているのに、元の資料が確認できない」
「誤写の可能性が高い」
「原典がすでに存在しない」
という漢字が見つかりました。
そのうち、最終的に“典拠不明”として残った12字が、いわゆる
《幽霊12文字》と呼ばれる漢字です。

以下、タイプ別に整理します。

1,誤写疑惑型(写し間違いの可能性)

「躇」の誤写説が有力。

「廛」や「㕓」系の崩れた写し。

本来は「栩(とち)」系を木偏→手偏に誤写。

「杲」などの誤写説。

「橳(ぬで)」や「棬」周辺の誤写。

「橦」などの誤写説。

地名「祢」を衣偏に誤写。

「閏(うるう)」の王と玉の取り違え。
このタイプの共通点は
地名・人名資料から採字、
手書き資料を版下にした、
偏や旁が崩れて読めなかった、
写植工程で別字に見えた、
つまり、「人間の目と手」が作った幽霊なんですね。
2,原典消失型(追跡不能タイプ)

滋賀県の地名資料由来とされるが、元資料確認不能。

保険会社系漢字コード表由来とされるが原本未確認。

日本生命の人名漢字表が原典とされるが現存せず。
このタイプの特徴は
「どこから来たか」は記録にある、
しかし元資料がすでに消失、
実物確認ができない、
まさに失われた書類の亡霊です。
3,完全不明型(真の幽霊)

対応分析結果に存在せず、
元資料も発見できず、
明確な誤写元も特定不能、
12字の中で最も“幽霊”らしい存在。
「彊」などの誤写説はあるものの、確証なし。
現在も「なぜ収録されたのか分からない」唯一の字とされています。
なぜこんなことが起きたのでしょうか・・・
1978年当時は手作業の字形管理、コンピュータ黎明期、典拠明示の義務なし、民間企業の人名コード流用という背景がありました。
今のUnicodeの厳密管理からは考えられないほど、アナログな世界だったのです。
では、幽霊文字は本当に「存在しない」のか?
面白いことに、多くの幽霊文字は中国古字書や仏典などに偶然同形の字が見つかっています。
これを「暗合(あんごう)」と呼びます。
つまり、JISに入った理由は不明ですが、しかしどこかには似た字が存在するという不思議な現象が起きています。
幽霊文字は単なる「誤字」ではありません。
それは文字行政の歴史、手書き文化の名残、そして日本の情報化初期の混沌を映す存在なのですね。
幽霊文字とは、結局のところ『幽霊の正体見たり枯れ尾花』的な感じ(漢字)だと思います。
調べてみれば多くは人的ミス。
だが一度規格に刻まれれば、それは正式な一字となる。
怖さはない。
ただ、文字と人間の関係の不完全さが、少しだけ面白い。
でも・・・これを現代の人間✕AIに置き換えると・・・笑えない。
幽霊文字は、人的ミスの産物だったけど現代のそして未来のAIの時代には、誤りはより自然に処理され、より大量に発信され、より速く世界中に広がる。
問題は技術ではなく、それをどう管理するかという人間の側にあるのではないか。
幽霊を作るのも、見破るのも、結局は人間なのです・・・。
《タカダ》

コメント一覧