Apple macOSの文字コード「UTF-8-Mac (NFD)」に起因する濁音・半濁音の非常に厄介な問題。ファイル名テキストのコピペ活用時、見分けがつかない欠陥的な落とし穴

Apple MacBook、つまりmacOSで、例えば「ウグイス」と名付けたファイル名をコピーしてGoogleドキュメントやスプレッドシートにペーストするとします。一見、問題なく「ウグイス」というカタカナ4文字がペーストされたように見えますが、実際は「グ」が1文字ではなく「ク」と「゛」から構成された文字になっています。濁点が別なのです。

 ご存じですか?

 Googleドキュメント上などでバックスペースキーを使って消していくと分かりやすいです。後ろから「ス」「イ」は1文字として消えますが、「グ」については、まず「゛」が消え、その後、見た目としては「ク」になり、もう1回バックスペースを押すと「ク」が消えるという工程。つまり2回バックスペースを押さないと「ウ」まで戻れません。

 これはMac(macOS)のファイルシステムが文字コードとして「UTF-8-Mac (NFD)」を採用しているため。一般的な「UTF-8 (NFC)」とは違い、濁音や半濁音が2文字構成になるとのこと。

 見た目がハッキリと「ウク゛イス」のように見えれば気付きやすいですが、ほとんどのケースでは「ウグイス」という風に見え、見分けがつきません…。

【実害1】Googleドキュメントやスプレッドシートで検索した場合、ヒットしない

 Googleドキュメントで解説文を作ったり、スプレッドシートで野鳥一覧を作った後、その中を検索しても、ファイル名からのコピペを利用した部分については、濁音や半濁音が混じった文字だとヒットしません。前述の「ウグイス」でいうと、実際には「ウク゛イス」と記録されているため、「ウグイス」と検索してもヒットしません。

 置換機能で修正するにしても、ファイル名からコピペした部分については、すべての濁音・半濁音を置き換える必要が出てきます…。

【実害2】YouTubeやWordPress等の管理画面上では実質「ウク゛イス」のまま

 Googleドキュメントやスプレッドシート等で作成したテキストデータをもとに、コピペによって、例えばYouTubeやWordPressの投稿を作成することが多いですが、「ウク゛イス」が混じっていた場合、外部から見えるエンコード後のブラウザ上は「ウグイス」となっていますが、管理画面上や実質的なデータとしては、修正しない限りは永遠に「ウク゛イス」のままとなっています。

 検証できているわけではないですが、検索やSEO的には不利な状況が生じてしまう懸念があります…。

【解決方法】Mac標準の「テキストエディット」を間にかます

 究極の解決方法はファイル名からのテキストのコピペは利用しない、という方法ですが、利用した方が効率がいい場面というのは少なからずあります。

 ネットで検索するといくつかの方法を見かけますが、思いのほか決定的な解決方法は見当たりません。

 1つはDropboxにファイルをアップし、MacのFinder上ではなく、ブラウザ上などDropbox側からコピペすると解消されている(変換されている)という方法があり、試したところ、確かにその通りの動作となりました。

 但し、個人的にはそこまでDropboxを活用していないこともあり、使い勝手としてはイマイチな印象でした。

 現時点で個人的に見つけた現実的な解決方法は、Macにデフォルトでインストールされている「テキストエディット」アプリを利用する方法です。

 「テキストエディット」の[環境設定]>[開く/保存]で[ファイルを保存するとき]を「日本語 (Shift JIS)」にします。こうした上でテキストエディットのファイル上にコピペし、テキストエディットを介した上でGoogleドキュメントやスプレッドシートへ再度コピペすると、「UTF-8-Mac (NFD)」に起因する濁音・半濁音問題は解消されています。

 ただ、これも正直、非常に無駄で非効率に思えてなりません。

Appleらしからぬ「macOSの欠陥」のよう…!

 Appleに言いたいのは、ファイル名からコピペする際、自動的に「ウク゛イス」は「ウグイス」に変換する仕組みにしてくれ!という要望です。果たして「グ」が「ク゛」であることにメリットを感じる人の方がどの程度いるのでしょうか?

 個人的には全面的にデメリットしかなく、メリットはゼロです。

 正直、Appleらしからぬ「macOSの欠陥」といってもよいのではないかとすら思ってしまいます…。

 なぜ、改善の要望がもっと多く集まらないのか不思議なほどですが、1つは日本語圏内だけの話であること、もう1つは本件に気づいていない人が多い、つまり「ウグイス」を「ウク゛イス」として量産している事例が想像以上に多いのでは、と思いました。

 Appleさん、何とかならないんでしょうか…🙂


[関連投稿]


[関連参考リンク]


Share this…