日本語の文字を処理するのは複雑なので、いくつかのテストが必要です

8月 20, 2007

特にアメリカで開発されているソフトは、「文字」というものの中にアルファベット、アラブ数字、半角記号しかないと言う感覚が多いです。そのソフトが日本語の漢字、かな、全角ローマ字や記号を正しく取り扱えるようにするのは、そんな簡単なことではありません。ひとつのところを直すのは、だいたい難しくないですが、直す必要があるところを全部探し出すことが大変です。

This is multibyte (full-width) text that  should be readable to English speakers.It is actually encoded as Japanese text, but the Japanese character set includes ”wide” 2-byte versions of the English alphabet. (They’re more than 2 bytes in UTF-8.)

タグ:   

広告

コメントを残す

コメントを投稿するには、以下のいずれかでログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。