文字エンコーディングはUTF-8で!

 

ウェブサイトを構成するHTMLを書く際の文字エンコーディングは UTF-8 を使わなければなりませんよ・・・ということになってきました。

 

文字エンコーディング

プログラミングでは、文字はすべて数値と結びつけられ※、数値から文字へ変換する変換表が「文字エンコーディング」です。

HTMLを書く際の文字エンコーディングは、日本では EUC-JP、Shift_JIS、UTF-8 の3種類がよく使われれいますが、同じ文字でも文字エンコーディングが違うと正確に表示されない(俗に言う文字化け)になります。

※ あ という文字は、Shift_JISでは 0x82A0 ですが、UTF-8 では 0xe38182 となります。

インターネット黎明期からしばらくの間は、Shift_JISが一般的に使われていましたが(大手のホームページ作成ソフトなどもShift_JISが標準だった)、WordPressなどのCMSではUTF-8が標準的だったため、国内でもUTF-8を指定したサイトが増えていました。

 

HTML StandardではUTF-8を指定

HTMLの標準規格では、

文字エンコーディング宣言が存在するかどうかにかかわらず、文書のエンコードに使用される実際の文字エンコーディングはUTF-8でなければならない。

4.2.5.5 文書の文字エンコーディングを指定する(HTML Standard 日本語訳) より

と明記されています。

 

ウェブサイトの文字エンコーディングはソースで確認できる

ウェブサイトの文字エンコーディングはブラウザでページを表示したら、ソースを表示させれば確認できます。

WordPressサイトの場合、MySQL(データベース)の文字エンコーディングの設定と関連しますが、一般的にはUTF-8を指定しているはずです。

 

国内では仕様の古いサイトなどで、Shift_JISを指定したものが多数あり、まだ根強く残っています。

 

Shift_JISを指定したサイトで今すぐ問題が起きるということではありませんが、HTMLの標準規格としてUTF-8を定めているわけですから、ウェブサイトをつくる際には文字エンコーディングはUTF-8を指定するに越したことはありません。

HTMLをはじめ、インターネットやウェブサイトに関する規格は技術的な進化とともに日々変化していきます。

ウェブサイトオーナーさん、担当者さんは、こういった情報もチェックしておくように心がけていきましょう。

 

投稿者プロフィール

kikuchi@webmaster
kikuchi@webmasterフジデンキ パソコン・ウェブ制作担当

1963年 福島県三春町生まれ。

街の電器屋から、今はパソコン屋兼ウェブ屋として活動。

ウェブ制作環境はMacとAdobe CCがメイン。


WordPressを使ったシンプルで機能的なウェブサイトをつくって

小さなお店や会社の皆さんに活用してもらいたいと思っています。


penchi.jp

@penchi – Medium


自分で更新できるウェブサイトで成果を上げる

「自分で更新できるウェブサイトを提供したい」とWordPressサイトの制作を始めてから10年以上。
スマホ対応やHTTPS化など、先を見据えたウェブサイトづくりを心がけ、成果を上げるための仕組み作りのご提案もさせていただきます。

現在運用中のウェブサイトのリニューアルも承ります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です