ウェブサイトを構成するHTMLを書く際の文字エンコーディングは UTF-8 を使わなければなりませんよ・・・ということになってきました。
文字エンコーディング
プログラミングでは、文字はすべて数値と結びつけられ※、数値から文字へ変換する変換表が「文字エンコーディング」です。
HTMLを書く際の文字エンコーディングは、日本では EUC-JP、Shift_JIS、UTF-8 の3種類がよく使われれいますが、同じ文字でも文字エンコーディングが違うと正確に表示されない(俗に言う文字化け)になります。
※ あ という文字は、Shift_JISでは 0x82A0 ですが、UTF-8 では 0xe38182 となります。
インターネット黎明期からしばらくの間は、Shift_JISが一般的に使われていましたが(大手のホームページ作成ソフトなどもShift_JISが標準だった)、WordPressなどのCMSではUTF-8が標準的だったため、国内でもUTF-8を指定したサイトが増えていました。
HTML StandardではUTF-8を指定
HTMLの標準規格では、
文字エンコーディング宣言が存在するかどうかにかかわらず、文書のエンコードに使用される実際の文字エンコーディングはUTF-8でなければならない。
と明記されています。
ウェブサイトの文字エンコーディングはソースで確認できる
ウェブサイトの文字エンコーディングはブラウザでページを表示したら、ソースを表示させれば確認できます。
WordPressサイトの場合、MySQL(データベース)の文字エンコーディングの設定と関連しますが、一般的にはUTF-8を指定しているはずです。
国内では仕様の古いサイトなどで、Shift_JISを指定したものが多数あり、まだ根強く残っています。
Shift_JISを指定したサイトで今すぐ問題が起きるということではありませんが、HTMLの標準規格としてUTF-8を定めているわけですから、ウェブサイトをつくる際には文字エンコーディングはUTF-8を指定するに越したことはありません。
HTMLをはじめ、インターネットやウェブサイトに関する規格は技術的な進化とともに日々変化していきます。
ウェブサイトオーナーさん、担当者さんは、こういった情報もチェックしておくように心がけていきましょう。
自分で更新できるウェブサイトで成果を上げる
スマホ対応やHTTPS化など、先を見据えたウェブサイトづくりを心がけ、成果を上げるための仕組み作りのご提案もさせていただきます。
現在運用中のウェブサイトのリニューアルも承ります。