文字エンコーディングはUTF-8で!

 

ウェブサイトを構成するHTMLを書く際の文字エンコーディングは UTF-8 を使わなければなりませんよ・・・ということになってきました。

 

文字エンコーディング

プログラミングでは、文字はすべて数値と結びつけられ※、数値から文字へ変換する変換表が「文字エンコーディング」です。

HTMLを書く際の文字エンコーディングは、日本では EUC-JP、Shift_JIS、UTF-8 の3種類がよく使われれいますが、同じ文字でも文字エンコーディングが違うと正確に表示されない(俗に言う文字化け)になります。

※ あ という文字は、Shift_JISでは 0x82A0 ですが、UTF-8 では 0xe38182 となります。

インターネット黎明期からしばらくの間は、Shift_JISが一般的に使われていましたが(大手のホームページ作成ソフトなどもShift_JISが標準だった)、WordPressなどのCMSではUTF-8が標準的だったため、国内でもUTF-8を指定したサイトが増えていました。

 

HTML StandardではUTF-8を指定

HTMLの標準規格では、

文字エンコーディング宣言が存在するかどうかにかかわらず、文書のエンコードに使用される実際の文字エンコーディングはUTF-8でなければならない。

4.2.5.5 文書の文字エンコーディングを指定する(HTML Standard 日本語訳) より

と明記されています。

 

ウェブサイトの文字エンコーディングはソースで確認できる

ウェブサイトの文字エンコーディングはブラウザでページを表示したら、ソースを表示させれば確認できます。

WordPressサイトの場合、MySQL(データベース)の文字エンコーディングの設定と関連しますが、一般的にはUTF-8を指定しているはずです。

 

国内では仕様の古いサイトなどで、Shift_JISを指定したものが多数あり、まだ根強く残っています。

 

Shift_JISを指定したサイトで今すぐ問題が起きるということではありませんが、HTMLの標準規格としてUTF-8を定めているわけですから、ウェブサイトをつくる際には文字エンコーディングはUTF-8を指定するに越したことはありません。

HTMLをはじめ、インターネットやウェブサイトに関する規格は技術的な進化とともに日々変化していきます。

ウェブサイトオーナーさん、担当者さんは、こういった情報もチェックしておくように心がけていきましょう。

 

関連記事

  1. ドメイン選びは慎重に!

  2. 使われなくなった規格には理由がある

    使われなくなった規格には理由がある:Flash(フラッシュ)

  3. 背景や文字に黒(ピュアブラック)は使わない

  4. 使われなくなった規格には理由がある

    使われなくなった規格には理由がある:テーブル

  5. Falshコンテンツが表示されない時代がやってきた

  6. ウェブサイトは常時SSLが標準になる

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

新着記事

お店や会社のブログ活用塾

 

フジデンキ メールマガジン

 

フジデンキ

 

FD Blog