文字コード「UTF-8」の基礎知識!サイト・ホームページの文字化けを防止

文字コード「UTF-8」について解説。ブラウザやソフトが文字コードの判定間違いをすることが、文字化けの原因になります。ホームページの文字化けを直す方法も紹介。

執筆者: 矢野勇雄 職業:パソコンサポーター
サイトの文字が文字化けする原因と解消法

こんにちは、パソコンサポーターの矢野勇雄です。

今回は、ホームページで使われる文字コード「UTF-8」について解説します。

 

 

ホームページが文字化けする原因は、「文字コード」の判定間違い

最近はあまり見かけないのですが、以前は、ホームページをあちらこちらのぞいて回ると訳の分からない文字や記号が混ざっているホームページに巡り合うことがありました。

この現象は、Webブラウザが、ホームページで使用されている「文字コード」の判定に失敗していることが原因と考えられる現象です。

 

「文字コード」とは?

「文字コード」というのは、パソコンやインターネットなど内部での処理が数字しか扱えない機器で文字を扱うための基本的な要素であり、個々の文字や記号に割り当てられた重複しない番号のことです。

 

ホームページの文字化けを解消する方法

ホームページが文字化けして表示されてしまったときには、一般的に「エンコード」なるものの設定を変更すると、読めるようになります。

 

ここでの「エンコード」とは、文字をどのような数字の並びで表すかという決まりのことで、文字コードとほぼ同じと考えて構いません。

 

例)インターネットエクスプローラーの場合

画面上部のメニューバーから、「表示」→「エンコード」の順に選択します。

通常は、「自動選択」になっていますが、文字化けしている場合は、ここで「UTF-8」や「日本語EUC」などを選んでみましょう。

 

なお、マイクロソフトエッジやグーグルクロームには、文字化けした時にエンコードを変更するメニューはありません。
文字判定が強化されている模様ですが、どうしてもホームページを判読できないときは、他のブラウザを使うことを考えましょう。

 

「UTF-8」とは?
インターネットの世界では、「UTF-8」が主流に

UTF-8とは、unicode transformation format-8の頭文字をとって作られた用語です。

 

ASCIIという名の文字コードに、世界中の文字を追加したもので、日本語の文字の場合は、1文字に3バイトが使われます。
ASCIIとの互換性が良いため、パソコンで扱いやすく、世界中の多くのソフトウェアは、UTF-8に対応しています。そのため、「パソコンの世界共通語」と言っても過言ではありません。


現在では、日本語で表示されているサイトも、文字コードにUTF-8を使っているものが多くなっています。

 

ASCIIは、American Standard Code for Information Interchange の頭文字で作られた用語で、コンピュータの世界では最も基本的な文字コードです。
キーボード上の英数字や、記号が含まれています。

 

「日本語EUC」とは?

日本語EUCとは、LinuxなどのUNIX系のOSで利用される日本語文字コードです。

 

 

文字化け防止のために、データ作成は「UTF-8」対応のソフトで行おう!

私は、文書を作るときは、「秀丸」というエディタソフトを使用しています。

この場合、エンコード形式は自動で、UTF-8が選択されます。


ホームページの本文作成も、やはり秀丸を使います。
文字コードに、シフトJISとUTF-8が混在することがなく、文字化けが未然に防げています。

 

もし、文字化けでお悩みなら、このように標準のエンコードの種類として「UTF-8」が設定できるエディタソフトをご使用になることをお勧めします。

 
 コラムニスト情報
矢野勇雄
性別:男性  |   職業:パソコンサポーター

福岡市とその近郊でパソコンの出張サポートをやっています。パソコンを使っていて困った際のサポートを行っています。具体的にはパソコンの初期設定、インターネットへの接続、ウイルスなど迷惑ソフトの削除、旧パソコンから新規パソコンへの各種設定・データの引っ越しなどをやっています。