何かについて知りたい!と思ったとき、あなたはどうしていますか?
今の時代なら当然のようにGoogleなどの検索エンジンで「ググり」ますよね。
これが20年前なら図書館に行って、関連書籍をシラミ潰しに見ていくほかありませんでした。
今ではよっぽど詳しく知りたい情報でもない限り、Google先生のお世話になるのが、ビジネスの世界でも常識のように振る舞わられています。それほどまでに「ググる」ことは身近になりましたし、いつでもどこでも知りたい情報を、気軽に調べることができる便利な世の中になりました。

しかし、検索エンジン(Google)側は、どんな仕組みで検索結果を表示しているのか、もっと言えば自分の会社やお店のWebサイトは検索エンジンにどう登録されているのかはご存知ですか?
そこで今回は、検索エンジンにWebサイトがどうやって登録され、どんな仕組みで検索結果を表示しているのか、検索エンジンの基礎について解説していきます。
検索エンジンの仕組みを理解することで、きっとあなたのビジネスにも役立つものとなるはずです。

 

検索エンジンの基礎


まずは検索エンジンの歴史から見ていきますが、その前に検索エンジンが何をやっているのか確かめておきましょう。検索エンジンとは、検索窓で検索された情報を的確に表示するため、インターネット上のWebサイトを回って分類して登録しています。図書館の司書さんと似ていて、検索エンジンは情報を探している人に、探している情報を届ける、ということをしています。

では検索エンジンの歴史ですが、最も古い検索エンジンについて知っていますか?
1990年に公開された「アーチー」というプログラムが最も古い検索エンジンの一つとされていますが、なんとアーチーはWebサイトの名前しか検索することができませんでした。つまり最古の検索エンジンでは、Webサイトの中身までは検索できなかったことになります。(想像しただけで不便そうな感じが伝わりますね)

その後、Google、Yahoo!、Bingなどの検索エンジンが登場し、現状のようにWebサイトの中身までを検索することができるようになりました。なお、大手の検索エンジンは上述のように複数ありますが、基本性能はそれも同じと考えて問題ありません。何かについて知りたいとき、単語か文章を検索窓に入力すると、たちまち検索エンジンがその単語や文章をWebサイトの一覧と突合し、検索結果を提示します。また、其々の検索エンジンの目的も同一です。それはできる限りの適切な検索結果を提示し、あなたや私たちが探している情報を極力見つけやすくすることです。

 

検索エンジンの仕組み


それでは検索エンジンの仕組みをもう少し詳しく見ていきましょう。
検索エンジンは、私たちの知らないインターネットの裏側で、検索エンジンが確認できる全てのWebページを確認し、その全Webページを分類しています。ここでは「Webページ」という言葉を使いましたが、「Webサイト」と何が違うのか把握することで、検索エンジンへの理解も深まりますので、まずはこの2つの違いからです。WebサイトとWebページの違いは、一冊の本とその中身の其々のページと同じ関係です。
すなわちWebサイトを構成している其々のページをWebページと呼んでいます。

そして検索エンジンはWebページ単位で情報を収集し識別しています。
では、検索エンジンは無数に散らばるWebページをどのように収集し、識別し、表示しているのか見ていきますが、大まかに以下の3つの役割に分類されます。

検索エンジンの仕組み3ステップ

・全世界で公開されているWebページから、情報を収集する「クロール」という役割。

・収集したWebページを分類し、情報を登録する「インデックス」という役割。

・検索された内容に対して、関連性が高いWebページがどれなのかを決定する「ランク付け」という役割。

それでは、検索エンジンの仕組みの根幹である、これら3つの役割について詳しく説明していきます。
検索エンジンは、「クローラー」というソフトウェアを使って、世界中で公開されているWebページを飛び回り、ひたすら情報を収集しており、これが先ほどの「クロール」の部分にあたります。検索エンジンがクローラーを使ってクロールすることで、的確な検索結果を表示するためのWebページや、日々更新されていく最新の情報を探しています。

そして世界中のWebページをクロールした結果、検出されたWebページの情報を登録していくことが「インデックス」です。このようにクロールとインデックスを繰り返していくことによって、莫大な数のWebページの一覧が完成します。検索エンジンは、この一覧から検索結果に表示するためのWebページを、独自のアルゴリズムを用い選択しているのです。
しかし、ここでポイントとなるのが、全てのwebページが「インデックス」に登録されるという訳ではない、という点に注意が必要です。例えば全く同じ内容の文章のWebページが複数あった場合、検索エンジンは代表的なWebページだけを「インデックス」します。つまり、検索エンジンにきちんと「インデックス」してもらいたければ、他のWebサイトと異なる、独自の文章を記載することが必要になるということです。
そうすることで、検索エンジンに検索結果を表示してもらえる可能性を少しでも上げていくことができます。

少し話が複雑になりましたが、最後に「ランク付け」です。
検索窓でホニャララが知りたいと検索されると、検索検索エンジンは検索されたキーワードと関連性が高いWebページを「インデックス」から探してきます。そして検索エンジンが例えば40万件の結果を検出したとして、最後の役割である「ランク付け」が実施されます。ここで検索エンジンがWebページを「ランク付け」する要素となるには、Webページ内の単語やリンクしているWebページの数など複数あると言われています。
この「ランク付け」の要素に関する情報は明確に提示されておらず、ユーザーにとって有用でオリジナルで有用なコンテンツを持つ高品質なWebページが必要とされています。

詮索することはあまり得策と言えませんが、揺るぎない事実として、検索エンジンはユーザーが探している情報に対して、精度の高い検索結果を提示することが目的とされている、ということです。つまり検索エンジンの目的を理解した上で、それを満たすWebページ作りが重要となります。

 

検索エンジンによるウェブサイトの把握方法


ここまでで検索エンジンの歴史と基礎、そして仕組みについて解説してきました。
ここからは、検索エンジンがどのようにWebサイトの内容を把握しているか見ていきます。
それが把握できれば、あなたのWebサイトの情報を探しているユーザーに対して、あなたのWebサイトが表示されやすくなるかもしれないということです。実際にあなたのWebサイトを検索エンジンの検索結果にきちんと表示させたいと思うのであれば、ぜひ以下の内容も引き続きご覧ください。

では、早速進めていきますが、通常私たちの見ている世界はこのWebページのようにありのまま表示されていますよね。しかし、検索エンジンには同じWebページでも、今私たちが見ている世界ではなく、Webページの裏側にある「HTML:Hypertext Markup Languageの略」というコードを見ています。面白いことに、このコードの特定部分で、検索エンジンはWebページの内容を把握しています。例えば、このWebページの最上部には、このポストの標題がタイトルとしてありますが、検索エンジンには最上部等の場所など関係なく、HTML内の「タイトルタグ」と呼ばれるコードに囲まれた領域をタイトルだと認識します。つまり、適切な内容の文章であっても、検索エンジンが見ているHTMLのコード上において、適切な内容であると理解してもらわなければいけないことになります。

少し大変そうだなと感じたあなたに朗報です。
WordPressなどの「CMS(コンテンツ・マネジメント・システム)」と呼ばれる仕組みを使えば、裏側のHTMLを完全に理解しなくても、簡単にWebサイトを編集することができますのでご安心ください。
(WordPressやCMSに関しては、別の記事で詳しくまとめていますので、こちらをクリック)
CMSなら、もちろんタイトル1つ取っても、Webページのタイトルを正しく設定さえすれば、検索エンジンに適切に登録(インデックス)され、関連するキーワードであれば検索結果に表示されるようになります。

では画像などは検索エンジンはどうやって識別しているの?という疑問も湧くかと思います。
残念ながら検索エンジンは、どんなに美味しそうな料理の写真も、皆さんと同じように見ることはできません。やはり画像に関しても、裏側にあるそのコードを見て識別しています。
そのため、画像のコードに「Alt タグ」と呼ばれる説明を追加することも有効ですが、最初は検索エンジンが認識しやすくなるよう、画像には分かりやすい名前をつけることが良いと言われています。
手間や時間がかかる作業もありますが、検索エンジンと上手に付き合っていくためにも、しっかり対応を実施し、検索エンジンを効果的に活用することが望ましいでしょう。

 

Google Search Console は強い味方


検索エンジンに自分のWebサイトを、一方的に情報収集され、独自の一覧に勝手に登録され、おまけに秘密のアルゴリズムで格付けまでされ、こちらは何も出来ないの?と不安になりそうですよね。
Google Search Console と呼ばれる無料のサービスを使えば、あなたのWebサイトに関するレポートを作って教えてくれます。最後にGoogle Search Console の概要について説明していきたいと思います。

Google Search Console の主な使い方は、検索エンジン(ここではもちろんGoogle)があなたのWebサイトをどう評価しているか調べるというものです。
以下よりGoogle Search Console にどのような評価項目があり、何が見えるのか解説します。

「検索アナリティクスレポート」
ユーザーがいつ、どんなキーワードであなたのWebサイトに訪れているか、を知ることが出来ます。
つまり、あなたのWebサイトに関係するキーワードを確認することができ、Webサイトを見直すべき部分となります。

「サイトへのリンク」
あなたのWebサイトへのリンクを貼っている他のWebサイト、を知ることが出来ます。
まさしくあなたのWebサイトを他のWebサイト内で紹介しているWebサイトです。

「モバイル ユーザビリティ レポート」
携帯端末であなたのWebサイトがうまく表示されているか、を知ることが出来ます。
昨今は携帯端末でのインターネット利用者も増えていますので、この結果を参考にして携帯端末でも見やすいWebサイト作りをオススメします。

「クロール エラー」
GoogleがあなたのWebサイトに訪問できるか、を知ることが出来ます。
上述の通り検索エンジンにクロールされないと、あなたのWebサイトが登録されず、検索結果に表示されないことになりますので、注意深く確認しましょう。

「インデックス ステータス」
GoogleがあなたのWebサイトについて記録した情報や、アクセス出来ないWebページを、知ることが出来ます。

他にも多くの機能が無料で使うことが出来ますので、すでに自分のWebサイトをお持ちでまだ Google Search Console を使っていない方は早速活用してみてください。しかし、当然世界中には莫大な量のWebページが存在しますので、Google Search Console も処理が反映するのに数日かかる場合もありますので、その点はご注意ください。

 

まとめ


いかがだったでしょうか。
生活の一部に溶け込んでいる検索エンジンですが、実は裏であれやこれやしてましたね。
重要なのは、検索エンジンがどんな仕組みで、どんなことをしているかを理解し、それをあなたのWebサイトやビジネスに活かすことです。どうしても小手先だけの検索エンジン対策が多く出回っていますが、本質を知ることこそ、Web社会で生き残る鉄則かと思います。

zeptoworks はユーザーフレンドリーなWebサイト制作が得意なチームです。
今回途中でご紹介したWordPress で構築するWebサイトや個人ブログの制作依頼やお見積、お問い合わせなど
お気軽にご連絡ください。

WordPress とは? 〜 歴史と背景から読み解く有用性

WordPress とは? 〜 歴史と背景から読み解く有用性

はじめに 歴史と背景という言葉が好きです。 何かを始める時、学ぶ時などは何かにつけて、その対象となる歴史と背景を知っておきたいという人も多いはず。 これからWordPressで、Webサイトやブログを始めてみたいと思っている人に、まずは押さえておいていただきたい点をまとめていきます。 それでは早速スタートしていきます。   WordPressとは...

続きを読む
パソコン仕事の人におすすめ!質の良い睡眠と目覚めのために毎晩寝る前にすべき10のこと

パソコン仕事の人におすすめ!質の良い睡眠と目覚めのために毎晩寝る前にすべき10のこと

毎晩よく眠れていますか?朝の目覚めは良いですか? Webサイト関連の仕事をし、毎日パソコンと長時間向き合っているため、私にとって睡眠は永遠のテーマとなりかけていました。 夜遅くまでパソコンで仕事をしていると、寝ようと思っても目がチカチカ、ホビットになってオークに追いかけられる夢をみて次の日疲れて起きるなんてことがありました。 前の日に質の良い睡眠をとれないと、次の日がつらいですよね。私も次の日の仕事に影響が出て困っていたところ、SUCCESSの10 Smart Things to Do Before Bed Each...

続きを読む