1. ホーム
  2. 専門記事一覧
  3. 検索エンジン全般
  4. 【連載】検索アルゴリズムの200要素を公開|SEOの基礎力講座 Vol.03

【連載】検索アルゴリズムの200要素を公開|SEOの基礎力講座 Vol.03

著者: 深井 秀行
  • 検索エンジン全般
  • 中級

検索アルゴリズムの200要素を公開

こんにちは。SEOコンサルタントの深井です。

今回は、Google検索アルゴリズムの裏側を探ります。

アルゴリズムとは、ある特定の問題を解く手順を、複雑な計算式や言語学を組み合わせて定義したものです。
検索アルゴリズムが構成されている要素は、200以上あるとGoogleからアナウンスされています。しかし、当然のことながら、その内容はほぼ公開されていません。ブラックボックスです。

今日の Google のアルゴリズムは、本当に探している情報を推測することを実現する 200 を超える独自のシグナル、つまり「手がかり」を利用しています。これらのシグナルには、ウェブサイト上の語句、コンテンツの新しさ、お住まいの地域、PageRank などが含まれます。
引用:Google検索サービス 検索の仕組み

Googleの怜悧な頭脳、圧倒的な情報量をもとに作られた複雑な検索アルゴリズムを解明することは残念ながらできません。

ただし、フルスピードでは数々の実験をもとに、上位表示に有効と思われる要因と要素をリスト化しています。課題解決の糸口になればと・・・検索アルゴリズムの200要素を公開します。

※本コラムは、Googleの公式情報にフルスピードで蓄積された独自の分析結果を加えたものです。独自解釈や考察が含まれることをご理解ください。

検索アルゴリズムの評価軸

少し歴史をさかのぼります。
Googleが検索で注目を集めユーザーから支持を得たのは、ページランクの開発といわれています。ページランクは、Googleの創業者であるラリー・ペイジとサーゲイ・ブリンが開発した、外部リンクの評判を判断するGoogle独自のアルゴリズムです。
サイトAからサイトBへのリンクを、サイトAによるサイトBへの支持投票とみなし、この投票数やサイトの質によりそのページの重要性を判断する仕組みです。評判が高いページからのリンクはより高く評価されて、それを受け取ったサイトを「重要なページ」として判断します。

Googleの登場以前は、内部要因重視の検索エンジンが大半を占めていました。例えば、特定のタグに記載されている単語や、特定単語の頻出度からページの中身を判断する、今よりもシンプルな仕組みで精度が低かった時代です。しかし、ページランクの登場で第3者からの評価軸を新たに取り入れることに成功。シンプルな内部評価に外部評価が加わることで飛躍的に精度が向上したのです。ただし、内部の解読性能は低かったこともあり、Google創業時のアルゴリズムは、外部リンクの評価軸が大半を占める外部評価依存型の検索エンジンでした。

時間の経過とともに、ランキングを意図的に操作する外部対策が横行したこと、キーワードの検索意図や属性、コンテンツの意味などを理解する自然言語の開発が一気に進んだ背景もあり、検索エンジンはさらに飛躍を遂げます。
外部対策の不正を見抜くアルゴリズムを導入、そしてサイト内部の言語やコンテンツ理解の精度を増す仕組みが導入されました。この結果、Googleは外部評価依存型から脱却し、サイト内部の評価軸を重要視する検索エンジンに生まれ変わったのです。
2015年にはRankBrain(ランクブレイン)という機械学習を応用した人工知能を取り入れたことを発表。検索エンジンは進化の渦中にあります。

というように、検索アルゴリズムは”サイト内部指標”と”外部リンク指標”の評価軸を中心に試行錯誤が繰り返され、創業当時の外部評価に依存することなく、サイトの内部も正しく理解する高性能の検索エンジンに姿を変えたのです。

現在の検索エンジンの評価軸は・・・
サイト内部要因:サイト検出~サイト理解~サイト品質評価~体験評価
外部リンク要因:第3者サイトからの自然リンクによる支持投票を評価
さらに以下の要因も加わります。
環境要因:ドメインやサーバー状況
その他要因:訪問ユーザー履歴やペナルティ要素
これらの要因をアルゴリズムで解読しランク付することで、ランキングが決定されます。

検索アルゴリズムの評価軸

Google検索アルゴリズムの200要素

Googleアルゴリズムの200の要素は、前述でご説明したように4つの要因で構成されていると当社では考えています。
フルスピード独自解釈による、4つの要因と200の要素をご紹介します。

【内部要因】(114要素)

1.サイト基本情報
・サイトがインデックスされている期間
・サイトボリューム
・サイトの更新頻度
・サイト運用者情報
・サイト種別
・お問い合わせ先の有無
・利用規約、プライバシーポリシーなどの有無
・XMLサイトマップ有無
2.サイト構造
・ディレクトリー構造
・URL構造
・URL記号(アンダーバー、ハイフンの使い分け)
・リンク構造
・URLの正規化(wwwありなし)
・URLの正規化(index.htmlありなし)
・URLの正規化(https)
・URLの長さ
・外部CSSやJavaScriptの活用方法
・URLパラメータやセッションID
・AJAXサイトの構成
・CMS構造
・クッキー使用の有無
・画像ファイルの場所
3.検索エンジン向けのタグ情報
・follow、nofollowタグの有無
・index、noindexタグの有無
・canonicalタグの有無
・rel=“next”、rel=“prev”タグの有無
・OGPタグの有無
・robots.txtの有無
・.htacessの有無
4.metaタグ情報
・headセクションの記述順
・titleの文字数
・title内のキーワード
・title内のキーワード位置
・重複titleの有無
・descriptionの内容
・descriptionの文字数
・description内のキーワード
・重複descriptionの有無
5.内部リンク
・ナビゲーション構造
・アンカーテキストの内容
・内部リンク構造
・内部リンクの書式設定
・内部リンクの場所
・ページ内の内部リンク数
・内部リンクの密集度
・サイト内no followリンクの数
・ヘッダー共通リンクの有無
・内部リンクエラー
6.HTMLソース情報
・HTMLソースの記述順
・HTMLソースの正確性
・CSSの正確性
・見出しタグ構造
・見出しタグ内のキーワード
・見出しタグ下の文章
・パンくずリスト構造
・alt属性内容
・alt属性内のキーワード
・title属性内容
・強調タグ (strong 、b)内容
・強調タグ (strong 、b)内のキーワード
・インラインフレームの有無
・疑似インラインフレーム内のコンテンツ
・text-indentの利用状況
・display:noneの利用状況
7.コンテンツ基本情報
・各ページのコンテンツボリューム
・ページ公開からの期間
・ページの新鮮度
・ページの更新度
・サイト内の重複コンテンツの有無
・ページの表示速度
・ページ内の独自コンテンツの割合
・ページの話題性
8.コンテンツ品質
・RankBrain(ランクブレイン)
・サイト内の使用言語
・コンテンツボリューム
・コンテンツのテーマ性
・コンテンツ種類(取引型、情報収集型、案内型)
・コンテンツの専門性
・コンテンツの信頼性
・コンテンツの権威性
・キーワードの網羅性
・キーワードの密集度
・キーワードの位置
・キーワードの使い方や頻度
・関連キーワードの組み合わせ
・キーワードと関連キーワードの近似性
・文章コンテンツと画像やリンクコンテンツなどの比率
・文章の正確性
・文章のオリジナル性
・文章の読みやすさ
・コンテンツ執筆者情報
・レビューと口コミ
・インタースティシャルの利用
・他ページからの内部リンク数
・補足コンテンツの有無
・ページレイアウト
・情報ソースの開示
・低品質コンテンツの有無
・ファーストビューの広告割合
・タブ等で隠れているコンテンツの有無
・多言語展開の自動翻訳の有無
9.サイト体験
・ページ遷移のしやすさ
・アクセシビリティ
・ユーザビリティ
・興味関心を促すコンテンツ
・価値を伝えるコンテンツ
・安心性を伝えるコンテンツ
・信頼性を伝えるコンテンツ
・視覚性(並べ方、見え方、コントラストなど)
・信頼性(ブランドや身元の証明など)
・利便性(フォント、余白、構成などの使い勝手)
・統一性(位置・カラー、テキストなどの全体統一)
・コンテンツ(コンテンツでサイトの想いを訴求)
・デザイン(デザインでサイトの想いを訴求)

【外部要因】(53要素)

1.外部リンクの状態
・リンク元サイトのページランク
・リンク元サイトのページランク率
・ドメイン当たりの外部リンクの数
・ページ当たりの外部リンクの数
・外部リンクの種類
・外部リンクの多様性
・外部リンクの増減
・外部リンクの増加率
・アンカーテキストの種類
・アンカーテキストの多様性
・アンカーテキストの分散率
・設置リンクの階層
・設置リンクの場所
・IPアドレスバランス
・権威あるサイトからのリンク
・オーソリティサイトからのリンク
・ソーシャルメディアからのリンク
・リンク先サイトとの関連性
・リンク先サイトとのテーマ性
・リンク先ページとの関連性
・リンク先ページとのテーマ性
・リンク設置日
・リンク設置期間
2.リンク元サイトの品質
・ページランク
・サイト運用履歴
・サイト運用者情報
・ドメイン運用履歴
・更新頻度
・サイト品質
・サイトボリューム
・コンテンツ品質
・コンテンツボリューム
・HTMLソースのパターン
・スタイルシートのパターン
・サイト構成のパターン
・アンカーテキストのパターン
・外部リンクの数
・外部リンクの種類
・外部リンクの多様性
・外部リンクの増減
・権威あるサイトからの外部リンク
・サイト全体からの発リンク数
・各ページからの発リンク数
・サイト全体からの発リンク率
・各ページからの発リンク率
・サイトやページとリンク先の関連性
・相互リンクページの有無
3.その他
・ペナルティサイトからのリンクの有無
・人工リンクネットワークの有無
・人工リンクの有無
・ディレクトリー登録サイトからのリンクの有無
・相互リンクの有無
・ワードサラダコンテンツの有無

【環境要因】(19要素)

1.ドメイン
・ドメインの取得期間
・ドメインの運用期間
・ドメインの所有者
・ドメインの過去履歴(変更履歴)
・ドメインの過去履歴(所有者履歴)
・トップレベルドメインのgTLD(分野別トップレベルドメイン)
・トップレベルドメインのccTLD(国コードトップレベルドメイン)
・ドメイン内のキーワード
・ドメイン種別(サブドメイン、ルートドメイン)
・サーチコンソールの地域設定
2.サーバー
・IPアドレス
・サーバーの場所
・サーバーの信頼性
・サーバートラブルの頻度
3.その他
・表示速度
・HTTPS接続
・モバイルフレンドリー
・AMP
・構造化データ

【その他要因】(14要素)

1.訪問ユーザー履歴
・トラフィック
・訪問ユーザのデモグラ情報
2.ペナルティ
・ドメインのペナルティ履歴
・サイト所有者のペナルティ履歴
・有料リンクの購入状況
・隠しテキスト、リンクの有無
・不正リダイレクト
・クローキング
・ドアウェイページ
・リッチスニペットマークアップの悪用
・十分な付加価値のないアフィリエイトサイト
・オリジナルのコンテンツがほとんど存在しないページ
・ハッカーからの攻撃履歴
・オートコンプリート機能の悪用

ランキング要素TOP3

2015年10月に、検索アルゴリズムにランクブレインが導入されていることが発表され、アルゴリズムの中で3番目に重要になったことが明らかにされました。
さらに、2016年3月にはGoogleのAndrey Lipattsev氏が、1番目と2番目に重要な要素は”リンク”と”コンテンツ”であると発言。

1番&2番目に重要:リンクとコンテンツ
3番目に重要:ランクブレイン

これが今の検索アルゴリズムで重要視されているTOP3です。
順を追って説明します。

リンク

リンクには、サイト内の内部リンクと第3者から受ける外部リンクの2種類があります。Andrey Lipattsev氏は「サイトに向けられているリンク」と発言していることから、外部リンクを想定します。
ここでお伝えしたいことは一言。

「自然リンクを得られる運用をしましょう!」

自然リンクが集まるよう魅力的なコンテンツを発信し、Googleが重要度が高いと判断している優良サイトからリンクをもらえるよう、権威性が高いサイトを作りあげること。
この言葉に尽きます。

コンテンツ

コンテンツで求められることは品質です。
Googleには検索評価担当者のトレーニング資料(英語)があります。この中で、高品質コンテンツに求められる条件として以下が定義されています。
・専門性
・信頼性
・権威性

では、どのようなコンテンツを作成すれば条件を満たし、高評価が得られるのでしょうか。1ページで専門性・信頼性・権威性を満たすのではなく、コンテンツ全体で考えます。

例えば、インテリア業界に長年勤めているベテランライターであれば、デザインの背景や色の三属性、床や扉などの部材、キッチンや照明などの機器、明るさの単位や空気の流れなど、空間におけるあらゆることに精通しているはずです。そのようなライターが書く記事は、おのずと深い洞察によって関連用語が網羅され、結果、多くのキーワードが検索結果にヒットします。検索ユーザーの目的を叶えるトピックスで構成されたページは、専門性が高いと判断されるわけです。
そして、専門性が高い記事が豊富にあることで信頼性が増し、特定ジャンルにおける権威性が備わります。

ページ単体で考えるのではなく、コンテンツを構成する全体を俯瞰することで評価が得られるのです。

コンテンツ評価

ランクブレイン

2016年4月に、米Googleオフシャルブログで発表したThis year’s Founders’ Letter(英語)の中で、「モバイルファーストからAIファーストへ」と、機械学習やAI(人工知能)への傾倒を示唆しています。
Googleが、来たるべき人工知能社会に対してAIの開発に力をいれているのは自然な流れです。

・曖昧な言葉や口語も理解します。
・人間が持つ直感や推測に似た力も持っています。
・未知の言葉も意味を推測し処理します。
ランクブレインは、このような特徴があります。人工知能がユーザーの目的を推測して、的確な検索結果を返せるアルゴリズムです。

ランクブレインで注力すべきことは・・・特にありません。
というと誤解をうけるかも知れませんが、Googleが追求しているのはユーザー体験の向上です。つまり、ユーザーが求めるコンテンツとユーザーが使いやすいサイトを提供すれば、必然的にランクブレインの目的を叶えることになります。

そのような意味から、ランクブレインを気にする必要はない!ということです。

まとめ

検索アルゴリズムの200要素をご紹介しましたが、検索エンジンの謎解きに挑むことには賛成しません。

・言語の解読方法や数式が非公開
・機械学習を応用した人工知能”ランクブレイン”が導入済
・日々多くの刷新を繰り返している
など賛成しない理由は複数あります。一昔前の特定のタグを中心に評価するシンプルな仕組みであるならまだしも、多くの要素が混ざり合い、単純な分析方法では解明が不可能といっていいほどの複雑な仕組みになっているからです。
対策後の検証、競合サイトの対策状態、変動時などに、定点観測データで有意性を検証することが分析や研究の範囲内だと思います。

ではなぜ、検索アルゴリズムの200要素を紹介したかというと、検索エンジンがどのようなサイトやページを評価しようとしているのか、その思考を感じてほしかったからです。

200の要素を見ていただければ分かるように、内部要因が指標の半数を占めています。いまの検索エンジンは内部を、そしてコンテンツを重視していると私たちは考えています。

ご紹介した要素を参考に改善を進めれば、サイトの使い勝手の改善や、素晴らしいコンテンツ作成の助長、第3者から自然リンクを多く受けるなど、ユーザーと検索エンジンの双方に良い効果をもたらすことになります。

Googleは、良質なサイトをより高く評価すると発言しています。

検索アルゴリズムだけの為でなく、ユーザーの為に優れたサイトを作っている方々の努力が、きちんと報われてほしいと考えています。

検索アルゴリズムの解明に力を注ぐのではなく、Googleの想いと200要素を参考にし、”ユーザーのために”価値あるコンテンツやサービスを提供することが、素晴らしい結果をもたらします。

第4回目の「効果を上げる内部対策アプローチ」は2016年9月27日(火)掲載です。
今しばらくお待ちください。

それでは、引き続き宜しくお願いします!

Google活用ガイドブック
Googleを活用するうえで知っておきたい基本知識をグッと凝縮し、一冊にまとめました。

詳細はこちら

人気SEO専門記事

人気SEO専門記事一覧を見る

pagetop