1. HOME
  2. すべての記事一覧
  3. SEO
  4. パンダアップデートの生みの親が出願した特許をご紹介します。

パンダアップデートの生みの親が出願した特許をご紹介します。

2014年06月26日

  • twitter
  • facebook
  • はてB!

eyecatch

みなさんこんにちは。アナリストの荒木です。

2014/5/20に検索アルゴリズムのパンダアップデート4.0が導入されました。
▼マット・カッツ氏の発言

mattcutts

Growth Seedの順位変動率は5/20~5/24にかけて大きく変動し、5/24に最高1.36の数値を記録しています。順位変動率は2000キーワード×100URL(つまり20万URL)の変動をモニタリングしています。今回のアップデートでは、そのURLが前日比平均1.32倍も変動したことから、検索アルゴリズム全体にインパクトがあったと推測しています。

パンダアップデートアルゴリズムは2012/7/18にバージョン3.8のタイミングで日本へ初めて導入されました。したがって、4.0は日本導入以来初の大きなバージョンアップといえます。

今回はこのパンダアップデートの生みの親であるNavneet Pandaさんが出願した特許をご紹介します。
本特許では、従来のエンジンが算出するスコアをリンク数を用いて修正する手法が掲載されてます。
※本特許に掲載されている技術はNavneet Pandaさんが出願したというもので、パンダアップデートアルゴリズムというわけではありません。
また、Googleの検索アルゴリズムに導入されている保証もありませんのでご注意ください。

ご紹介する特許の全文は、下のリンクからご覧いただけます。
(別ウィンドウで表示されます)
今回取り扱う特許:Ranking Search Result
今回ご紹介する検索アルゴリズムは、一つのサイトから同じページへ発リンクされている場合、1本あたりの効果を弱める効果があります。

アルゴリズムの概要

検索エンジンは質の高いページを評価することに注力していますが、意図していないページに対しても高評価を与えてしまうことがあります。
本特許では、質の低いページであれば、スコアを低くする仕組みを導入し検索結果を向上させる方法を提案しています。
※質の低いページを定量化する手法が書いてあり、人力で行う手動ペナルティとは異なりますのでご注意ください。

実際の式を見てみると、様々なサイトから受けるリンクとユーザーの認知度に応じてスコアを調整しています(数式の詳細は後半で説明いたします)。
例えば、指名クエリ(サイトを指名する検索ワード)による検索数は少ないが、様々なサイトからリンクを受けているページはスコアに加点します。逆に、指名クエリはたくさんあるが、様々なサイトからのリンクがない場合はスコアが減点されます。

以下はシステム概要図です。本特許のメイン部分を赤色で塗りつぶしています。
システム概要図

以降はフローチャートや数式を用いて説明します。
苦手な方は読み飛ばしていただき、まとめをご覧ください。

スコア算出のフロー

計算フロー

※IS:Initial Score(イニシャルスコア)の略。ランニングエンジンが算出したスコア。
f1,f2:スコア修正エンジンが算出したスコア。
T1,T2:最終スコアを計算する分岐に用いるしきい値。

まず、クエリが入力されるとサイト名等を示す指名クエリか否かを判断します。
指名クエリの場合は検索エンジンが算出したISを最終スコアとします。

指名クエリのではない場合、ISとしきい値を比較します。

ISがしきい値(T1)よりも小さい場合はISを最終スコアとします。
しきい値(T1)よりも大きい場合はスコアを修正します。

スコアを修正する場合、ISと上記とは別のしきい値(T2)と比較します。
ISがしきい値(T2)よりも小さい場合、f1を最終スコアとします。
しきい値(T2)よりも大きい場合はf2を最終スコアとします。

以降では、f1とf2について詳細な説明を致します。

SCORE MODIFICATION ENGINEが算出するスコア

【その1:f1】
T1以上T2未満のスコアを持つページは以下のとおり再計算されます。
f1

T1はしきい値、ISはInitial Score、Mは修正因子であり、スコアを変化させるキモの要素でM=IL/RQによって求めます。
ILはIndependent Linkの数:リンク数は貼られてなければ0、100本貼られていても同一サイトならば1と計上します。
RQはReference Queryの数:指名クエリの数を計上します。
(例)www.example.comのReference Queryは「example.com」を含む全ての検索クエリが該当します。

上記の式から以下の事がわかります。
f1は様々なサイトからのリンクが多くなる程スコアが高くなり、指名クエリ数が多い程スコアが低くなる。

【その2:f2】 
T2以上のスコアを持つページは以下の通り再計算されます。
f2

Qは予め決めておいたしきい値で、実装上f2の分母は常に1より小さい値に調整しています。
従って、f2は常にf1よりも大きな値をとります。

まとめ

今回ご紹介した検索アルゴリズムの特許は、サイトワイドリンクなど同一サイトから多数貼られている場合、そのリンクの評価をほとんど無視することで、品質が高く見えていたサイトのスコアが下がるように調整されています。
また、リンク数と指名クエリ数を同じ土俵にのせることで、検索されているが他のサイトから紹介してもらえていないサイトはスコアを下げる様に調整されています。

質の良し悪しを定量化することは難しいですが、検索クエリ数とリンクを使って「人の評判」から質の高いページへアプローチする手法がとても勉強になりますね。

余談ですが、マット・カッツ氏が「サイトワイドリンクをうまく束ねて評価する事が、アルゴリズムで出来ている」と2012/11/13にYoutubeで発言しています。

もしかしたらこの特許に出ているIndependent Linkがこの発言を産んだかもしれません。

また、導入の有無は別にしても、検索アルゴリズムの特許を読むと、検索ユーザーに最高の体験をさせるためにGoogleが考えていることがわかる気がします。

長文にお付き合い頂きありがとうございました!

記事の関連タグ

こちらの記事もおすすめ

Webマーケティングにお困りの際は
お気軽にご相談ください