アクセス数に関する面白い現象

以下は、本ブログのアクセス数のグラフです。

8月16日に大きな山があるのは、本ブログのあるページにアクセスが集中したためです。それは、はてなのページのどこかからリンクがあったようなのですが、このアクセス自体は単発的なものでした。

以下が、「あるページ」のアクセス数です。

普段は数十というオーダーのアクセス数なのですが、8月16日あたりの数日で2万PVくらいがありました。その後、アクセス数はすぐに元通りになりました。

もう一度、全体のPV数を見てみましょう。

明らかに8月16日前後でアクセス数が底上げされているのです。急なアクセス数の増大が一過性のもので収まったのにもかかわらず、です。これはどういうことなのでしょうか。

まずはじめに考えたのが、「たくさんのアクセス数を稼いだときに、その一部のユーザーがその後も継続的に見てくれているのではないか」という予測です。「このブログ面白いな、じゃあ今後も見てやるか」と、RSSやブックマークに登録してくれた、と、こういう訳ではないかと思ったのですね。しかし、残念ながらそんなことはありませんでした。

オレンジ色のグラフがリピーター(過去に当ブログを見たことがあるユーザーからの再アクセス)です。たしかに、前後で若干は増えているように見えますので、16日以降のアクセス数増の一因にはなっているようですが、これが主というわけではなさそうです。

ユーザーがどこから流入してきたのか参照元を細かくチェックすると、8月16日以降急増しているのが、Google検索からの流入でした。下記がGoogle検索結果をアクセス元とするPV数の遷移です。

これは、特定のページへのGoogle検索からのアクセスが上がっているのではなくて、サイト全体のページへのアクセスがまんべんなく上がっているといった感じでした。

以下がGoogle検索結果への表示回数です。

右側の表示回数が急増しているあたりが8月16日です。ちなみに、Yahoo検索結果は特に変化有りませんでした。つまり、この前後でGoogleの検索アルゴリズムがこのブログをより重要視するようになったということが考えられます。

GoogleはPageRankを利用していると言われています。Wikipediaの記事が良くまとまっていてわかり易いです。これは学術論文の「良く引用されている論文は重要度が高い」「よく引用されている論文から引用されている論文は重要度が高い」という性質をWeb上のページに当てはめた、ページの重要度を算出するアルゴリズムの一つです。

昔はGoogleツールバーというものをインストールすると10段階評価で見ることができたのですが、今はもう見ることができません。一応、ネットを検索すると今でもPageRankをチェックすることのできるサイトがいくつかヒットします。ただこれはデータが古いことが多いらしく、また、10段階評価なため粒度が荒すぎてあまり参考にならないと思います。

で、おそらく今回はたくさんの被リンクが発生したと思われるので、「とあるページ」のPageRankは上がっているはずです。PageRankのアルゴリズムを用いると、この結果から「とあるページ」の検索結果順位に影響することは予想できますが、しかしサイト全体のGoogle検索結果からの流入量増大は説明できません。

おそらくPageRankはドメインの評価にも利用されているのではないでしょうか。SEO系のサイトではもっとダイレクトに「PageRank=ドメインの評価」として解説されているところもあるようです。これは当然のように思えるかもしれません。しかしPageRankはページをノードとする有効グラフを用いて評価するのであって、ここにドメインという概念はありません。ドメインの評価とページの評価(=PageRank)は全く別物だが、それが混同されているケースが多いのでは?という気がします。

ただし、混同されているとは言ってもドメインの評価に、そのドメイン中のページの評価が関連していることは容易に想像できます。今回はその予想を補強する一例になるのではないでしょうか。

特に新しい要素は無いのですが、まあ、上記のようなことを最近考えていました。