アクセス解析を複数導入していたりすると、例え同じアクセス解析ツールだとしても数値が合ってない(揃わない)という経験はございませんでしょうか?これは、アクセス解析の仕様上どうしても発生してしまうことで、今回はそのことに触れてみたいと思います。

なぜ数値がずれるのかを一言で言いますと、「1訪問(セッション)」の定義がツール毎に異なるからです。

例えば、Google アナリティクスの標準アナリティクスの場合、参照で流入した直後に、オーガニック検索で再度流入した場合、参照で1、オーガニック検索で1になるので、合計の訪問数は2になります。これが逆に、オーガニック検索で流入した直後に、参照で流入した場合、オーガニック検索1のみで、合計の訪問数は1になります。何を1訪問(セッション)とするかで、大きく数値がずれることになりまして、上記の例でいうと、後者のアクセスをオーガニック検索1、参照1でカウントするアクセス解析ツールが同時に導入されていた場合、単純に比較して2倍数値がずれていってしまいます。また厄介(?)なことに、このように短い期間に同一ユーザが複数の流入元からアクセスするというのは極端なケースではなく、結構な頻度でこのようなアクセスが見受けられます。何か情報を探しているユーザは、いくつかのソースを見比べたりしており、その過程で様々な流入元からWebサイトへ複数回アクセスしているのではないかと推測しております。

上記の例だけではなく、他にも数値がずれていく要因がいくつもありまして、同じく、Google アナリティクスの標準アナリティクスの場合、ダイレクトアクセスと判定される為には条件がかなり厳しく、単純に、リファラが空=ダイレクトアクセスという扱いにはなりません。先ほど同様、リファラが空=ダイレクトアクセスとカウントするアクセス解析ツールが同時に導入されていた場合、流入元の数値がずれてしまうことになります。

また一方で、同じく数値が合わないという話で、Google アナリティクス(標準アナリティクス)を複数導入していても数値がずれていくケースがあるかと思いますが、まったく同じタイミングで複数個が正しく導入されれば同じ数値になります。(が、同じ数値になるのが保証されているわけではありません。)
アクセスされたユーザの環境等によっては若干ずれるケースも考えられますが、誤差として受け入れられるくらいの違いで、ほぼほぼ同じ数値となります。しかし、導入時期が少しでもずれる場合は話が別で、これは同じGoogle アナリティクスでも数字はずれます。

これも上記同様、仕様がそうさせるのですが、先の例で、参照で流入した直後に、オーガニック検索で再度流入した場合に、既に導入済みのGoogle アナリティクスでは、参照1、オーガニック検索1とカウントされますが、参照の流入とオーガニック検索の流入の間のタイミングに、新たなGoogle アナリティクスが導入されると、新しい方のGoogle アナリティクスはオーガニック検索1のみとカウントされます。逆にオーガニック検索で流入した直後に、参照で流入した場合ですと、先に導入されてたGoogle アナリティクスですと、オーガニック検索1ですが、新しいGoogle アナリティクスの方は、参照1としてカウントされます。

では、導入した当日だけ違うのかと申しますとそうではなく、この流入元の記録が、Cookie(クッキー)に残っておりまして、直前の流入元と現在の流入元の関係を見て、新しい訪問(セッション)とするかどうかが決まっておりますので、どこからの流入と判定されるかは後のカウントにも関係します。しかしこれはGoogle アナリティクスのCookieの期限等から考えますと、長いスパンでは同様の数値となっていきます。

このように、諸々の仕様・条件が複合的に絡み合い、結果として数値がずれてきてしまうことになりますので、ツール同士を比べ、結果「合う・合わない」はそももそも比較対象としては問題がありますので、同じアクセス解析と言えども仕様上やむを得ないと理解いただいた方がいいかと思います。(もちろん、ツールが正しく導入されてる前提ではあります。)また、1訪問(セッション)の定義に正解はないと思っておりまして、「正しい・正しくない」の話ではなく、どのように定義をしたら、レポートとして価値が出るかといった観点が重要だと思っております。昨今アクセス解析ツールのシェアとして、Google アナリティクスは圧倒的なものがありますので、Google アナリティクスの1訪問(セッション)の定義は、導入数など含め実績が十分なので、ある意味正しいと言ってもいいかもしれません。

Google アナリティクスは事実上アクセス解析のデファクトスタンダードだと思います。しかし一方で、Google アナリティクスの数値が絶対的に正しく、盲目的に信頼してしまうのは危険だとも思います。是非このGoogle アナリティクスの各種定義をざっくり把握し、そのWebサイトが求める(適した)計測方法&定義となっているか確認してみてください。その上で、他の計測ツールが必要であれば、そのツールの導入を検討してみても遅くはないと思います。そうは言っても、他に何か代替ツールがあるかと申しますと、私の知る限りでは、ツールの完成度・サービスの信頼性、価格等含めて、同等のものが他に見当たらないのが現状なんですが・・・。

さて、ここまで「標準アナリティクス」としつこく記載して説明させていただいたのには分けがありまして、ユニバーサルアナリティクスはこの1訪問(セッション)の判定、流入元の判定が全てサーバサイドで行われておるようで、判定の様子がこちらからまったく見てとれない仕様になっております。今まで発行されたタグ(Javascript)で行っていた処理を、サーバサイドで行うコストは、処理しないといけないログの数が膨大なので、かなりのコスト増なはずではありますが、ユニバーサルアナリティクスのサービスの仕様上、またはツールの構想上必要で、今後のGoogleの構想が見え隠れしている気がしております。この辺りは改めて記事で触れてみたいと思います。

アクセス解析の「定義」は非常に重要で(この1訪問(セッション)の定義が最たるものかと思います)、また非常に難しくもあり面白くもある箇所です。他にも、公式で発表されてる訪問の定義の裏側の話、コンバージョンの定義、タイムゾーンの話(これは後で変更できない唯一の設定項目)など面白い話が盛りだくさんです。少し深いところになり複雑な話になってしまうこともあるかと思いますが、これら順次書いて参りますので楽しみにいただければ幸いです。

最後に、下記の流入経路を辿った場合、皆さんならどのようにカウントして欲しいですか?「オーガニック検索の流入の後に、ブックマークしてくれて、翌日そのブックマークからアクセスされた」

※Google アナリティクスの1訪問(セッション)の定義は、これら意外の他の要素も加味されるようになっておりまして、上記のように単純な判定ではなく、もっと複雑であることは申し上げておきたいと思います。