Google Analyticsから突然通知が来ました。
大体通知が来たときに良い知らせではないというのは判ります。
今回来ていた通知は「プロパティ「大阪SEの解決案」には、重複するホスト名でデータが届いています。」というものでした。
結論から言うと大して害のある類のメッセージではないので、まだよかったです。
サイトが認識されていません系の通知だとヒヤっとしますよね。
とはいえ、通知が出っぱなしというのは良くないはずなので、私が修正した内容を紹介します。
目次
重複するホスト名とは
そもそも重複するホスト名のデータとはどういう意味でしょうか。
通知の「i」マークを確認すると説明を確認できます。
Analyticsの通知いわく
https://○○○.com
https://www.○○○.com
この二つのドメインからデータが届いていますよ。
ということらしいですね。
www以外にもドメインを切っている方もいるかもしれませんが、その場合でも意味合いとしては同じだと思います。
また、例としては「www.」の有無が出ていましたが、「httpもしくはhttps」の違いも考えられます。
いずれにしてもAnalyticsに送るデータは一つのドメインに絞れということだと解釈しました。
あまり今回の内容と関係ないんですが、私のURLだと最後が「work」になっています。
ドメインの種類分けみたいなものですが、あまり意識する必要はありません。
本当はこのサイトのURLを例としようとしたのですが、判りやすいように「.com」として説明をしていきます。
Analyticsに複数ドメインからデータを送っている原因
先に書きますが、これは実は解決できていません!
でも、通知の対応はできるので安心してください。
Analyticsにデータを送っているというのは「該当プロパティを設定しているサイト(Analyticsで開いている)」しかないはずなので、原因はほぼ確実にサイトにあるのです。
私が思いついたのは↓の2つ。
- サイト内のリンクが「www.」「https」の有無でごちゃ混ぜになっている。
- 複数のサイトに同じAnalyticsの設定が入っている。
サイト内のリンク
Analyticsがサイト内にある複数種類のアドレスを認識している可能性があります。
複数種類のアドレスについては全部で4パターンです。
- http://○○○.com
- http://www.○○○.com
- https://○○○.com
- https://www.○○○.com
「http始まりでwww.の有無」「https始まりでwww.の有無」。
2種類(http / https) × 2種類(www.あり / なし)で4種類ですね。
この4つのアドレスはどれも同じサイトを指していますが、表記としては4種類になるのでAnalyticsでは別サイトだと認識されてしまうようです。
まずは自分のサイトにある内部リンク(過去記事の貼り付け、画像のリンクなど)の書き方がどれか一つに絞られているかどうかを確認しましょう。
Search Regexの使い方
WordPressの場合はプラグインを入れれば簡単に検索できます。
プラグインの追加で「Search Regex」を検索してください。
Search Regexインストール・有効化ができたら、「ツール」の中に「Search Regex」が追加されています。
使い方としてはかなりシンプルです。
- Source(検索対象)の選択
- Search pattern(検索文字)の入力
- Replace pattern(置換文字)の入力(置き換えをする場合のみ入力)
- 「Search」「Replace」「Replace & Save」いずれかのボタンをクリック
今回の場合であればSourceにはデフォルトの「Post content(既存記事)」のみで問題ないですね。
コメントとかタイトルも選べるので、必要に応じて変更してみて下さい。
とりあえずここでは「https://www.○○○.com」に統一したいとします。
そうなるとサイト内に「http://○○○」「http://www.○○○」「https://○○○」というリンクの記載があってはいけないはずですね。
これら3つを検索して置き換えればサイト内に複数のリンクはなくなることになります。
Search patternに入れる文字ですが「http://www.」「https://」のような短いものにしてしまうと、普通の外部リンクまで検索結果に出てしまいます。
出来るだけ細かく指定しておいた方が無難ですので、長めに書いておきましょう。
私の場合は検索するとこれらも検索結果として出てきてしまいます。
検索結果すべてが不要とは限らないので置換の際は十分気を付けて下さい。
Search patternには一つしか入れられないので、3回検索を行います。
もし検索結果に出ていたら、Replace patternに「https://www.○○○」を入れてから「Replace」をクリックします。
この時点ではまだ記事に更新はかかっていません。
Replace patternに入れる文字についてはSearch patternをそのまま置き換える文字にしてください。
仮に↓のような入力をすると
Serach pattern:「http://○○○」
Replace pattern:「https://www.○○○.com」
置換後:「https://www.○○○.com.com」となる可能性が高いです。
これはSearch patternの「http://○○○」の後に高確率で「.com」がついているためです。
なのでSearch patternとReplace patternはしっかり一致するように注意してくください。
更新結果が表示されるので問題がないことを確認してから、「Replace & Save」で置換の保存を実行します。
ここで記事に更新がかかるのでもう簡単には戻せません。
Search Regexを使えば検索と置換は簡単にできますね。
もし、はてなブログなどの無料ブログでWordpressを使っていない場合は、記事の検索ボックスでリンクの有無を同じように3パターン調べて該当する記事のリンクを修正するしかないですね。
地道ですが仕方がないと割り切ってがんばりましょう!
複数サイトに同じAnalyticsの設定
これは単純な話で、複数のサイトを開設している方だけ可能性がありますね。
Analyticsにサイトを設定する際にWordpressでもはてなブログでも多くの方は「トラッキングID」を使用しているはずです。
Analyticsの設定をいれたいサイトに「トラッキングID」もしくは「グローバルサイトタグ(gtag.js)」を設定やヘッダ内に追記しますね。
このトラッキングIDやグローバルサイトタグを間違えて、複数のサイトに同じものを使用しているパターンです。
本来、1つのサイトに1つのトラッキングID(またはグローバルサイトタグ)を設定しているので、Analyticsには1つのサイトからのデータしか来ないはずです。
でも、複数サイトに同じものを設定していると、当然Analyticsには複数サイトからデータが飛んでくることになるので、今回の「重複したホスト名でデータが・・・」という状態になります。
なので複数サイトを開設している方はAnalyticsの設定内容を一度見直してみて下さい。
トラッキングIDが似ていることもあるので「ちゃんと」見てみると案外ミスっている可能性もありますよ。
ちなみに私は貼り間違えてはいませんでしたが、確認するトラッキングIDとプロパティ名の記載を間違えていたことがありました。
Analyticsのフィルターを修正
先ほど紹介した2つの対応をしても「通知が再度表示」される方もいるはずです。
実際私がそうでした。
内部リンクも修正し、Analyticsに送るサイトもちゃんと1つにした。
でもまだ重複したホスト名でデータがきてるとAnalyticsさんがおっしゃりなさる!
そんなときはAnalyticsの指示通り、「内部トラフィックをフィルタしてください」についての対応をしましょう。
一番良いのはそもそも重複したデータがAnalyticsに送られていないことだとは思いますが、出来る対応をしたのでもうやることがない。
でも通知が来るならAnalyticsがちゃんと統計をとってくれるように設定をするしかありませんね。
そもそも今回表示されている「重複したホスト名でデータが届いています」という通知ですが、これはサイト自体に問題があるような感じではないと思います。
「あくまでもAnalyticsの受け取るデータ的な問題」っぽいのでAnaltyicsの統計がしっかりとれるようにすればさして問題ではないのかなと。
なので、最初にも言いましたが重複データの対応はできていませんが、この通知の対応としてはフィルタを設定して通知が消えればOKということで解決とします。
Analyticsのフィルタとは
フィルタなので「データの選別をする」と考えて差し支えないです。
今、理由はわかりませんが、Analyticsには重複したホスト(http://○○○やhttps://www.○○○)なんかからデータが来ている状態です。
そうなるとAnalytics的にはちゃんとしたアクセスの統計がとれません。
同じアクセスを複数カウントしたり、逆に別サイトとして考えてカウントしなかったり。
なので、ここでは同じドメインだと認識できるようなフィルタを設定します。
設定するフィルタ
「「www.」がついているものを除外する」つまり「https://○○○.com」に統一するというフィルタを設定します。
なんで「https://www.○○○.com」に統一しないのかという事なんですが、Analyticsの置換対象がホスト名になっているので「www.○○○」の部分を置換することになります。
そうなると置換対象に「○○○」で置換後、「www.○○○」とすれば、「www.」を付けるパターンのフィルタにすれば一見上手くいけそうです。
が、「https://www.○○○.work」の場合も、フィルタが掛かり、「https://www.www.○○○.com」という風になっていまうので上手くいきません。
その点、「www.」を除外するというのであれば、「https://www.○○○.com」「https://○○○.com」どちらにフィルタを適用しても「https://○○○.com」になるので問題なしです。
「www.」がないところから引くことはできませんからね。
Analytics「www.」除外のフィルタを適用する
フィルタの設定方法は特に難しくありません。
下の網掛け部分を設定していってください。
- 管理ボタン(歯車マーク)
- 「すべてのフィルタ」を選択
- フィルタ名はわかるものを適当に入力
- フィルタの種類「カスタム」を選択
- 「検索して置換」を選択
- フィルタフィールドに「ホスト名」
- 検索文字列に「^www.」
- 文字列の置換(オプション)は「」(なにも入力しない)
- ビューにフィルタを適用の所で街頭のサイトを選択して「追加」ボタン
フィルタの適用するサイトですが、複数サイトをAnalyticsに設定しているとその数だけでてきます。
今回の「www.」を除外するというフィルタであれば大抵のサイトにフィルタを適用しても問題ないと思いますので、全部適用対象にしてもいいのかなと。
表記が全てのサイトになっているのでややこしいですが、おそらくAnalyticsでレポートを確認する際にサイトを選択する時の『プロパティとアプリ』が並んでる順番ではないかと思います。(順番は未確認です)
Analyticsのフィルタを設定できるとこうなる
上記のようなフィルタを設定したら、Analyticsの通知にある「再チェック」をクリックして、文字通り再確認してもらいます。
これは数分とかでは終わらないですね。
何度かやりましたが、どれも翌日ぐらいに通知が来るので、基本的に24時間ぐらは待つ気でいた方がよさそうです。
そして、「www.」をしっかり除外できるとAnalyticsの通知が以下のように変わります。
「解決済み」になっていますね。
これにて一旦、「重複したホスト名でデータが届いています」の通知への対応は完了かなと。
コメント