Google AIオーバービュー(SGE)からの流入を生ログとGPTで分析する方法

2024年以降、Google 検索に表示される AI オーバービュー(旧 SGE)経由の流入が注目されています。ところが Google Search Console では流入元が可視化されないため、サーバーの生アクセスログ+GPT 解析が頼りになります。

ここでは、レンタルサーバー/VPS/クラウド上の ApacheNginx ログを対象に、非エンジニア向け(GPTだけ)エンジニア向け(Pythonも併用) の 2 通りで手順を示します。

関口拓人

AIオーバービューは“検索結果に貼り付く巨大リッチリザルト”のような存在。クリック率も増減するため、ログで把握しておくと順位変動の裏側が読みやすくなります。


Step 1 : サーバーログを取得する

サーバー種別代表的な取得方法
エックスサーバーサーバーパネル → アクセスログ
さくらインターネットコントロールパネル → アクセスログ
ConoHa WING管理画面 → アクセスログ
ロリポップユーザー専用ページ → アクセス解析
AWS EC2 / VPSSSH で /var/log/httpd/ または /var/log/nginx/ から取得

ログ形式はほぼ Combined Log Format(Apache/Nginx 共通)なので、本手順をそのまま適用できます。


関口拓人

ログは “過去の真実” が残る唯一のデータ。GA4 や GSC を後から導入しても過去分は拾えません。取得設定は今すぐやっておくのがおすすめ!

Step 2 : 「AI 流入」を見分けるルール

判定としては以下のようなコードにtextが入っているものがそれにあたります。これはAIOなどに引用されているとつくパラメーターです。

https://www.google.com/url?...&text=...

1 行のログ例(改行は説明用)

123.123.123.123 - - [07/May/2025:13:45:12 +0900] 
"GET /example HTTP/1.1" 200 1024 
"https://www.google.com/url?q=https://yourdomain.com/example&text=要約..." 
"Mozilla/5.0 ..."
抽出すべき項目用途
IP アドレス/日時量的把握・時系列
リクエスト URL流入先ページ
ステータスコード成功/失敗 判定
リファラ (Referer)流入元判定
User-Agent原則フィルタ不要(PC/モバイル両対応のため)

関口拓人

text= は生成 AI が返す要約テキスト断片を渡すパラメータ。今後変わる可能性もあるため、定期的にサンプリングして新しいシグナルがないか確認しましょう。

目次

▼ GPT だけで完結させる(非エンジニア向け)

  1. ログから リファラ列 だけを抜き出す(メモ帳で置換・削除でも可)
  2. ChatGPT に下記プロンプト+リファラ一覧を貼り付ける
以下のリファラ一覧には Google 検索経由の URL が含まれています。
「text=」パラメータを含む行は AI オーバービューからの流入と考えられます。

1. 該当件数のカウント
2. 最も流入が多いページ TOP5
3. 日時別の流入傾向
4. ステータスコード別の分布(わかる範囲で)
5. そのほか顕著な傾向

を教えてください。

メリット : コード不要ですぐに傾向把握

デメリット : 定量集計や大量ログ処理は手間

関口拓人

GPT は大量データの精密集計は苦手ですが、傾向の言語化が速い!
「ざっくり流入割合」「ユーザーの動機の仮説」など、アイデア出しに最適です。


▼ Python で定量分析する(エンジニア向け)

import re, pandas as pd

log_file = "access_log"          # ファイル名は適宜変更
pat = re.compile(r'"[A-Z]+ [^"]+" \d+ \d+ "([^"]*)"')

referers = []
with open(log_file, encoding="utf-8") as f:
    for line in f:
        m = pat.search(line)
        if m: referers.append(m.group(1))

df = pd.DataFrame(referers, columns=["referer"])
ai_df = df[df.referer.str.contains(r"google.*text=", case=False, na=False)]

# 出力して Excel で可視化
ai_df.to_excel("google_ai_overview.xlsx", index=False)
print(f"AI 概要流入: {len(ai_df)} 件 / 全体: {len(df)} 件")

メリット : 日別・ページ別・IP 別など自由にピボット/グラフ化

デメリット : Python 実行環境が必要


Step 3 : 分析結果の活用

  • GSC に現れない検索流入 を把握し、流入拡大のヒントに
  • AI 概要に引用されやすいページの特徴を抽出 → コンテンツ改善
  • エラー率や滞在時間と組み合わせ、UX 改善指標として利用

まとめ

  • text= パラメータ付きリファラは AI オーバービュー流入の最有力シグナル
  • コードを書かなくても GPT だけで傾向分析は可能
  • 大量データや時系列分析には Python での抽出+ Excel が便利
  • PC/モバイルの UA フィルタは不要 ─ AI 概要は両方で表示されるため

生ログ × GPT / Python の二段構えで、従来見えなかった検索流入を味方につけましょう。

そのお悩み、私たちが解決します!

マーケティングに関するお困りのことがございましたら、お気軽にご相談ください。

  • SEOによる集客に関する悩み
  • 広告運用(リスティング・ディスプレイ)に関するお悩み
  • 広告マネタイズのお悩み
  • 新規事業立ち上げ・設計のお悩み
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

関口 拓人のアバター 関口 拓人 代表取締役

早稲田大学卒。学生時代、月間数千万PVのサービスをゼロから立ち上げ、株式会社ゲームエイトの立ち上げにマーケターとして参画。2015年株式会社現リクルートに入社後、医療系ECサイト・メディア事業の広告運用・SEOなどを担当。2016年に株式会社ゲームエイト執行役員就任、月間3億PVサイトのSEO・収益改善などを担当。2018年株式会社インフラトップ にて、マーケターとしてプログラミングスクールの集客改善。株式会社ハウクレイジー代表就任後、月間数千万円売上サイトの自社サイト立ち上げや累計30サービス以上のマーケティング支援などコンサル事業を提供。

目次