2024年以降、Google 検索に表示される AI オーバービュー(旧 SGE)経由の流入が注目されています。ところが Google Search Console では流入元が可視化されないため、サーバーの生アクセスログ+GPT 解析が頼りになります。
ここでは、レンタルサーバー/VPS/クラウド上の Apache・Nginx ログを対象に、非エンジニア向け(GPTだけ) と エンジニア向け(Pythonも併用) の 2 通りで手順を示します。

AIオーバービューは“検索結果に貼り付く巨大リッチリザルト”のような存在。クリック率も増減するため、ログで把握しておくと順位変動の裏側が読みやすくなります。
Step 1 : サーバーログを取得する
サーバー種別 | 代表的な取得方法 |
---|---|
エックスサーバー | サーバーパネル → アクセスログ |
さくらインターネット | コントロールパネル → アクセスログ |
ConoHa WING | 管理画面 → アクセスログ |
ロリポップ | ユーザー専用ページ → アクセス解析 |
AWS EC2 / VPS | SSH で /var/log/httpd/ または /var/log/nginx/ から取得 |
ログ形式はほぼ Combined Log Format(Apache/Nginx 共通)なので、本手順をそのまま適用できます。



ログは “過去の真実” が残る唯一のデータ。GA4 や GSC を後から導入しても過去分は拾えません。取得設定は今すぐやっておくのがおすすめ!
Step 2 : 「AI 流入」を見分けるルール


判定としては以下のようなコードにtextが入っているものがそれにあたります。これはAIOなどに引用されているとつくパラメーターです。
https://www.google.com/url?...&text=...


1 行のログ例(改行は説明用)
123.123.123.123 - - [07/May/2025:13:45:12 +0900]
"GET /example HTTP/1.1" 200 1024
"https://www.google.com/url?q=https://yourdomain.com/example&text=要約..."
"Mozilla/5.0 ..."
抽出すべき項目 | 用途 |
---|---|
IP アドレス/日時 | 量的把握・時系列 |
リクエスト URL | 流入先ページ |
ステータスコード | 成功/失敗 判定 |
リファラ (Referer) | 流入元判定 |
User-Agent | 原則フィルタ不要(PC/モバイル両対応のため) |



text=
は生成 AI が返す要約テキスト断片を渡すパラメータ。今後変わる可能性もあるため、定期的にサンプリングして新しいシグナルがないか確認しましょう。
▼ GPT だけで完結させる(非エンジニア向け)
- ログから リファラ列 だけを抜き出す(メモ帳で置換・削除でも可)
- ChatGPT に下記プロンプト+リファラ一覧を貼り付ける
以下のリファラ一覧には Google 検索経由の URL が含まれています。
「text=」パラメータを含む行は AI オーバービューからの流入と考えられます。
1. 該当件数のカウント
2. 最も流入が多いページ TOP5
3. 日時別の流入傾向
4. ステータスコード別の分布(わかる範囲で)
5. そのほか顕著な傾向
を教えてください。
メリット : コード不要ですぐに傾向把握
デメリット : 定量集計や大量ログ処理は手間



GPT は大量データの精密集計は苦手ですが、傾向の言語化が速い!
「ざっくり流入割合」「ユーザーの動機の仮説」など、アイデア出しに最適です。
▼ Python で定量分析する(エンジニア向け)
import re, pandas as pd
log_file = "access_log" # ファイル名は適宜変更
pat = re.compile(r'"[A-Z]+ [^"]+" \d+ \d+ "([^"]*)"')
referers = []
with open(log_file, encoding="utf-8") as f:
for line in f:
m = pat.search(line)
if m: referers.append(m.group(1))
df = pd.DataFrame(referers, columns=["referer"])
ai_df = df[df.referer.str.contains(r"google.*text=", case=False, na=False)]
# 出力して Excel で可視化
ai_df.to_excel("google_ai_overview.xlsx", index=False)
print(f"AI 概要流入: {len(ai_df)} 件 / 全体: {len(df)} 件")
メリット : 日別・ページ別・IP 別など自由にピボット/グラフ化
デメリット : Python 実行環境が必要
Step 3 : 分析結果の活用
- GSC に現れない検索流入 を把握し、流入拡大のヒントに
- AI 概要に引用されやすいページの特徴を抽出 → コンテンツ改善
- エラー率や滞在時間と組み合わせ、UX 改善指標として利用
まとめ
- text= パラメータ付きリファラは AI オーバービュー流入の最有力シグナル
- コードを書かなくても GPT だけで傾向分析は可能
- 大量データや時系列分析には Python での抽出+ Excel が便利
- PC/モバイルの UA フィルタは不要 ─ AI 概要は両方で表示されるため
生ログ × GPT / Python の二段構えで、従来見えなかった検索流入を味方につけましょう。