その他

ChatGPTから引用されているか確認する方法

ChatGPTから自社サイトが引用されているかを確認するには、ターミナルを使ってGPTUser(ChatGPT-User)からのアクセスを分析する必要があります。

この記事では、エックスサーバーのサーバーパネルからログをダウンロードしてChatGPTからの引用を確認する方法を解説します。

ChatGPTから引用されているか確認する方法

ChatGPTから引用されているか確認する方法は、以下の2ステップです。

  1. サーバーのログをダウンロードする
  2. ターミナルを使って確認する

1. サーバーのログをダウンロードする

エックスサーバーのサーバーパネルから「アクセスログ」をクリック。複数のドメインを登録してる場合は、次の画面でログを取得したいドメインを選択します↓

アクセスログを取得したい日付を選択し、ダウンロードをクリックします↓これで対象ドメインのアクセスログがダウンロードできました。

アクセスログのダウンロード方法は、サーバーによって異なります。エックスサーバー以外のサーバーをお使いの場合は、それぞれのヘルプ記事を参考にしながら行ってみてください。

2. ターミナルを使って確認する

2.1 ターミナルを起動する

Macを使っている場合は、画面右上の虫眼鏡マーク「Spotlight検索」から「ターミナル」と検索してターミナルを起動させましょう。

※Windowsの場合は、コマンドプロンプトやPowerShellなどと検索してターミナルを起動させてください。

2.2 ログが保存されている場所まで移動する

サーバーログがダウンロードされているフォルダ(ディレクトリ)まで「cd」コマンドで移動します。(※今回の環境では「ダウンロードフォルダ」にログが保存されているので、「cd Downloads/」でダウンロードフォルダまで移動しています)

↑ターミナルに「~/Downloads$」と表示されていれば「ダウンロードフォルダ」まで移動できています。

3. コマンドを入力して解析する

GPTBotのクロールを確認するコマンド

サーバーログが保存されている場所まで移動できたら、以下のコマンドを実行しましょう。

以下のコマンドでGPTBotからのクロールの有無を確認することができます。※”GPTBot”の後ろのファイル名は、自身がダウンロードしたファイルの名称に置き換えてターミナルに入力してください

grep -i "GPTBot" mkanai.info.access_log_20250626

■ GPTBotとは:
定期クロールやインデックス用に訪れるBot。サイトマップや記事全体を計画的に取得する。

以下のような結果が返ってくれば「GPTBotにクロールされた」と判断できます。

biz.mkanai.info 20.171.207.236 – – [29/Jun/2025:06:04:46 +0900] \
“GET /horiemon_2035_future-prediction/ HTTP/2.0” 200 18587 “-” \
“Mozilla/5.0 (compatible; GPTBot/1.2; +https://openai.com/gptbot)”

GPTBotのページ別クロール回数を一覧表示するコマンド

以下のコマンドで、GPTBotのページ別クロール数を一覧で表示することができます。※”GPTBot”の後ろのファイル名は、自身がダウンロードしたファイルの名称に置き換えてターミナルに入力してください

grep -i "GPTBot" mkanai.info.access_log_20250626 \
| awk -F'"' '{split($2,a," "); print a}' \
| cut -d'?' -f1 \
| sort | uniq -c | sort -nr

GPTUserのアクセスをページ別に表示するコマンド

以下のコマンドで、GPTUser(ChatGPT-User)のログの有無を確認することができます。※`”ChatGPT-User|GPTUser”` の後ろのファイル名は、自身がダウンロードしたファイルの名称に置き換えてターミナルに入力してください

grep -Ei "ChatGPT-User|GPTUser" mkanai.info.access_log_20250626 \
| awk -F'"' '{split($2,a," "); print a}' \
| cut -d'?' -f1 \
| sort | uniq -c | sort -nr

■ GPTUser, ChatGPT-Userとは:
ユーザーがChatGPTで質問し、記事をリアルタイムで参照した際のログ。1〜数ページを瞬間的にGETする。

以下のような結果が一行でも表示されれば「ChatGPTの回答生成時に、そのページがリアルタイム取得された(=引用候補に使われた)」と判断できます。

5 /2025/06/llms.txt
2 /horiemon_2035_future-prediction/
1 /robots.txt

引用リンクが実際にChatGPT画面に出るのは、ChatGPT-User経由のケースがほとんどです。

つまり、`GPTBot`が来ても`ChatGPT-User`が来ない場合は、まだユーザーの質問とサイト内のコンテンツがマッチしていない or 競合記事が優先されている可能性があります。