ナレッジベース
Semrushツールキット
SEOツールキット
サイト診断
Site Audit クロールされたページのレポート

Site Audit クロールされたページのレポート

Site Auditの「Crawled Pages(クロールされたページ)」セクションには、当社のボットによってクロールされたすべてのURLのリストが表示されます。このリストを利用すれば、サイト上のクロールされたすべてのページを調べて、ウェブサイトのステータスをページ単位で簡単に分析できます。

これらのページ属性がSEOで重要な役割を果たす理由とは?
個別のURLレポート
サイト構造ビュー

Site Audit クロールされたページのレポート image 1レポートの要素を以下に示します (詳細については、以下を参照してください):

(1) ページの内部リンクランク

(2) ユニークページビューの数

(3) フィルタメニュー

(4) ビュースイッチ

(5) ページのクロール深度

(6) 問題点の総数

(7) 指標の選択

(8) ページの診断を再実行する

クロールされたすべてのページに関する詳しいデータが表に表示されます。表示されるデータには以下が含まれます:

  • HTTPステータスコード
  • HTMLロード時間
  • マークアップ
  • canonicalタグ
  • サイトマップ上のページの有無
  • バックリンクと発リンク
  • AMP(Accelerated Mobile Page)バージョンへのリンク
  • hreflangの利用状況
  • JSおよびCSSの数とサイズ

このレポートで作業するときは、URLまたはステータス(問題のあるページ、破損したページ、リダイレクト、ブロックされたページ、正常なページ)でページをフィルタリングすることができます。一度に複数のフィルタを結合して、必要とする正確な結果を取得することもできます。

例えば、レポートに2つのフィルタを追加して、問題があり、かつ、Internal LinkRankが70を上回るページ(以下を参照)を見つけた後、ユニークページビューでページをソートして、最も重要なページを最初に修正することができます。

Site Audit クロールされたページのレポート image 2特定のページを再クロールするには、右端の"Re-audit URL"の丸いアイコンをクリックします。そうすると、クローラーがその1ページだけに送られ、問題をチェックします。これは、不必要な量のクロールバジェットを使い切ることなく、サイトをメンテナンスする効率的な方法です。

アカウントのクロールバジェットを見るには、ご自身のアカウントの「サブスクリプションの情報」のサマリーへ移動し、「クロールするページ」をご覧ください。

これらのページ属性がSEOで重要な役割を果たす理由とは? 

ページのクロール深度とは、ドメインのトップページから最短パスを使用して特定のページに到達するのに必要なクリック数です。トップページの深度は0であり、トップページからリンクされているすべてのページの深度は1です。

ウェブサイトの最も重要なコンテンツは、クロール深度を3以下にするのが最適な方法です。

同様に、重要性の高いページをサイトマップに含めると、クローラーがコンテンツを見つけやすくなるため効果的です。

Internal LinkRank(ILR)は、内部リンクされている数とページのクロール深度に基づいて決まります。Internal LinkRankが高いページは、対象ページへの内部リンクが多く、クロール深度が浅いため、アクセスしやすくなっています。

Accelerated Mobile Page(AMP)とは、ユーザーがモバイルデバイスからページコンテンツにより素早くアクセスできるように、読み込み速度の速い簡易HTMLを使用しているウェブページです。

さまざまなバージョンのページがある場合は、canonicalタグを使用して検索エンジンを優先ページへ誘導します。このようにして、同じコンテンツまたは重複コンテンツのランキングに悪影響が及ぶことを回避します。

例えば、同じページの非AMPバージョンとAMPバージョンがある場合は、それらのページを結び付けるリンクタグを使用して、同じページのバージョンが複数あることをクローラーに知らせる必要があります。AMPバージョンしかない場合でも、そのページ自身をポイントするcanonicalタグが必要になります。

hreflangタグは、ページの言語ターゲティングと地理的ターゲティングを指定します。さまざまな国向けにローカライズされたウェブサイトのバージョンがある場合は、オーディエンスが適切なコンテンツを取得できるようにhreflangタグを慎重にチェックする必要があります。 

HTTPステータスコードは、ユーザーの要求に対するサーバーの応答を表します。4xxステータスコードと5xxステータスコードは、何らかのエラーが原因でページが利用できないことを示すため、これらのステータスコードには細心の注意を払ってください。

HTMLロード時間は、ページのHTMLコードを読み込むのに要する時間を示します。ウェブサイトの読み込み速度は、ユーザー体験の大きな部分を占めており、重要なランキング要因です。ページの読み込みが遅い原因は、JavaScript(JS)ファイルおよびCSSファイルが大きすぎるか、多すぎることである可能性があります。

HTMLで適切なマークアップを使用すると、検索エンジンとソーシャルネットワークが、より正確にウェブサイトを特定しコンテンツをインデックスすることができます。

Google Analyticsアカウントを接続すれば、レポートでユニークページビューの数に関する情報を取得できます。最も多く見られているページを特定し、それを最初に修正します。

これらの各属性に関する詳細情報は、Site AuditのStatistics report(統計レポート)で見ることができます。

個別のURLレポート

個別のURLレポートを見るには、表の任意のURLをクリックします。遷移後のページにはクロールしたページの以下の情報が表示されます。
・エラー
・警告
・通知
・内部被リンクの件数
灰色になっている部分にマウスオーバーすると、詳細情報が表示されます。

Site Audit クロールされたページのレポート image 3infoボタンにマウスを合わせると、問題の説明が表示されます。問題をクリックして詳細情報を表示するか、右列のリンクをクリックして同じ問題を抱える他のページがサイト上にいくつあるかを確認することができます。

もしくは、URLの隣の青い正方形と矢印のアイコンを選択して、新しいタブでウェブページを開くこともできます。

サイトストラクチャービュー

Site Structureに切り替えて、ウェブサイトのサブドメインおよびサブフォルダーの概要を取得し、どの部分がより多くの作業を必要とするかを確認します。

Site Audit クロールされたページのレポート image 4Site Auditは、クロールしたページからサイトの構造を作成するため、チェックするページの数を制限した場合、またはウェブサイトの特定の部分を診断対象として選択した場合は、結果が実際のサイト構造と異なることがあります。いつでもキャンペーンの設定を変更して、実態を把握することができます。 

もっと表示する
もっと表示する
もっと表示する