アクションを再試行する

Sunday, April 08, 2018 10:35 AM

「Retry」機能は、特定の条件に基づいてスクレイピングするWebページを再度読み込みます。

 

なぜ「Retry」を設定するのですか?

ページが正常に読み込まれない場合、ページからのデータ取得や次のアクションの実行においても問題があります。この場合、抽出を開始する前にページの読み込みを再試行する必要があります。

 

「Retry」を設定する

再試行の設定は、ワークフローにページ読み込みに関する3つのアクションのみで使えます。「Go To Web PageClick Item」と「Click to paginate

 

 

·  「Retry when」ボックスにチェックして、をクリックすると、条件を設定できます。

Octoparseは特定の条件によって、ページが正常に読み込まれたかどうかを確認します。失敗したら再試行します。

 

 

· 「URL / content / element(XPath)contains」オプションと「Contain / Does not contains」オプションを設定する

通常、読み込みが失敗したら、ページのURL /コンテンツに 「/ errors」、「500 Internal Server Error」、または「Too many requests」のようなメッセージが出てきます。テキストボックスにそのような特定の文字列を条件として入力し、「Contains」を選択して、Octoparseは現在ページにその文字列を検出すると、読み込みを再試行します。

また、ページが正常に読み込まれたときにのみ存在する特定要素のXPathを入力もできます。この場合、「Does not contain」を選択してください。そうすると、設定されたXPathを検出できない場合は、読み込みを再試行します。

をクリックすると、複数の判断条件を追加できます。

 

 

· 「Maximum reload times」と間隔を設定する

ページを無期限に読み込むのを避けるためには、再試行の最大回数を設定する必要があります。最大再試行回数に達すると、読み込みが停止され次のステップに入ります。

 

 

 

関連記事:

複数のページからデータを抽出する 

複数のURLからデータを抽出する 

AJAXを扱う方法 

XPathで要素を見つける 

待ち時間を設定する 

 

 

btn_sidebar_use.png