ページレベルのデータを抽出する

Sunday, April 08, 2018 9:25 AM

このチュートリアルでは、Octoparseを使ってWebページのURL、ページタイトル、メタ説明、キーワードなどのページレベルのデータを抽出する方法を説明します。

 

OctoparseでページURL、ページタイトル、メタ説明、キーワードを抽出するのはかなり簡単です。

1. 「Extract Data」アクションでは、「Add predefine fields」をクリックします。

 

2. 「Add current page information」を選択します。

 

3. 必要なページレベルのデータを選択します。

選択したページレベルのデータが自動的に「Data Field」に追加されます。

 

4. 必要に応じてデータフィールドの名前を変更します。

 

関連記事:

テキスト/URL/画像/HTMLを抽出する

ソースコードからデータを抽出する

 

 

btn_sidebar_use.png