「地下ホテル」の情報をスクレイピングしてみた!

皆さんは中国・上海市の「地下ホテル」を聞いたことがありますか?

今日、中国・上海市に世界で最も海抜の低い5つ星ホテル「インターコンチネンタル上海ワンダーランド(InterContinental Shanghai Wonderland)」が正式開業しました。このホテルは、2002年まで安山岩の採石場だった場所で、深さ88m、幅280mほどの巨大な穴の中に建てられたことから「地下ホテル」や「深い穴のホテル」とも呼ばれています。ホテルは崩れやすく複雑な形をした穴の壁面に建設されたため、構想から完成まで12年かかって、ようやく今年、完成しました。

ソーシャルメディアで大きな話題を集めているこのホテルは今日から宿泊を受け付けますが、初日はすでに予約でいっぱいになっています。宿泊料金は1泊、日本円で6万〜170万円らしいです。

 

開業するに、このホテルの真実はメディアに公開され、世界中の記者たちも惹かれています。日本のメディアが報道した後、多くの日本ネチズンは非常に好評し、一度行きたいと言いました。

 

 

今回はちょうど最近リリースされた新機能:タスクテンプレートを利用して、Twitterから皆さんの「地下ホテル」に対する評価を取得しようと思います。Octoparseの新しいタスクテンプレートは、誰でも簡単にWebスクレイピングを利用できるように設計されています。あらかじめ作成されたタスクテンプレートを使用すると、スクレイピングタスクを設定する必要はありません。すぐに使用できるタスクテンプレートは学習時間を短縮し、すぐにデータを取得できます。

さて、始めましょう!

 

1. Task Templatesの下にある「 +Task」をクリックします。

 

 

2. Social Mediaをクリック、Twitter → Tweetsを選択します。それから「Use template」をクリックします。

 

 

3. キーワード「地下ホテル」を入力します。必要に応じて、Task nameとTask groupを変更できます。

 

 

4. 「Save and run」をクリックして、「Local Extraction」または「Cloud Extraction」(有料版のみ)を選択し、タスクを実行します。

 

 

いかがでしょうか?簡単でしょう!タスクテンプレートを使うと、プログラミング知識の少ない/ない人でも簡単にWebスクレイピングを達成できます。パラメータ(ターゲットページのURL、検索キーワードなど)を入力するだけで、データがどんどん抽出されてきます。この時点で、Amazon、Indeed、Instagram、Twitters、YouTube、食べログなどの多くの人気サイトがカバーされています。皆さんも試してみてください。

 

取得したツイートを簡単に分析したところ、だいたい2種類分けられます。一つは「このホテルすごい、行ってみたい!」で、もう一つは「崩れたり、水没したりなどの恐れがあり、行きたくない」です。皆さんはどう思いますか?

ネチズンの評価とは別に、この「地下ホテル」にもっと詳しいために、メディア側の情報をより多く収集しました。ここでは、皆さんに紹介したいと思います。

佘山は中国の国家レベル森林公園で、上海の裏庭とも呼ばれます。風景が美しくて、毎年数多くの観光客が訪ねてきています。しかし、公園の南側にある採石場がどうもしっくりこない気がします。2006年、シマオグループ(Shimao Group)はこの深い穴を改装し、廃棄された採石場に世界初の5つ星ホテルを建設し、この「傷跡」を世界の注目を集める「ダイヤモンド」に変えようとしました。

複雑な地盤のために工事は難航で、完成まで12年かかり、20億元(約326億円)を費やし、この超豪華なホテルは完壁に完成されました。中国メディアによると、マグニチュード9規模の地震にも耐えられる構造だということで、アメリカのナショナルジオグラフィックチャンネル「NG Megastructures」による「世界の建築奇跡トップ10」の1つに選ばれました。

 

 

すごいと思わない?もし余裕があれば、一度でも行ってみましょう!

 

 

 

 

関連記事:

Octoparse 7.1の新機能を見ましょう!

Twitterトレンド - 新しいiPhoneについて人々が何を話しているか?