2016年5月14日土曜日

Webスクレイピング

Webサイトから必要な情報だけを抽出して、整形し直すことをスクレイピングというそうです。
Yahoo ファイナンスなどスクレイピングを禁止しているサイトもあるので注意が必要ですが、手動でデータ抽出に時間と手間がかかる時には有効なテクニックですね。

今回は「PythonによるWebスクレイピング入門」を参考にして、スクレイピングをやってみようと思います。

メモ:
クローリング:Webページのリンクをたどる。クローリングするプログラムはクローラーやスパイダーと呼ばれる。
スクレピング:もともとの意味は削る。

0 件のコメント:

コメントを投稿