diff --git a/pages.ja/common/scrapy.md b/pages.ja/common/scrapy.md new file mode 100644 index 0000000000..63251698d9 --- /dev/null +++ b/pages.ja/common/scrapy.md @@ -0,0 +1,32 @@ +# scrapy + +> ウェブクローリングのフレームワークです。 +> 詳しくはこちら: . + +- プロジェクトを作成する: + +`scrapy startproject {{プロジェクト名}}` + +- スパイダーを作成する (プロジェクトのディレクトリ内での実行): + +`scrapy genspider {{スパイダー名}} {{ウェブサイトのドメイン名}}` + +- スパイダーを編集する (プロジェクトのディレクトリ内での実行): + +`scrapy edit {{スパイダー名}}` + +- スパイダーを実行する (プロジェクトのディレクトリ内での実行): + +`scrapy crawl {{スパイダー名}}` + +- Scrapyが見るようにWebページを取得しソースを`stdout`(標準出力)に表示する: + +`scrapy fetch {{url}}` + +- Scrapyが見ているようにデフォルトブラウザ内でウェブページを開く(より応答に忠実であるようにするためにJavaScriptを無効化している): + +`scrapy view {{url}}` + +- URL用のScrapyシェルを開き、Python(もしくは可能であればIPython)シェル内でページソースとの対話式でのやり取りを可能にする: + +`scrapy shell {{url}}`