【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）-白红宇

【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）

阅读量：669 次

发布时间：2019-03-15

本文共 667 字，大约阅读时间需要 2 分钟。

PyCharm调试Scrapy常用的命令配置方法

Scrapy是一个强大的网页抓取框架，在PyCharm中调试Scrapy项目可以帮助开发者快速定位问题。以下是两种常用的调试方法：

第一种模式：使用scrapy.cmdline的execute方法

这种方法在项目根目录下创建main.py文件，配置相关调试参数。具体步骤如下：

在项目根目录下找到scrapy.cfg文件，创建同级目录下的main.py文件

在main.py文件中输入以下代码：

from scrapy.cmdline import executeimport sysimport ossys.path.append(os.path.dirname(os.path.abspath(__file__)))

在需要调试的爬虫文件中设置断点，运行main.py即可在PyCharm中调试

第二种模式：直接使用Scrapy命令

执行单文件调试模式1：

scrapy runspider scrapy_first/spiders/book.py

执行单文件调试模式2：

scrapy crawl spider_name

注意：这里的spider_name是Spider子类的名称属性，而不是文件名

示例：

class Test1Spider(Spider):    name = 'test'    def parse(self, response):        pass

图1：PyCharm调试界面示例

(Demo图展示了如何在PyCharm中设置断点和使用调试工具)

转载地址：http://pimmz.baihongyu.com/

你可能感兴趣的文章

POJ 2391 多源多汇拆点最大流 +flody+二分答案

POJ 2431 Expedition 优先队列

查看>>

Qt笔记——获取位置信息的相关函数

查看>>

POJ 2484 A Funny Game（神题！）

查看>>

POJ 2486 树形dp

查看>>

POJ 2488:A Knight's Journey

查看>>

SpringBoot为什么易学难精？

查看>>

poj 2545 Hamming Problem

查看>>

poj 2723

查看>>

poj 2763 Housewife Wind

查看>>

Qt笔记——模型/视图MVD 文件目录浏览器软件

查看>>

POJ 2892 Tunnel Warfare(树状数组+二分)

查看>>

poj 2965 The Pilots Brothers' refrigerator-1

查看>>

poj 3026( Borg Maze BFS + Prim)

查看>>

POJ 3041 - 最大二分匹配

查看>>

POJ 3041 Asteroids（二分匹配模板题）

查看>>

Qt笔记——标准文件对话框QFileDialog

查看>>

poj 3083 Children of the Candy Corn

查看>>