安装
精简版
浏览器渲染版:
1
| pip install "feapder[render]"
|
完整版:
1
| pip install "feapder[all]"
|
三个版本区别:
- 精简版:不支持浏览器渲染、不支持基于内存去重、不支持入库mongo
- 浏览器渲染版:不支持基于内存去重、不支持入库mongo
- 完整版:支持所有功能
使用
AirSpider是一款轻量爬虫,学习成本低。面对一些数据量较少,无需断点续爬,无需分布式采集的需求,可采用此爬虫
创建模板命令:feapder create -s air_spider_test
请选择爬虫模板 AirSpider
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
| """ Created on 2024-03-26 11:57:14 --------- @summary: --------- @author: zhangmingwei """
import feapder
class AirSpiderTest(feapder.AirSpider): def start_requests(self): yield feapder.Request("https://spidertools.cn")
def parse(self, request, response): print(response.xpath("//title/text()").extract_first()) print(response.xpath("//meta[@name='description']/@content").extract_first()) print("网站地址: ", response.url)
if __name__ == "__main__": AirSpiderTest().start()
|