node怎么做爬虫? - 网站

node怎么做爬虫?

分类:Node.js常见问题 · 发布时间:2019-09-09 11:50 · 阅读:1273

node中可以使用egg.js框架来实现HTTP请求,然后通过cherrio模块来读取请求的数据,node中通过require方法引用egg.js和cherrio。

node做爬虫所需环境:

1.node环境

2.egg.js(可以不用框架,自己搭建http请求模块)

3.cherrio模块(用于解析DOM)

在本次的项目我就把数据的爬取写在了service层,而controller层我就主要用于接收客户端的请求。

node爬虫的实现:

1、Controller层代码如下:

1 (2).jpg-600

2、Service层代码如下:

2.jpg-600

3.Cherrio

3.jpg-600

我们用node爬到数据后,就要对爬到的html代码进行解读,读取出我们需要使用的数据。然后通过cherrio将数据拿到,最后返回controller即可。

Egg.js特性

  • 提供基于 Egg 定制上层框架的能力

  • 高度可扩展的插件机制

  • 内置多进程管理

  • 基于 Koa 开发,性能优异

  • 框架稳定,测试覆盖率高

  • 渐进式开发

cheerio:

cheerio 是nodejs特别为服务端定制的,能够快速灵活的对JQuery核心进行实现,工作于DOM模型上,并且解析、操作、呈送都很高效

标签:
node

相关文章

如何设置 nodejs 的环境变量

在前端开发过程中,我们需要对 application 运行的环境进行设置,一般会包括开发环境development,生产环境production,每个环境可以对应不同的一些配置,例如不同环境下请求的地址...

谈谈Node.js与JavaScript的差异

Javascript是一种web前端语言,主要用于web开发中,由浏览器解析执行。Node.js是一个可以快速构建网络服务及应用的平台,是用Javascript语言构建的服务平台。

npm install安装报错怎么解决?

解决方法:1、报“operation not permitted”错误,通过“npm i 包名 --no-optional”解决;2、报“Missing: chromedriver”错误,表示没有安装chromedriver,安装一下即可。

怎么使用npm下载vue.js?

使用npm下载vue.js的方法:1、安装node.js和npm;2、安装cnpm;3、使用命令cnpm install -g vue-cli来安装即可。

vue.js和node.js是什么关系?

vue.js和node.js并没有关系,vue.js是前端框架,算是js的三大框架之一吧,node.js是后端开发语言,同php、java、c#一样的。但是他们可以配合使用。

返回分类 返回首页