1、首先,cheerio在github开源,通过查看文档可以了解基本用法。
2、假设在文件夹下已韦蛾拆篮经用npm init初始化。首先使用npm install cheerio命令安装包。(如果需要维护package.json等信息可以加--save参数)
3、接下来,使用如图代码,cheerio.loa蟠校盯昂d即可解析一个html字符串。然后可以用类似jquery的语法获取元素,调用each来依次处理每个元素等等。
4、cheerio.load函数也可以对一个使用each遍历时的元素调用,如图所示。这样可以层级的获取子元素。
5、最终效果我们可以看到,一个如图层次的html结构,使用上述代码可以提取需要的数据。