NodeJS做一个小爬虫出现乱码问题

2018-03-01 23:18:12

问题

目标站点的编码是:GBK的,用NodeJS爬取的时候,用

console.log(body);

出现乱码的情况?

还有就是我用的cheerio解析HTML,然后打印:

console.log($('body').html());

后中文变成了:

��������

自己也百度了下,但是一直找不到好的解决方法,或许是我描述的不够准确。


解决方法

建议你看下我的文章 http://www.cnblogs.com/zichi/p/5157887.html 和 http://www.cnblogs.com/zichi/p/5135636.html

99% 能解决你的问题


  • 2018-10-10 14:29:01

    php header()函数设置页面Cache缓存

    ​ header()函数在php的使用很大,下面我来介绍利用它实现页面缓存的一些方法,但使用header前必须注意,在它之前不能任何输出,包括空格。

  • 2018-10-11 23:58:07

    Linux实例带宽和CPU跑满或跑高排查

    使用云服务器 ECS 时,若出现服务的速度变慢,或 ECS 实例突然断开,可以考虑服务器带宽和 CPU 是否有跑满或跑高的问题。若您预先创建报警任务,当带宽和 CPU 跑满或跑高时,系统将自动进行报警提醒。Linux 系统下,您可以按如下步骤进行排查:

  • 2018-10-15 09:22:07

    使用epublib解析epub文件(章节内容、书籍菜单)

    前阵子在android上解析epub格式的书籍。发现了这个开源的epub解析库。相关资料甚少!折腾了一阵子,发现其实光使用的话还是挺简单的。真是萌萌哒~下面简单介绍一下epublib。