NodeJS做一个小爬虫出现乱码问题

2018-03-01 23:18:12

问题

目标站点的编码是:GBK的,用NodeJS爬取的时候,用

console.log(body);

出现乱码的情况?

还有就是我用的cheerio解析HTML,然后打印:

console.log($('body').html());

后中文变成了:

��������

自己也百度了下,但是一直找不到好的解决方法,或许是我描述的不够准确。


解决方法

建议你看下我的文章 http://www.cnblogs.com/zichi/p/5157887.html 和 http://www.cnblogs.com/zichi/p/5135636.html

99% 能解决你的问题


  • 2017-12-05 22:30:02

    php7.0升级php7.2

    看电脑上的教程要备份7.0配置文件以及扩展啥的,我感觉不如卸载干净重新安装

  • 2017-12-06 09:35:10

    分页优化的四种方式

    在大数据量的情况下,原本很简单的分页如果没有处理好,你会发现分页的请求会消耗你大量的数据库时间。如果你遇到了这个问题,文章给了你几个很好的解决的方案。当然,初学者若能看完这篇文章,那么它会指导你写出更具有扩展性的分页代码。