Puppeteer拦截修改返回值

2021-04-15 10:11:17

参考地址 Puppeteer拦截某条url并返回其响应内容(场景和方法) API RequestInterception拦截器的使用

page.setRequestInterception(true)拦截器的使用方法和场景

现附上Puppeteer的Api的链接https://github.com/GoogleChrome/puppeteer/blob/master/docs/api.md

实用场景(没错就是实用):比如我用Puppeteer模拟某个网页,然后我只想抓到这条网页的url的response的内容,或者我需要截图或者生成PDF但是只要文件我就可以过滤掉后缀是图片的url

使用的api:定位到api的链接https://github.com/GoogleChrome/puppeteer/blob/master/docs/api.md#class-request

主要是class: Request 和 class: Response 两大块相结合

官方例子参考1:

await page.setRequestInterception(true);

page.on('request', request => {

request.respond({

status: 404,

contentType: 'text/plain',

body: 'Not Found!'

});

实际使用的例子参考1:

'use strict';

const puppeteer = require('puppeteer');

(async () => {

const browser = await puppeteer.launch({

ignoreHTTPSErrors: true,

headless: false,

args: ['--no-sandbox', '--disable-setuid-sandbox'],

}).catch(() => browser.close);

const page = await browser.newPage();

let response = await page.goto('http://www.google.com');

response.json();// 将response.body 转成json。

console.log(response);

await page.setRequestInterception(true);

page.on('requestfailed', request => {

console.log(request.url() + ' ' + request.failure().errorText);

});

// response.ok(); // 返回一个boolean值如果状态码为200-299则为true, 其他则为false.

// response.status; // 返回状态码

// response.text(); // 返回 response body.

// response.headers // 返回 HTTP headers

await browser.close();

})();

实际参考例子2:

'use strict';

const puppeteer = require('puppeteer');

(async () => {

try {

const browser = await puppeteer.launch({

ignoreHTTPSErrors: true,

headless: false,

args: ['--no-sandbox', '--disable-setuid-sandbox'],

}).catch(() => browser.close);

const page = await browser.newPage();

await page.setRequestInterception(true);

var num = 0;

await page.on('request', request => {

//这就是请求的类型如果是图片类型的话执行abort拦截操作否则continue继续请求别的

if (request.resourceType() === 'image') {

console.log(num + "image: ");

let res = request.response();

console.log(request.url);

console.log(res);

num++;

request.abort();

} else {

// request.respond({

// status: 200,

// contentType: 'text/plain',

// body: 'GOOD!'

// });

console.log("continue")

request.continue();

}

});

// page.on('request', request => {

// if (request.resourceType() === 'image')

// request.abort();

// else

// request.continue();

// });

await page.goto('https://news.google.com/news/');

await page.screenshot({path: 'news.png', fullPage: true});

await browser.close();

} catch (e) {

console.log(e);

}

})();

基本代码注释也很清楚也很容易理解,这是两个比较常用的例子,接下来是实战中更加常用的实用性例子

实际参考例子3(重点):

/**

* 获取拦截某条url内容的

* @param page

* @returns {Promise<any | never>}

async function getResponseMsg(page) {

return new Promise((resolve, reject) => {

page.on('request', request => {

if (request.url() === 'https://test.do') {

console.log(request.url());

console.log("拦截到了这条url然后就该请求了");

page.on('response', response => {

if (response.url() === 'https://test.do') {

const req = response.request();

console.log("Response 的:" + req.method, response.status, req.url);

let message = response.text();

message.then(function (result1) {

results = result1;

resolve(results);

});

}

});

request.continue();

}

else {

console.log(request.url());

console.log("continue");

request.continue();

}

});

}).catch(new Function()).then();

}

稍微解释下上面这个例子,就是拦截拿到内容然后返回代码也清晰不多累赘全是爬坑干货欢迎一起爬坑

2018-10-30 00:16:41

android ToolBar 设置颜色
app:popupTheme——有时候我们有需求：ActionBar文字是白的，ActionBar Overflow弹出的是白底黑字让ActionBar文字是白的，那么对应的theme肯定是Dark。可是让ActionBar弹出的是白底黑字，那么需要Light主题。这时候popupTheme就派上用场了。android:theme 与app:theme——在AppCompat v21里，提供了一个快速方便的方法设置Toolbar的主题，使用app:theme。而新版本22.1.x中，AppCompat 允许对 Toolbar 使用 android:theme代替 app:theme。最好的一点是：它会自动继承父视图的theme ，并且兼容所有APIv11以上的设备。

2018-10-30 10:58:41

gradle读取配置文件
rootProject.ext.dependencies

2018-10-30 14:15:55

2017年GitHub上最火的框架！！！
2017年GitHub上最火的框架！！！

2018-10-31 22:50:30

vector兼容的问题以及注意事项
vector兼容的问题以及注意事项，尤其解决4.4出现崩溃的问题

2018-11-01 22:08:19

Android Toolbar左、中、右对齐
默认的Android Toolbar中添加子元素view是从左到右依次添加。需要注意的是，Android Toolbar为自身的NavigationIcon（app:navigationIcon）最靠右，Logo（app:logo）紧接NavigationIcon、Title（app:title）接续Logo、保留了默认的位置（从左边到右）。这些Android Toolbar保留的系统设置字段将挤压开发者自己安放在Toolbar中的子view，如图所示：

2018-11-04 21:08:02

java中split以"."分割
原来在java中函数split(".")必须是是split("\\.")

2018-11-05 21:06:48

是时候弄清楚getExternalStorageDirectory()和getExternalFilesDir()的区别了
App专属文件 vs App独立文件,app专属文件就是那些只有该app才可以使用的文件，例如专属格式的电子书，app独立文件就是那些不依赖于某特定app的文件，例如照片

2018-11-06 06:42:59

XUtils3框架数据库的基本使用方法
今天给大家带来数据库模块的讲解，现在主流的ORM框架很多，比如OrmLite,GreenDao,Active Android,Realm等等，这些框架每个都有自己的优点和缺点，大家完全可以根据自己项目的实际需求进行选择，下面开始进入今天的数据库模块的介绍。

2018-11-08 17:30:20

PHP时间戳函数(几分钟、几小时前、几天前，今天零点等)
时间戳是我们在时间日期对比时常用到一个小功能，下面我先来给各位介绍strtotime时间戳转换的一些方法与利用它来做一个日期格式化的几分钟、几小时前、几天前的一个实例。

2018-11-13 09:55:24

查看Linux环境下MySQL是哪个进程在链接
查看Linux环境下MySQL是哪个进程在链接