QueryList查找js变量

2020-12-03 16:22:35

下面的方法不错，但是我不知道我哪里出现了问题，没能成功。

所以还是php正则匹配js变量，还是暴力的使用切割字符串的方式，切割两次就出来了。

参考地址 QueryList采集javascript中的内容/采集json字符串/采集AJAX加载的内容

采集网址:http://ql.44i.cc/explore

采集目标:如图

代码：

require 'QL/QueryList.class.php';$url = "http://ql.44i.cc/explore/";//定义个处理方法用于QL回调function fun($content,$key){//在这里可以对采集回来的结果做一些额外的处理//用正则匹配出我们想要的内容if(preg_match('/G_SITE_NAME = \'(.+)\'/', $content,$arr)){return $arr[1];}return $content;}$reg = array("xx"=>array("script:eq(0)","html","","fun"));$data = QueryList::Query($url,$reg)->jsonArr;print_r($data);

采集结果：

例二»

采集网址:http://pad.zol.com.cn/slide/470/4707265_1.html

采集目标:采集ZOL网站数码图集，是一个json字符串，我们需要把它从js里面采集出来并解析成PHP对象，如图.

代码：

require 'QL/QueryList.class.php';$url = "http://pad.zol.com.cn/slide/470/4707265_1.html";//定义个处理方法用于QL回调function fun($content,$key){//在这里可以对采集回来的结果做一些额外的处理//匹配除json字符串if(preg_match('/({.+});/', $content,$arr)){$jsonStr =  $arr[1];//解码json字符串$json = json_decode($jsonStr);return $json;}return $content;}$reg = array("xx"=>array("script:eq(4)","html","","fun"));$data = QueryList::Query($url,$reg)->jsonArr;print_r($data);

采集结果：

例三»

采集AJAX动态加载的内容，这种是最简单的了，完全不需要用到QueryList。

采集网址:http://m.mtime.cn/#!/theater/584/3868/date/

采集目标:采集Mtime时光网影视信息，查看源代码会发现源码里并没有我们想要采集的内容，很明显这种内容是通过AJAX动态加载的，在浏览器中按F12调出开发者工具，很容易就可以抓到AJAX地址，如图

地址为：http://m.mtime.cn/Service/callback.mi?Ajax_CallBack=true&Ajax_CallBackType=Mtime.Mobile.Pages.CallbackService&Ajax_CallBackMethod=RemoteCallbackSameDomain&Ajax_RequestUrl=http%3A%2F%2Fm.mtime.cn%2F%23!%2Ftheater%2F584%2F3868%2Fdate%2F&t=201492815183877392&Ajax_CallBackArgument0=%2FShowtime%2FMovieTimesByCinema.api%3FcinemaId%3D3868%26date%3D20140928&Ajax_CallBackArgument1=

代码：

$url = "http://m.mtime.cn/Service/callback.mi?Ajax_CallBack=true&Ajax_CallBackType=Mtime.Mobile.Pages.CallbackService&Ajax_CallBackMethod=RemoteCallbackSameDomain&Ajax_RequestUrl=http%3A%2F%2Fm.mtime.cn%2F%23!%2Ftheater%2F584%2F3868%2Fdate%2F&t=201492815183877392&Ajax_CallBackArgument0=%2FShowtime%2FMovieTimesByCinema.api%3FcinemaId%3D3868%26date%3D20140928&Ajax_CallBackArgument1=";$jsonStr = file_get_contents($url);$json = json_decode($jsonStr);print_r($json);

采集结果：

2021-08-10 21:16:46

关于ios开发block方法的使用
block，监听，接口

2021-08-13 23:10:31

ios framework中的图片如何访问
特别简单，在主工程设置中，只要resource parse加入那个图片文件夹或者图片目录就可以正常访问了

2021-08-13 23:15:04

最新iOS APP打包上传到AppStore教程
作为一名iOS开发者，把辛辛苦苦开发出来的App上传到App Store是件必要的事。但是很多人还是不知道该怎么上传到App Store上，下面就来详细讲解一下具体流程步骤。

2021-08-21 22:09:29

图片资源不显示 svg读取报错
复制进去的文件或者图片，需要add功能才能正常使用

2021-08-23 22:04:00

iOS上架注意事项
ios上架注意事项

2021-08-26 09:11:42

“vue-style-loader” 跟 “style-loader” 区别
但是我选择了vue-style-loader

2021-08-26 09:17:40

vue-template-compiler must be installed as a peer dependency, or a compatible compiler implementatio
后来发现是vue和vue-template-compiler版本不一致导致的，重新下一个同版本包就可以了

2021-08-26 09:25:47

vue加载JSON文件的两种方式
import data from 'static/h5Static.json'

2021-08-26 16:34:13

vue-echarts 'createElement()` has been called outside of render function.
添加VueCompositionAPI解决

2021-08-27 08:40:06

ReferenceError: regeneratorRuntime is not defined
原因是不能解析async … await 等高级语法