试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

找不到网页真实地址

作者: ljb | 阅读: 42155/4   2016/3/15 19:28:31
 
http://www.tyztb.com/XXFB/XXFBList.aspx?ModuleIndex=2&type=13
这个网页的内容都是空白,翻页也是,怎样才能找到真实的地址,谢谢了


2 楼: 管理员 2016/3/16 9:37:08
 
这个网站采用了一种比较特别的ajax传值格式。无法模拟实现。只能变通实现采集:直接通过遍历ID值,来直接访问内容页面。


比如其中某一个内容页面的网址为:
http://www.tyztb.com/XXFB/XXFBView.aspx?id=12257&gcbh=R20160210006&ModuleIndex=2&type=13

id=12257就是信息的ID编码。将这个网址输入到“标题列表页及其翻页设置”中的入口网址输入框。并设置一个自定义变量替换这个id值:

http://www.tyztb.com/XXFB/XXFBView.aspx?id={穷举值}&gcbh=R20160210006&ModuleIndex=2&type=13

然后在下一步的“选择内容页”中,选择第四项:直接使用列表页网址即可。

有点奇怪的是这个内容的网址有两种格式,另外一种的ID值竟然是负值:

http://www.tyztb.com/XXFB/XXFBView.aspx?id=-4148&gcbh=%u592A%u539F%u5E02%u8F68%u9053%u4EA4%u901A2%u53F7%u7EBF%u4E00%u671F%u5DE5%u7A0B%u7532%u63A7%u6750%u6599%uFF08%u94A2%u6750%u3001%u5546%u54C1%u6DF7%u51DD%u571F%uFF09%u540D%u5F55%u5E93%u62DB%u6807%u516C%u544A&ModuleIndex=2&type=13

因此你需要针对这个网站建立两个项目,和前面的设置类似,这个页面的翻页设置为:

http://www.tyztb.com/XXFB/XXFBView.aspx?id=-{穷举值}&gcbh=%u592A&ModuleIndex=2&type=13



3 楼: 管理员 2016/3/16 9:37:48
 
这个网站已经列入我们待处理网站中,感谢反馈。已经给你账号增加10万积分作为奖励。

4 楼: ljb 2016/3/16 14:02:24
 
感谢管理员回复

5 楼: 2016/4/27 22:05:42
 
http://www.wanghongshequ.com/这个网站已经弄好好了感谢熊猫,呵呵


回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 网站电话采集 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4