试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

这个页面的电话号码如何采集到啊?

作者: huntall | 阅读: 58954/3   2013/1/19 0:09:50
 
http://www.dg688.com/post/zhaopin/340331x.html

电话是图片
这里图片地址能采集到,但站点设置了不能直接输入网址查看。
像这样的站点很多,该如何处理啊?


2 楼: huntall 2013/1/19 0:18:13
 
选择下载该图片后,下载的也不是图片,而是ASP乱码文件。 这个很关键啊。

3 楼: 测试专用账号 2013/1/19 12:07:14
 
1、这里图片地址能采集到,但站点设置了不能直接输入网址查看。

这需要带上cookie进行访问,就可以下载该图片。可以勾选高级设置中“使用动态cookie”。

2、选择下载该图片后,下载的也不是图片,而是ASP乱码文件。

同样在高级设置中,“下载”标签中,勾选“更改下载文件后缀名”,并输入:asp=bmp  

3、结果是乱码文件。

这个网站对电话图片的加密做的比较巧妙。输出的图片使用了网页代码压缩模式,因此直接下载到的图片是压缩文件格式。

在熊猫里面,网页访问和文件下载,使用了不同的解决方式,网页访问中遇到网页压缩的,会自行判断并自行解压缩。

而文件下载中则不适宜直接判断和解压缩文件,因为有些下载文件可能会很大,几百M或多少G。因此不适宜使用自动解压模式。

这个网站做的很巧妙,通过网页的形式实现下载文件的加密。以前不曾遇到,也不曾考虑到。软件已做了改进,下次更新软件时会解决类似这个下载文件自行解压的问题。

会在1个星期内更新新软件。

 


4 楼: huntall 2013/1/19 12:36:09
 
呵呵 好


回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 在线文章采集系统 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4