试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

前两个个采集正确,后边的都是采集错误

作者: 1gfd24r5 | 阅读: 87270/1   2012/10/6 15:23:50
 
采集信息前两个都正确,为什么后边的都是内容页面分析失败??导入到mdb数据库的,是这个错了么?还有怎么识别 图片化的电话号码,下载文件下来以后改后缀成png格式的可以显示,但是能不能改进下软件?


2 楼: 测试专用账号 2012/10/6 18:21:38
 
1、采集信息前两个都正确,为什么后边的都是内容页面分析失败

模板配置不合适,或者你使用的模板页面不具有代表性。解决方法是使用多模板。针对解析失败的页面URL再次建立一个模板。注意是逐个新增。直到没有内容页面分析失败的提示。

利用熊猫独有的“多模板”功能,可以100%的完整采集所有内容。


2、怎么识别 图片化的电话号码,

图片文字识别功能,暂缺,待增。


3、下载文件下来以后改后缀成png格式的可以显示,但是能不能改进下软件

软件里面可以设置自动更换后缀名。
打开项目高级设置,选中“下载”标签,勾选“更改下载文件后缀名”,并输入“png=gif”,即可。






回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 网站数据采集器 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4