试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

测试1天熊猫采集的感受

作者: fengk | 阅读: 93819/1   2014/7/4 17:01:02
 
之前在网上一直寻找关于网页数据采集的工具,找了很多工具,但是说实话都没有熊猫好用,而且功能很齐全,还有技术支持。偶然在一个论坛看到有网友推荐熊猫,完全不是之前的采集工具连个使用文档都没有可比的,测试了一天,觉得还是有些不方便的地方,希望改善下
1.关于新建搜索项目,选择来源项感觉有点少,新闻来源站点比如搜狐,网易这样的来源应该有的,虽然可以自己手动添加。但是能直接勾选更好
2.存储的格式希望能多样化一点,能实现Excel表格,还有txt文档存储最好了
3.希望采集的数据更加精确规范一点,比如这个时间字段 



2 楼: 测试专用账号 2014/7/4 18:35:11
 
谢谢建议。
第1,第2条可能会考虑。

第3条则是可以做到的。如果是“关键词搜索”模式,则点击打开“更多的自动解析的详细设置”,勾选“时间格式统一为标准格式”即可。


其他场合下,打开时间字段的“结果的修缮>>>”对话框,新增一个修缮规则,选择“时间值修改”,然后输入任意个数值,如输入1“秒”.这样就可以强制将时间内容修改为标准的格式。


当然,对于时间内容字符串太长,包含非时间内容太多,则改“时间值修改”功能,可能也无法识别时间值。此时就需要依据实际情况,在结果的修缮对话框中,新增修缮规则,把时间内容分离出来即可。




回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 网络信息采集 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4