试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

功能建议

作者: soldier | 阅读: 57011/3   2012/6/7 16:24:20
 
1、设置采集标识,本条数据 未采集,已采集,未发布,已发布,这样就能分清数据是否采集,是否发布了;

2、熊猫的发布功能只有模拟发布吗,我只看到这一个,如果是,就太少了,建议发布到本地的数据库;

3、在新建采集项目时   数据库设置 ---- 采集结果默认存储数据选择与设置 中 在该采集项目中新建文件夹,将采集回来的数据保存在项目文件夹中,这样也方便查询,在选择数据库

类别后,自动在该文件夹中建立数据库存储文件,而不是相现在一样自己设置,这样对新手来说就比软简单,操作也就变得简单了,还有就是 采集数据中数据表中的字段,能不能改为

自己设定字段名称啊!这样在发布文章的时候才能很快的那一个字段是存储的是什么内容啊。对于采集和发布字段内容较多的情况下,真的是很难找。

4、增加一个数据库类别,自定义的 .xml 或者是文件等等 之类的保存方式吧!大数据量保存读写时access读写慢又占CPU和内存。可以有人会说,那就用sql,sql对新手来了,确定很

难,可以会用的人都会觉得麻烦吧!还说一下access保存的不足吧:对一些外语不能保存,保存也是些(??)号或乱码,比如:韩文、法文等等.

5、采集中下载附件时,增加断点续传功能,采集文章时增加与文章附件 设置 是否同步或异步下载附件;发布文章和FTP 上传时也要增加设置 是否同步或异步上传附件;如果是不想下

载附件的文件,做到能探测到该附件下载的真实地址,最要是也在破解防盗链附件的真实地址探测;还有就是迅雷快车等地址的破解保存下载等,这些功能应该多借鉴一下现在比较火的

采集器功能,差不多也是一般站长能用到的功能。

6、采集回来数据的优化,只看到一个伪原创(seo)没有仔细看这个功能 ,最好是能将优化的规则导入导出,因为对一个站来原,优优的内容对每一条采集规则可能都差不多,要是对

每一条采集规则都手动,就太麻烦了。

7、对数据采集错误,失败、未采集、发布败等内容,做到能查询等,方便查找原因和错误。

8、增加对验正码的自动识别,我还有没有发布过文章,不知道模拟发布是有没有随机数据字段,这个不能少,一般cms好想都有随机发布值 。

9、还说一个,把采集功能与博客、、空间、微博、论坛、cms等主流的群发功能,功能就不详细说明了,这样就能帮助站长采集内容,优化内容,发布外链,这可能也是站长们想要的,

如果做出来了可能也一项卖点吧!

10、再说一下吧,如果熊猫要想在采集这个行业提高知名度,可能以现在的功能方式还不行,要想提高知名度首先要对一般采集的站长需要的功能进行开放 ,让他们经常使用,习惯使

用熊猫采集软件。不要限制采集发布数量,虽然现在站长可以 以其它方式,增加采集量,但对这些站长来说还是不够量,比较繁琐,没有几个站长会长期来为了扩增采集发布 的数据量

,因为现在的免费采集的太多了,功能也都差不多。
   
   对软件的购买者还是要看好高端的采集站长和对功能要求比较高的用户。
   
   就写这些了,本人写作水平有限,可能有些地方会看不懂,还请详解!


2 楼: 测试专用账号 2012/6/7 18:42:38
 


谢谢感谢你总结的众多建议,我们已经认真阅读。已经给你的账号增加50万采集上限。

你总结的问题具有一定的代表性,在此一并做个解答。

熊猫采集的特色远非只是操作简单,关键的还是功能全面、强大、复杂。你所阐述的内容,很多是具备的。

1、这个建议很好。以后还要增加数据的在线编辑功能,熊猫V1.3版本中可能会添加这些功能。

2、数据发布到本地数据库,这个功能是有的,而且是熊猫的基本功能。在项目基本设置中,可以选择自己的数据库,目前支持access,mysql mssql。采集的数据直接入库。且不需要用户自行编写复杂的SQL写入语句,其数据库管理操作过程完全由系统隐含完成。

3、这个功能也是有的。系统会为每个采集项目新建一个专属文件夹,用于存储采集结果数据库文件data.mdb,项目日志文件logNote.mdb,以及项目中下载的文件等。

由于微软的access小型数据库,不能通过软件直接修改表中字段的名称,需要变通实现,比较繁琐。所以一直没有增加这个字段名称修改的功能。以后会积极考虑增加上。

4、xml、csv格式等数据保存格式,可以在access数据库中选择“另存为”可变通实现。就实际经验看,access在数据量达到2G之后会,采集时会产生数据存储管理意外。1G以内目前都比较顺利。对于海量数据,除了专业的数据库引擎外,其它数据格式更是难以应付。且在更新采集访问时,重复采集的数据存在覆盖、更新等必要操作,因此必须是针对数据库引擎才有可能实现。直接存储xml,text,scv等文件格式均难以实现数据的更新操作。

5、嗅探附件下载的真实地址,这是软件隐含的基本功能,只是没有特别介绍。大型附件的下载等,软件确实需要对此进行系统性的考虑。由于开发时间的原因,这个问题被延迟了。

6、直接加载其它项目的内部配置结果,这个需求很多用户都反应过,以后版本会尽快加上。

7、系统有详细的日志输出,在软件主界面有个“运行日志”标签可以查看最新的日志。每个项目都有一个专属的日志文件logNot.mdb。里面有项目相关的详尽日志输出。包括采集数据过程的错误、失败、发布失败等等。

8、验证码识别功能正在筹划中。目前网络上有开源的验证码识别下载,被很多软件直接采用。只是这个开源的验证码识别的功能不尽人意,所以我们会自行开发熊猫特色的验证码识别功能模块。只是由于时间关系,估计要到下半年或者年底才能实现。

8.2、随机数据字段。软件有这个功能。在项目高级设置对话框中,“字段默认值”标签内。里面可以设置较复杂的随机值。如果说是发布模块中,对于随机值字段的“自动取值”功能。这在软件中已有,为基本功能。


9、这个不能有。熊猫不会开发和实现灌水机类似的功能。


10、目前版本的熊猫采集软件免费版,是全功能的。功能上没有任何限制。仅限制采集时访问页面的总量的上限。谢谢你对于熊猫软件的营销策略的建议。只是营销策略必须要兼顾方方面面,我们也一直在探索和调整合适的方案。


很多类似软件的功能介绍中罗列了很长很长的细节,而熊猫并没有这么做,只介绍了一些特有功能和关键功能。因为熊猫认为有些细节的东西是作为采集软件必备的基本功能,不必去详尽罗列,因为这会很长很长......。许多技术性的功能在软件内就隐含进行实现和自动判断了,在软件设置界面上都没有留下痕迹。


再次衷心感谢你的建议!



3 楼: soldier 2012/6/7 21:49:05
 
写这么多没几个用得上的,唉!

隐藏的功能为什么不打开呢?

4 楼: 2012/12/20 22:20:59
 
采集下来的文章可以可以导出来呢?比如倒出来wod文件或者txt文件?


回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 网络采集软件 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4