试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

采集内容,但有些网站的内容好奇怪,只能抓到一部分

作者: ppp2 | 阅读: 102013/2   2012/6/19 10:42:57
 

http://www.caas.net.cn/caasnew/ysxw/yw/63990.shtml

  
  

不知道为什么,只能抓到最上面那一行,不知哪里设置的不对。

其他标题,作者,来源,时间,都没问题


2 楼: 测试专用账号 2012/6/19 12:42:32
 
正文部分是一个多语句段落。而你只设置了采集第一个语句。当然不会全部采集到的。

请看一下《常规采集》演示视频。里面有针对段落语句的设置方法。

多语句的段落内容的采集设置,在熊猫里面需要设置两次,分别对段落的第一个网页元素和段落的最后一个网页元素进行同样的采集设置,使用同一个表的同一个字段进行设置。这样系统就能明白你需要采集的是一个段落。

注意,此处的“网页元素”,未必就是字符串,也可能是图片,也可能是视频、动画、内嵌窗口等等所有可以显示的网页元素。

请耐心看一下相关演示视频。

3 楼: ppp2 2012/6/20 11:27:51
 
神人哪,对你无比的崇拜~~


回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 网络信息采集系统 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4