试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

请教:我只想采集页面上的链接所在文字及其链接地址,请问如何能做到?

作者: danzui | 阅读: 71184/4   2013/12/1 0:23:23
 
如题


2 楼: 测试专用账号 2013/12/1 11:18:21
 
一、打开项目高级设置对话框,“采集”标签下,“设置”栏目尾部,勾选“需要采集列表页面链接所辖的内容”。同时也需要勾选上方的“显示内容页面的URL”。

二、然后返回常规设置窗口,选择“选择内容页”标签,此时在“方式1:直接指定内容页面的链接”下方会多出一个按钮,需要同时采集该链接所辖的内容。勾选该项。

三、在“内容页面模板管理”标签中,选择“方式1:使用自定义模板”,并点击“添加新模板”。

在打开的内容页面模板中,就会出现列表页面中,链接所辖的内容(文字、图片等),直接针对列表中显示的内容执行采集勾选。

如果只需要采集列表页面内容,则在内容页面的设置对话框中,不必点击“开始分析”按钮。但此时只采集列表页面内容的时候,必须针对“(入口地址)”
项进行采集入库。因为系统判断数据的重复性,是依据内容页面的网址url来判断的。

如果此处不勾选“(入口地址)”的采集入库,则系统无法知晓内容页面的唯一的url,会导致列表页面的数据虽然采集下来,但无法全部入库。





3 楼: danzui 2013/12/1 18:55:40
 
请问,“(入口地址)”的采集入库在何处勾选?

4 楼: 2013/12/1 21:26:08
 

 “(入口地址)”,在“内容页面设置”对话框的左边列表中,在该列表中“父页面”内容的后面

5 楼: 测试专用账号 2013/12/1 21:27:19
 
“内容页面设置”对话框指的就是“自定义模板”设置窗口。


回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 简历采集软件 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4