试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

咨询一个问题

作者: huntall | 阅读: 194267/2   2013/1/30 22:18:22
 
咨询一个问题:例如http://www.tjconstruct.cn/shchxt/tonggao.doc/epr_zbgg/2013/ZBGG0004[2013]0158.htm 这个页面 整个页面是内容页面,但是时间、标题、期限等都在一起 如何处理啊?就是说标题等字段都在内容里 如何分离呢?




2 楼: huntall 2013/2/1 1:22:12
 
谢谢远程指导!

3 楼: 测试专用账号 2013/2/1 10:55:51
 
这个页面确实有点典型。页面是由后台编辑人员自由编辑排版的,格式大致一致但略有区别。有些关键内容在页面中不容易找到,如“截止时间”“施工单位”等。


但这些信息在“标题列表页面”中都有明确的展示:http://www.tjconstruct.cn/zbxx.aspx?page=2  

因此这些关键信息可以直接从“标题列表页面”中获取。具体设置方法:

1、打开项目的高级设置对话框,选中“采集”标签,并勾选“需要采集列表页中链接所辖的内容”。

2、返回项目修改设置对话框,选中“选择内容页”标签,确认内容页面引导方式为方式1。勾选下方的“我需要同时采集该链接所辖内容”(只有先设置前面1,此处复选按钮才会出现,否则隐藏的)

3、打开内容页面设置对话框,此时在内容页面的内容列表的前面,会出现列表页中所辖的内容,其可见性属性一律标准为“父页面的内容”。按常规的采集设置方法进行采集设置即可。



回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 微信采集软件 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4