试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

领导好,这种采集不到,我用小号发

作者: 天圣医贸 | 阅读: 2934/1   2020/5/8 6:06:01
 
http://www.spzs.com/listcompany/pgid_1_city_beijing.html
1这些翻页的我都会,但是就是,抓取不到内容页面
只能抓取前几个,标题和内容如何采用{<_medi_>}这样采集啊

想采集企业名称,经营范围:企业简介

<div class="cont" > 
 <div class="rightText2"  >简介</div> 
                         
<div class="cl"></div> 
麻烦指导,抓取的简介里说的不是很明白,看不懂,谢谢


2 楼: 管理员 2020/5/8 9:20:42
 
你好!

针对你提供的网址,我们测试了一下,该网站的采集,还是比较常规的,没有什么特别难点。你可能需要看看演示视频,掌握一下软件的基本操作。http://www.caijiruanjian.com/down/yanshi.asp

该网站的 翻页、选择内容页(的链接),内容页模板设置,都是比较常规的操作,不需要使用你提到的中介方式。

只是有一点需要注意的地方,该网站内容页存在多个不同的模板,在设置模板的时候,对应的也需要增加多个模板,才能确保结果完整。




回复
 
 
 
验证码:
 
友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 招标信息监控 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4