<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%> 列表页设置帮助_新手指引
采集设置操作的新手指引 字体: 帮助目录 词典

列表页设置:
在当前设置环节,主要是对标题列表页的翻页行为进行配置或指定。(从列表页面到内容页面的配置与指定,将在下一步页面内进行设置。)
所谓“列表页”,全称“标题列表页”,是指在该页面内,罗列有被采集内容的标题的页面(点击该标题的链接可以访问该标题的内容所在页面)。采集时,通过对“列表页”的翻页访问,实现访问所有的内容页面。
例如:“新浪国内新闻”的列表页面为:http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_1.shtml 。而这个页面http://news.sina.com.cn/china/ 则不是标题列表页面,因为后者没有翻页功能。
对标题列表页的(翻页)设置是采集项目配置的关键设置之一。在配置本采集项目之前,用户需要熟悉被采集网站的逻辑架构,并找到标题列表页面所在。所有的采集项目(或采集软件)均是如此。
在完成对“列表页”的设置后,点击本窗口左下的按钮,进入下一个设置环节:“(标题)列表页向内容页页面的引导设置”
在当前列表页设置环节:
必须设置的地方:

应该设置的地方:
可选设置的地方:


熊猫采集的采集项目设置,需要逐步进行,因为后面的配置依赖于前面的设置结果。
熊猫采集是采集软件的换代产品,其工作模式、设置方法与您使用过的任何采集软件都不同。因此首次配置项目时请参考新手指引。
一旦熟悉了熊猫的配置和工作机制,则操作和采集配置过程就会非常轻松、简单、便捷。
配置采集的配置思路很常规:通过翻页来遍历访问“标题列表页面”,进而访问所有的“内容页面”,在内容页面内来采集您需要采集的内容。
熊猫致力于追求所见即所得。通过鼠标点选看得见的网页内容即可完成对采集项目的配置。系统会记录用户的点选操作结果,并据此完成对采集项目的配置。
在项目设置窗口的右上方有实时动态帮助窗口,对每个设置选项都有详细说明。
在配置项目时,点击项目配置窗口上中位置的按钮,可以随时打开本帮助页面。


熊猫采集软件的设置流程:
  • 基本准备工作:
    1. 明确需要采集什么内容,从哪儿采。
    2. 明确采集的结果数据需要存储在哪儿,用什么存储。
    3. 熟悉被采集网站的逻辑架构,找到标题列表页面内容页面
  • 配置采集:
    1. 点击软件主界面菜单:“项目管理”-“新建项目”,新建一个采集项目。并依次设置:
    2. 项目基础设置(少数项目在此处需要打开设置界面下方的“高级设置”对话框。配置高级属性,新手略)
    3. 数据库设置
    4. 文件下载设置(默认情况下不用设置此项)
    5. 设置标题列表页页面翻页的方式和方法
    6. 设置标题列表页面向内容页面过度方式和方法
    7. 设置内容页面,配置需要采集的网页内容。并在内容页面模板管理窗口对定义的内容页面模板进行管理。
    8. 保存设置。完成采集项目的配置。
  • 试运行:检查运行的采集结果。依据采集运行结果,检查是否需要修改项目配置。

请问本帮助内容对你有帮助吗?是否还有费解地方?请在此反馈给我们,以便我们改进。谢谢!