试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

关于自动识别码的建议

作者: 583858587 | 阅读: 42200/1   2013/9/7 9:28:53
 
试用了几次熊猫软件,给我感觉非常不错,不过我在使用到WEB发布这个功能的时候。发布页面的编码:选项里面默认的是“自动识别网页编码”一开始我也没有在意思这个选择按着录像的教程上面也没有自己手动的去选择。就默认了这个“自动识别网页编码”可是等我正我真正测试发布的时候就遇到了发布的文章标题、内容全是乱码的安符,看着有点像繁体字其实不是。是编码的问题。后来我在群里得到了一位朋友的帮助才知道是这个“自动识别网而编码”的问题。原来是不自动识别,要自己人工选择才可以。当然我也没有测试其它的CMS是不是这样的情况。但是我使用的是Destoon程序就存在不自动识别。
若有些程序不能自动识别的话可以在用户选择上面把自动识别编码这个功能取消。
让用户自己手动的去选择。暂时就想到这个方法。下次想到好的方法后在来建议吧!
希望熊猫能改进一下。


2 楼: 测试专用账号 2013/9/7 15:26:36
 
谢谢反馈!


在采集里面,网页编码是个很重要的基本参数。不仅在访问网页的时候,需要依据编码进行解码。在模拟发布的时候,也需要依据编码对发布内容进行编码。

如果发布的时候,网页编码不对,会导致发布结果中的汉字出现乱码。

在熊猫里面,采集时候的页面编码是自动识别的。在熊猫发布里面,发布编码默认也是自动识别的,其原理是在点击分析发布页面的时候,软件自动识别该页面的编码类别,并默认该页面的编码类别就是发布编码。在绝大部分场合下,此处的发布编码的自动识别都是正确的。

在少数场合下,发布编码会产生意外。原因可能是登陆页面的编码和发布页面的编码不一致,而软件首先判断的是登录页面的编码。

这种情况下,手工调整下发布设置界面的发布编码选择就可以了

对于中文网站,绝大部分的网页源码都是utf-8或者GB2312 。因此在手工调整发布编码的时候,只需要在这两个编码之间切换一下,就OK了。


许可量+5万


回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 个人房源信息采集软件 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4