首页 > WORK > Baidu发布互联网新闻开放协议

Baidu发布互联网新闻开放协议

版权声明:本文可以任意转载,转载时请务必以超链接形式标明文章原始出处作者署名本版权声明

Baidu发布互联网新闻开放协议,一个与Google站点地图(Google Sitemaps)类似的应用,可以让网站管理员发布新闻化被动为主动…

PS:百度新闻源只收录经过专业编辑的新闻、资讯,不收录个人信息、Blog、论坛、下载等。

下面是百度新闻开放协议的介绍:

开放协议概述

互联网新闻开放协议是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的新闻信息主动、及时地告知百度搜索引擎。

采用了互联网新闻开放协议,就相当于网站的新闻被搜索引擎订阅,通过百度–全球最大中文搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问网站的新闻,进而给网站带来潜在的流量。

开放协议内容

XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*<document>--标记整个XML文件内容的开始和结束。
*<webSite>--站点地址。
*<webMaster>--技术人员的Email。
*<updatePeri>--更新周期,单位为分钟。搜索引擎将遵照此周期访问该页面,使页面上的新闻更及时地出现在百度新闻中。
*<item>--标记每篇新闻信息的开始和结束。标记内为单篇新闻信息,不包括新闻专题。
*<title>--新闻标题。
*<link>--新闻url地址,与单篇新闻一一对应;若分页的新闻存在多个url,相当于多篇新闻。
<description>--新闻内容简介。
*<text>--完整的新闻正文(仅包含正文文字,不包含html标记、图片链接等其它字符 )。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。
<image>--新闻正文内相关图片;采用绝对地址;若含有多张图片,重复使用该标签。
<headlineImg>--为有可能成为头条的新闻制作的头条图,采用绝对地址。
<keywords>--反映新闻主题内容的一个或多个关键词,关键词之间以空格隔开。此项仅作为参考,检索结果不会完全依赖于此标签中的内容。
<category>--新闻分类, 可以遵循网站自身的分类体系,最好采用一级分类。
<author>--新闻作者,可以为机构或个人 。
<source>--新闻来源,即原创媒体或其它机构 。
*<pubDate>--新闻发布时间,至少须精确到分钟。

推荐的时间格式:年月日小时分钟秒
如:2005-11-09 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 |
2005年11月09日10时37分00秒 | Fri, 09 Nov 2005 10:37:00 GMT

开放协议使用

无论您的网站已经成为百度新闻源,还是尚未被百度新闻搜索收录,您都可以使用此开放协议。
您使用开放协议提供的内容应全部为符合下面《新闻源收录标准》的新闻信息。
互联网新闻开放协议只是原始新闻源收录方式的一种协助和有益补充,而不是完全取代。

新闻源收录标准:
百度希望新闻源多样化,鼓励原创新闻内容,如果您的网站具有大量有价值的新闻内容并能及时更新,且网站服务器稳定、高速,就符合了百度收录新闻源的基本原则。
百度新闻搜索收录的内容包括时政、娱乐、体育、财经、科教文化、社会生活等各类新闻报道及媒体评论,数码产品、房产、汽车等行情资讯及评测,各行业的动态及行情,组织机构的工作动态等;是由专业人士撰写或编辑的中文信息;不包括发布的个人信息、论坛、广告、幽默笑话、写真、下载、多媒体等其它类型、其它语言互联网信息。
您应对您提供的全部内容承担一切法律责任,保证您提供内容的真实性、合法性,并不得侵犯任何第三方的权益。

下面就开始吧!
第一步:创建XML文件
请按遵照上面公布的开放协议内容制作XML文件。

<?xml version="1.0" encoding="UTF-8"?>
<document>
<webSite>www.b9527.net</webSite>
<webMaster>robertb9527</webMaster>
<updatePeri>1440</updatePeri>
<item>
<title>老康之家使用百度新闻开放协议</title>
<link>http://www.b9527.net/?q=node/1023</link>
<description>偶来用一下啦</description>
<text>老康之家:分享快乐!</text>
<image>http://www.b9527.net/i/l/b9527site.png</image>
<headlineImg>http://www.b9527.net/i/l/logo.png</headlineImg>
<keywords>老康 百度新闻开放协议</keywords>
<category>老康新闻</category>
<author>老康</author>
<source>老康</source>
<pubDate>2006-3-31 08:05:00</pubDate>
</item>
<item>。。。。。。</item>
。。。。。。
</document>

其它说明:

支持的编码格式有GB2312、UTF-8、BIG5。
您可以将你网站某一时间段发布的全部新闻放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。
请保持每个XML文件处于按更新周期持续自动更新状态。
每个XML文件至多存放最新发布的100条新闻,无需保存之前的新闻。
请将发布的新闻按照时间排序,即最新发布的新闻在最上端,否则可能有新闻被遗漏。
XML标签内容中的一些特殊字符必须转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的新闻,具体参见下表。

字符 HTML字符 字符编码
和(and) & &amp; &#38;
单引号 ' &apos; &#39;
双引号 " &quot; &#34;
大于号 > &gt; &#62;
小于号 < &lt; &#60;

第二步:验证XML文件
下面的位置提供了帮助您验证XML文件结构的多种工具:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通过验证的XML文件能够使您提供的信息更加标准化,确保您发布的新闻信息不被搜索引擎遗漏。

第三步:提交XML网址
提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及站点名等其它信息提交到http://news.baidu.com/newsop.html即可。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。

分类: WORK 标签:
  1. 本文目前尚无任何评论.