赵荣涛's Archivers

From admin on 2011-04-21 17:10:35

如何建立谷歌新闻站点地图

在讲述建立谷歌新闻站点地图前,先引用谷歌官方网站的一段陈述:

什么是新闻站点地图?



Google 新闻站点地图是一个文件,使用该文件可以控制提交至 Google 新闻的内容。通过创建和提交 Google 新闻站点地图,能帮助 Google 新闻发现并抓取您网站的报道:

如果您的网站是新建的、包含动态内容或需要用户依次点击多个链接才能转至您的新闻报道,那么强烈建议您使用新闻站点地图。

请注意,Google 新闻在排名方面并不会偏向使用新闻站点地图的网站。无论是否存在新闻站点地图,Google 新闻都会使用普通的抓取方法来搜索所有新闻网站(主页和栏目)并将其编入索引。




应该多长时间更新一次我的新闻站点地图?


更新新闻站点地图的频率,应该与您用新新闻报道更新您的新闻网站的频率相同。Google 新闻会以相同的频率抓取您的新闻站点地图和常规网站。

请记住,您只应在新闻站点地图中列出两天内发布的报道。您可以从新闻站点地图中删除发布时间早于两天的报道,但这些报道一般仍会在新闻索引中保留 30 天。

为什么要创建新闻站点地图?


新闻站点地图是 Google 新闻特有的站点地图。网络站点地图与新闻站点地图的主要区别在于,前者不能用来向 Google 新闻提交报道。下面是这两种站点地图之间的一些其他重要区别:

•网络站点地图是您想让 Google 在您的网站上抓取的所有网址的列表,而新闻站点地图只是列出了两天内在您的网站上发布的新闻报道。您不应在新闻站点地图中加入发布时间早于两天的报道。

•Google 站点地图生成器不能用来创建新闻站点地图,因为它会加入与特定新闻报道不对应的网址。

•新闻站点地图必须包含每篇报道的发布日期,即报道首次出现在您的网站上的日期。请一定不要将此日期设置为"当前"时间。我们的新闻站点地图指南会帮助您创建新闻站点地图。




是否应使用特定的格式来创建新闻站点地图?

首先,确保您的网站已加入 Google 新闻。如果未加入,可与我们联系请求加入。

Google 新闻站点地图采用站点地图协议,另外还带有下文定义的 Google 新闻专用标记。下例是采用 Google 新闻专用标记的 Google 新闻站点地图条目:
首先,确保您的网站已加入 Google 新闻。如果未加入,可与我们联系请求加入。

Google 新闻站点地图采用站点地图协议,另外还带有下文定义的 Google 新闻专用标记。下例是采用 Google 新闻专用标记的 Google 新闻站点地图条目:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>http://www.example.org/business/article55.html</loc>
<news:news>
<news:publication>
<news:name>新华日报</news:name>
<news:language>zh-cn</news:language>
</news:publication>
<news:access>Subscription</news:access>
<news:genres>PressRelease, Blog</news:genres>
<news:publication_date>2008-12-23</news:publication_date>
<news:title>A 公司与 B 公司展开并购谈判</news:title>
<news:keywords>business, merger, acquisition, A, B</news:keywords>
<news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>
</news:news>
</url>
</urlset>
资讯专用标记的定义

资讯专用标记的定义



标记
必带标记?
说明




<publication>


<publication> 标记用于指定发表此报道的出版物。该标记必须包含两个下级标记:<name> 和 <language>。<name> 是新闻出版物的名称。该名称必须与 news.google.cn 上的报道中显示的名称完全一致(除附加说明之外的部分)。例如,如果显示在 Google 新闻中的名称是“示例时报(订阅)”,则应该使用名称“示例时报”。<language> 是出版物所用的语言。语言应该是 ISO 639 语言代码(2 个或 3 个字母)。例外情况:就中文而言,简体中文请使用 zh-cn,繁体中文请使用 zh-tw




<access>

如果报道不供人们公开阅读,则是必带标记;否则应该略去
可以使用的值包括“Subscription”或“Registration”,用于说明是否能阅读报道。如果 Google 新闻读者不注册或不订阅也可以阅读报道,则应该略去此标记。




<genres>

如果体裁适用,则必带此标记,否则可以略去
用逗号分隔的属性列表,用于指明报道内容的特点(如“PressRelease”或“UserGenerated”)。关于所有可能值的列表,请参阅 Google 新闻内容属性。内容的标注必须准确无误,以便为我们的用户提供一致的体验。




<publication_date>


报道发布日期采用 W3C 格式,即,使用“完整日期”(YYYY-MM-DD) 或“完整日期加时、分、秒”(YYYY-MM-DDThh:mm:ss) 格式,并带有可选分数和时区后缀。请确保您提供的是报道在网站上发布时的原始日期和时间,而不是报道添加到站点地图的时间。我们的抓取工具可接受以下任意格式:
完整日期 
YYYY-MM-DD(例如 1997-07-16)

完整日期加时和分 
YYYY-MM-DDThh:mmTZD(例如 1997-07-16T19:20+01:00)

完整日期加时、分和秒 
YYYY-MM-DDThh:mm:ssTZD(例如 1997-07-16T19:20:30+01:00)

完整日期加时、分、秒和小数位秒 
YYYY-MM-DDThh:mm:ss.sTZD(例如 1997-07-16T19:20:30.45+01:00)




<title>

否,但是强烈建议
新闻报道的标题。注意:在 Google 新闻中显示标题时,可能会因为空间不足而删减部分内容。报道的标题标记中应只包含显示在您网站上的报道标题,而不应包含作者姓名、出版物名称或出版日期。




<:keywords>


用逗号分隔的关键字列表,用于描述报道的主题。可从(但不限于)现有的 Google 新闻关键字列表中摘录关键字。




<:stock_tickers>


公司、基金或其他作为报道主体的金融实体的证券代码(最多 5 个)的列表,以逗号分隔。主要与财经报道相关。每个证券代码都必须以其证券交易所的名称为前缀,还必须与其在 Google 财经中的条目相符。例如,“NASDAQ:AMAT”(不是“NASD:AMAT”)或“BOM:500325”(不是“BOM:RIL”)。



创建新闻站点地图时,请记住以下要点:

创建站点地图后,将其上传到包含新闻报道的最高级目录中。

后续:明天再写

查看完整版本: 如何建立谷歌新闻站点地图

Tags: