如何建立谷歌新闻站点地图

在讲述建立谷歌新闻站点地图前,先引用谷歌官方网站的一段陈述:

什么是新闻站点地图?

Google 新闻站点地图是一个文件,使用该文件可以控制提交至 Google 新闻的内容。通过创建和提交 Google 新闻站点地图,能帮助 Google 新闻发现并抓取您网站的报道:

  • 加快发现新闻报道的速度:Google 新闻可以通过站点地图快速查找网站中的所有新闻报道。
  • 抓取所有新闻报道并将其编入索引:站点地图可以直接向我们的抓取工具指明每个新闻报道网址,从而确保网站中的内容无一遗漏。
  • 提高提取和显示报道信息的准确度:站点地图可以指明报道标题,以及每篇报道的发布日期。
  • 提高标记报道内容特点的准确度:站点地图使用 <access> 和 <genres> 标记指定各类内容。
  • 用元数据来注释报道:站点地图可以使用相关关键字或股票代码等具体描述,清晰地指明每篇报道的内容。

如果您的网站是新建的、包含动态内容或需要用户依次点击多个链接才能转至您的新闻报道,那么强烈建议您使用新闻站点地图。

请注意,Google 新闻在排名方面并不会偏向使用新闻站点地图的网站。无论是否存在新闻站点地图,Google 新闻都会使用普通的抓取方法来搜索所有新闻网站(主页和栏目)并将其编入索引。

应该多长时间更新一次我的新闻站点地图?

更新新闻站点地图的频率,应该与您用新新闻报道更新您的新闻网站的频率相同。Google 新闻会以相同的频率抓取您的新闻站点地图和常规网站。

请记住,您只应在新闻站点地图中列出两天内发布的报道。您可以从新闻站点地图中删除发布时间早于两天的报道,但这些报道一般仍会在新闻索引中保留 30 天。

为什么要创建新闻站点地图?

新闻站点地图是 Google 新闻特有的站点地图。网络站点地图与新闻站点地图的主要区别在于,前者不能用来向 Google 新闻提交报道。下面是这两种站点地图之间的一些其他重要区别:

•网络站点地图是您想让 Google 在您的网站上抓取的所有网址的列表,而新闻站点地图只是列出了两天内在您的网站上发布的新闻报道。您不应在新闻站点地图中加入发布时间早于两天的报道。

•Google 站点地图生成器不能用来创建新闻站点地图,因为它会加入与特定新闻报道不对应的网址。

•新闻站点地图必须包含每篇报道的发布日期,即报道首次出现在您的网站上的日期。请一定不要将此日期设置为”当前”时间。我们的新闻站点地图指南会帮助您创建新闻站点地图。

是否应使用特定的格式来创建新闻站点地图?

首先,确保您的网站已加入 Google 新闻。如果未加入,可与我们联系请求加入。

Google 新闻站点地图采用站点地图协议,另外还带有下文定义的 Google 新闻专用标记。下例是采用 Google 新闻专用标记的 Google 新闻站点地图条目:
首先,确保您的网站已加入 Google 新闻。如果未加入,可与我们联系请求加入。

Google 新闻站点地图采用站点地图协议,另外还带有下文定义的 Google 新闻专用标记。下例是采用 Google 新闻专用标记的 Google 新闻站点地图条目:

资讯专用标记的定义

资讯专用标记的定义

标记 必带标记? 说明
<publication> 标记用于指定发表此报道的出版物。该标记必须包含两个下级标记:<name> 和 <language>。<name> 是新闻出版物的名称。该名称必须与 news.google.cn 上的报道中显示的名称完全一致(除附加说明之外的部分)。例如,如果显示在 Google 新闻中的名称是“示例时报(订阅)”,则应该使用名称“示例时报”。<language> 是出版物所用的语言。语言应该是 ISO 639 语言代码(2 个或 3 个字母)。例外情况:就中文而言,简体中文请使用 zh-cn,繁体中文请使用 zh-tw
如果报道不供人们公开阅读,则是必带标记;否则应该略去 可以使用的值包括“Subscription”或“Registration”,用于说明是否能阅读报道。如果 Google 新闻读者不注册或不订阅也可以阅读报道,则应该略去此标记。
如果体裁适用,则必带此标记,否则可以略去 用逗号分隔的属性列表,用于指明报道内容的特点(如“PressRelease”或“UserGenerated”)。关于所有可能值的列表,请参阅 Google 新闻内容属性。内容的标注必须准确无误,以便为我们的用户提供一致的体验。
报道发布日期采用 W3C 格式,即,使用“完整日期”(YYYY-MM-DD) 或“完整日期加时、分、秒”(YYYY-MM-DDThh:mm:ss) 格式,并带有可选分数和时区后缀。请确保您提供的是报道在网站上发布时的原始日期和时间,而不是报道添加到站点地图的时间。我们的抓取工具可接受以下任意格式:
完整日期 
YYYY-MM-DD(例如 1997-07-16)

完整日期加时和分 
YYYY-MM-DDThh:mmTZD(例如 1997-07-16T19:20+01:00)

完整日期加时、分和秒 
YYYY-MM-DDThh:mm:ssTZD(例如 1997-07-16T19:20:30+01:00)

完整日期加时、分、秒和小数位秒 
YYYY-MM-DDThh:mm:ss.sTZD(例如 1997-07-16T19:20:30.45+01:00)

否,但是强烈建议 新闻报道的标题。注意:在 Google 新闻中显示标题时,可能会因为空间不足而删减部分内容。报道的标题标记中应只包含显示在您网站上的报道标题,而不应包含作者姓名、出版物名称或出版日期。

用逗号分隔的关键字列表,用于描述报道的主题。可从(但不限于)现有的 Google 新闻关键字列表中摘录关键字。

公司、基金或其他作为报道主体的金融实体的证券代码(最多 5 个)的列表,以逗号分隔。主要与财经报道相关。每个证券代码都必须以其证券交易所的名称为前缀,还必须与其在 Google 财经中的条目相符。例如,“NASDAQ:AMAT”(不是“NASD:AMAT”)或“BOM:500325”(不是“BOM:RIL”)。

创建新闻站点地图时,请记住以下要点:

  • 您的新闻站点地图应只包含两天内发布的报道的网址。
  • 我们建议您在新报道发布时,使用这些报道不断地更新自己的新闻站点地图。Google 新闻抓取新闻站点地图的频率与抓取网站其他内容的频率相同。
  • Google 新闻站点地图所包含的网址不应超过 1,000 个。如果要添加更多网址,可将网址分几部分添加到多个站点地图中,然后用站点地图索引文件对其进行管理。使用 Sitemap 协议中规定的 XML 格式。列在站点地图索引文件中的站点地图不应超过 50,000 个。这些限制条件有助于确保不会因为向 Google 新闻提供大量文件而导致您的网络服务器负荷过重。

创建站点地图后,将其上传到包含新闻报道的最高级目录中。

后续:明天再写

您可能还喜欢...