如何建立谷歌新闻站点地图
在讲述建立谷歌新闻站点地图前,先引用谷歌官方网站的一段陈述:什么是新闻站点地图?
Google 新闻站点地图是一个文件,使用该文件可以控制提交至 Google 新闻的内容。通过创建和提交 Google 新闻站点地图,能帮助 Google 新闻发现并抓取您网站的报道:
- 加快发现新闻报道的速度:Google 新闻可以通过站点地图快速查找网站中的所有新闻报道。
- 抓取所有新闻报道并将其编入索引:站点地图可以直接向我们的抓取工具指明每个新闻报道网址,从而确保网站中的内容无一遗漏。
- 提高提取和显示报道信息的准确度:站点地图可以指明报道标题,以及每篇报道的发布日期。
- 提高标记报道内容特点的准确度:站点地图使用 <access> 和 <genres> 标记指定各类内容。
- 用元数据来注释报道:站点地图可以使用相关关键字或股票代码等具体描述,清晰地指明每篇报道的内容。
如果您的网站是新建的、包含动态内容或需要用户依次点击多个链接才能转至您的新闻报道,那么强烈建议您使用新闻站点地图。
请注意,Google 新闻在排名方面并不会偏向使用新闻站点地图的网站。无论是否存在新闻站点地图,Google 新闻都会使用普通的抓取方法来搜索所有新闻网站(主页和栏目)并将其编入索引。
应该多长时间更新一次我的新闻站点地图?
更新新闻站点地图的频率,应该与您用新新闻报道更新您的新闻网站的频率相同。Google 新闻会以相同的频率抓取您的新闻站点地图和常规网站。
请记住,您只应在新闻站点地图中列出两天内发布的报道。您可以从新闻站点地图中删除发布时间早于两天的报道,但这些报道一般仍会在新闻索引中保留 30 天。
为什么要创建新闻站点地图?
新闻站点地图是 Google 新闻特有的站点地图。网络站点地图与新闻站点地图的主要区别在于,前者不能用来向 Google 新闻提交报道。下面是这两种站点地图之间的一些其他重要区别:
•网络站点地图是您想让 Google 在您的网站上抓取的所有网址的列表,而新闻站点地图只是列出了两天内在您的网站上发布的新闻报道。您不应在新闻站点地图中加入发布时间早于两天的报道。
•Google 站点地图生成器不能用来创建新闻站点地图,因为它会加入与特定新闻报道不对应的网址。
•新闻站点地图必须包含每篇报道的发布日期,即报道首次出现在您的网站上的日期。请一定不要将此日期设置为"当前"时间。我们的新闻站点地图指南会帮助您创建新闻站点地图。
是否应使用特定的格式来创建新闻站点地图?
首先,确保您的网站已加入 Google 新闻。如果未加入,可与我们联系请求加入。
Google 新闻站点地图采用站点地图协议,另外还带有下文定义的 Google 新闻专用标记。下例是采用 Google 新闻专用标记的 Google 新闻站点地图条目:
首先,确保您的网站已加入 Google 新闻。如果未加入,可与我们联系请求加入。
Google 新闻站点地图采用站点地图协议,另外还带有下文定义的 Google 新闻专用标记。下例是采用 Google 新闻专用标记的 Google 新闻站点地图条目:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>http://www.example.org/business/article55.html</loc>
<news:news>
<news:publication>
<news:name>新华日报</news:name>
<news:language>zh-cn</news:language>
</news:publication>
<news:access>Subscription</news:access>
<news:genres>PressRelease, Blog</news:genres>
<news:publication_date>2008-12-23</news:publication_date>
<news:title>A 公司与 B 公司展开并购谈判</news:title>
<news:keywords>business, merger, acquisition, A, B</news:keywords>
<news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>
</news:news>
</url>
</urlset>
资讯专用标记的定义
资讯专用标记的定义
标记
必带标记?
说明
<publication>
是
<publication> 标记用于指定发表此报道的出版物。该标记必须包含两个下级标记:<name> 和 <language>。<name> 是新闻出版物的名称。该名称必须与 news.google.cn 上的报道中显示的名称完全一致(除附加说明之外的部分)。例如,如果显示在 Google 新闻中的名称是“示例时报(订阅)”,则应该使用名称“示例时报”。<language> 是出版物所用的语言。语言应该是 ISO 639 语言代码(2 个或 3 个字母)。例外情况:就中文而言,简体中文请使用 zh-cn,繁体中文请使用 zh-tw。
<access>
如果报道不供人们公开阅读,则是必带标记;否则应该略去
可以使用的值包括“Subscription”或“Registration”,用于说明是否能阅读报道。如果 Google 新闻读者不注册或不订阅也可以阅读报道,则应该略去此标记。
<genres>
如果体裁适用,则必带此标记,否则可以略去
用逗号分隔的属性列表,用于指明报道内容的特点(如“PressRelease”或“UserGenerated”)。关于所有可能值的列表,请参阅 Google 新闻内容属性。内容的标注必须准确无误,以便为我们的用户提供一致的体验。
<publication_date>
是
报道发布日期采用 W3C 格式,即,使用“完整日期”(YYYY-MM-DD) 或“完整日期加时、分、秒”(YYYY-MM-DDThh:mm:ss) 格式,并带有可选分数和时区后缀。请确保您提供的是报道在网站上发布时的原始日期和时间,而不是报道添加到站点地图的时间。我们的抓取工具可接受以下任意格式:
完整日期
YYYY-MM-DD(例如 1997-07-16)
完整日期加时和分
YYYY-MM-DDThh:mmTZD(例如 1997-07-16T19:20+01:00)
完整日期加时、分和秒
YYYY-MM-DDThh:mm:ssTZD(例如 1997-07-16T19:20:30+01:00)
完整日期加时、分、秒和小数位秒
YYYY-MM-DDThh:mm:ss.sTZD(例如 1997-07-16T19:20:30.45+01:00)
<title>
否,但是强烈建议
新闻报道的标题。注意:在 Google 新闻中显示标题时,可能会因为空间不足而删减部分内容。报道的标题标记中应只包含显示在您网站上的报道标题,而不应包含作者姓名、出版物名称或出版日期。
<:keywords>
否
用逗号分隔的关键字列表,用于描述报道的主题。可从(但不限于)现有的 Google 新闻关键字列表中摘录关键字。
<:stock_tickers>
否
公司、基金或其他作为报道主体的金融实体的证券代码(最多 5 个)的列表,以逗号分隔。主要与财经报道相关。每个证券代码都必须以其证券交易所的名称为前缀,还必须与其在 Google 财经中的条目相符。例如,“NASDAQ:AMAT”(不是“NASD:AMAT”)或“BOM:500325”(不是“BOM:RIL”)。
创建新闻站点地图时,请记住以下要点:
- 您的新闻站点地图应只包含两天内发布的报道的网址。
- 我们建议您在新报道发布时,使用这些报道不断地更新自己的新闻站点地图。Google 新闻抓取新闻站点地图的频率与抓取网站其他内容的频率相同。
- Google 新闻站点地图所包含的网址不应超过 1,000 个。如果要添加更多网址,可将网址分几部分添加到多个站点地图中,然后用站点地图索引文件对其进行管理。使用 Sitemap 协议中规定的 XML 格式。列在站点地图索引文件中的站点地图不应超过 50,000 个。这些限制条件有助于确保不会因为向 Google 新闻提供大量文件而导致您的网络服务器负荷过重。
创建站点地图后,将其上传到包含新闻报道的最高级目录中。
后续:明天再写
查看完整版本: 如何建立谷歌新闻站点地图
Tags: