Google 忽略用户选择的规范网址,导致网页无法在 Google 上投放

Google Ignoring User Selected Canonical URL causing pages to not be served on Google

提问人:Brayden de Koning 提问时间:11/14/2023 最后编辑:Brayden de Koning 更新时间:11/21/2023 访问量:46

问:

我正在就 Google 搜索索引和规范网址的问题寻求一些建议和指导。

背景:

我们有一个建立在Sitefinity CMS上的Quest Apartment Hotels网站,其中包含许多内容页面。该网站包括用于财产搜索的单页应用程序 (SPA)。当用户在 SPA 中搜索属性时,他们将被定向到唯一的属性页。由于这些媒体资源页面的动态特性,Google 无法轻松浏览这些媒体资源页面。

为了解决这个问题,我们创建了静态内容页面,其中包含每个媒体资源的网址,允许 Google 的抓取工具访问这些页面。每个属性页都包含结构化数据、指向其特定页面的用户声明的规范 URL、唯一的元标题、元说明和大量特定于属性的内容。

SPA 预加载要提供的内容,并在历史记录更改时使用 pushState。

问题:

尽管内容独特且带有明确的规范代码,但 Google 错误地选择了主搜索页网址(“/属性”)作为各个媒体资源的规范网址。例如,“https://www.questapartments.com.au/properties/vic/mont-albert/quest-mont-albert”处的属性页在内容上与“/properties”页不同,但 Google 并未识别这种唯一性。

请参阅下面的屏幕截图,其中图 1(标记为 F1)是很长时间不存在的 Web 服务器:用于属性页 URL 检查的 GSC 图片。

您可以在我引用的内容中引用以下 URL:

单个属性页:

https://www.questapartments.com.au/properties/vic/geelong/quest-geelong-central

高级搜索页面:

https://www.questapartments.com.au/properties

我尝试过什么:

确保每个属性页都有一个指向其唯一 URL 的标记。

验证每个网页是否具有唯一的元标题、说明和结构化数据。

确保站点地图分别指向每个属性页。

确保网站上的机器人 .txt 并且每个属性页都不会被阻止。

问题:

为什么 Google 忽略了我的用户选择的规范网址?

我可能错过了什么可能导致这种情况发生?

提前感谢您的任何帮助或见解!

布雷登

编辑 - 20/11/2023 - 更新的 Canonical 标签的新屏幕截图

编辑 - 21/11/2023 - 澄清要点。

  1. 站点地图 .gz 不是由我们创建或管理的。这可能是 Sitefinity 的事情......无论如何,我们已经在GSC中指向了我们的Sitemap.xml,这是正确的。

  2. “prod_web_02.”引荐网址与“www.”版本是同一个网站。在与我的开发人员交谈后,它本来是要受到 IP 限制的,但事实并非如此......我仍然不明白考虑到为什么这个页面没有被索引。

  3. 之所以将其放在 Stack Overflow 上,是因为 /properties/ 页面都是一个角度 SPA,我不确定这是应用程序中的开发疏忽,还是 Sitefinity 或前端中的潜在原因。

  4. 是的,我已经使用 GSC URL Inspect 来测试它们显示我需要索引的确切页面的实时页面。

angularjs google-search-console canonical-link

评论

0赞 Veselin Vasilev 11/15/2023
生成的规范 url 指向 HTTP 而不是 HTTPS,不确定这是否有任何影响,但无论如何修复它都很好。检查您的站点地图是否也生成了 https 网址。然后,只需将更新后的站点地图重新上传到谷歌搜索控制台,然后等待谷歌重新索引即可。
0赞 Brayden de Koning 11/20/2023
嘿@VeselinVasilev - 感谢您的回复!在确保 Canonical 已 HTTPS:// 并确认我们的站点地图生成 HTTPS 后,仍然会出现相同的错误。有关新的屏幕截图,请参阅编辑的部分。
0赞 Stephen Ostermiller 11/20/2023
您是否在 Google Search Console 中使用过 URL 检查来查看 Google 为每个页面提供的屏幕截图?他们有你期望的内容吗?
0赞 Stephen Ostermiller 11/20/2023
这不是一个编程问题,它在 Stack Overflow 上是题外话。请编辑问题以解决需要澄清的问题,然后在网站站长上重新提问并在此处删除。
0赞 Brayden de Koning 11/22/2023
@StephenOstermiller - 该应用程序是用 Angular 构建的,所以我认为构建中的一些 angular 实践可能会导致这种 SEO 事故。

答:

0赞 Veselin Vasilev 11/20/2023 #1

可以改进的几点:

我认为一旦你修复了你的站点地图并阻止了对非 www url 的访问,你应该没问题。请注意,谷歌可能需要一些时间才能重新索引所有内容。

评论

0赞 Brayden de Koning 11/22/2023
感谢您的回复!我没有意识到该网站有一个“.gz”站点地图,这很奇怪。我们将GSC指向一个静态的“/sitemap.xml”,谷歌说这很好。根据我的开发人员的说法,“prod_web_01/02”与 WWW 变体相同,我仍然不明白为什么 Google 不喜欢某些 /property/*/*/Property,但随后又为其他版本编制索引......
0赞 Veselin Vasilev 11/23/2023
.gz 是指您选中了 压缩 站点地图设置的选项。我通常会取消选中它