提问人:Brayden de Koning 提问时间:11/14/2023 最后编辑:Brayden de Koning 更新时间:11/21/2023 访问量:46
Google 忽略用户选择的规范网址,导致网页无法在 Google 上投放
Google Ignoring User Selected Canonical URL causing pages to not be served on Google
问:
我正在就 Google 搜索索引和规范网址的问题寻求一些建议和指导。
背景:
我们有一个建立在Sitefinity CMS上的Quest Apartment Hotels网站,其中包含许多内容页面。该网站包括用于财产搜索的单页应用程序 (SPA)。当用户在 SPA 中搜索属性时,他们将被定向到唯一的属性页。由于这些媒体资源页面的动态特性,Google 无法轻松浏览这些媒体资源页面。
为了解决这个问题,我们创建了静态内容页面,其中包含每个媒体资源的网址,允许 Google 的抓取工具访问这些页面。每个属性页都包含结构化数据、指向其特定页面的用户声明的规范 URL、唯一的元标题、元说明和大量特定于属性的内容。
SPA 预加载要提供的内容,并在历史记录更改时使用 pushState。
问题:
尽管内容独特且带有明确的规范代码,但 Google 错误地选择了主搜索页网址(“/属性”)作为各个媒体资源的规范网址。例如,“https://www.questapartments.com.au/properties/vic/mont-albert/quest-mont-albert”处的属性页在内容上与“/properties”页不同,但 Google 并未识别这种唯一性。
请参阅下面的屏幕截图,其中图 1(标记为 F1)是很长时间不存在的 Web 服务器:用于属性页 URL 检查的 GSC 图片。
您可以在我引用的内容中引用以下 URL:
单个属性页:
https://www.questapartments.com.au/properties/vic/geelong/quest-geelong-central
高级搜索页面:
https://www.questapartments.com.au/properties
我尝试过什么:
确保每个属性页都有一个指向其唯一 URL 的标记。
验证每个网页是否具有唯一的元标题、说明和结构化数据。
确保站点地图分别指向每个属性页。
确保网站上的机器人 .txt 并且每个属性页都不会被阻止。
问题:
为什么 Google 忽略了我的用户选择的规范网址?
我可能错过了什么可能导致这种情况发生?
提前感谢您的任何帮助或见解!
布雷登
编辑 - 20/11/2023 - 更新的 Canonical 标签的新屏幕截图
编辑 - 21/11/2023 - 澄清要点。
站点地图 .gz 不是由我们创建或管理的。这可能是 Sitefinity 的事情......无论如何,我们已经在GSC中指向了我们的Sitemap.xml,这是正确的。
“prod_web_02.”引荐网址与“www.”版本是同一个网站。在与我的开发人员交谈后,它本来是要受到 IP 限制的,但事实并非如此......我仍然不明白考虑到为什么这个页面没有被索引。
之所以将其放在 Stack Overflow 上,是因为 /properties/ 页面都是一个角度 SPA,我不确定这是应用程序中的开发疏忽,还是 Sitefinity 或前端中的潜在原因。
是的,我已经使用 GSC URL Inspect 来测试它们显示我需要索引的确切页面的实时页面。
答:
可以改进的几点:
- http://prod_web_02.questapartments.com.au - 你说服务器不存在,但我仍然可以访问它,这意味着谷歌会索引它。更新其机器人 .txt 以禁止索引,或者在可行的情况下将其重定向到 www。
- https://www.questapartments.com.au/sitemap/sitemap-index.xml - 这个指向 http://prod_web_01.questapartments.com.au/sitemap/sitemap.gz - 在这个站点地图中,所有链接也是 HTTP 而不是 https。另外,为什么 url 是 prod_web_01 而不是 www?我认为您需要配置默认 Sitefinity 站点的 LiveUrl,然后重新生成站点地图。另外,取消选中 压缩 站点地图的选项,以便您可以更轻松地检查它。
我认为一旦你修复了你的站点地图并阻止了对非 www url 的访问,你应该没问题。请注意,谷歌可能需要一些时间才能重新索引所有内容。
评论