我有一个复合C1网站。我喜欢使用Microsoft搜索服务器功能。我已经安装了所有软件,但是当我搜索时,我将获得每个页面,因为每个页面都索引了导航菜单。当我在“导航”菜单上使用类=“ noindex”选项时,菜单中使用的链接不会遵循crawler。

有人可以告诉我如何排除内容,但要确保爬网仍然遵循内容中使用的链接?

有帮助吗?

解决方案

考虑具有带有网站导航结构的站点地图页面,并在此页面的链接中具有crawler之后的链接...然后,当通过“导航标题”中的某些关键字搜索时,就不会在结果中使用所有页面,您只会有Sitemap页面。

其他提示

这基本上是Microsoft Search Server的问题,但是复合C1的C1软件包试图解决此问题。引用 http://docs.compoits.net/compoits.search.microsoftsearchserver :

从索引中排除页面内容

确保在C1网站上的Web.config中指定了RemapperHttpModule。如果没有,请执行以下操作:

  1. 在您的C1网站上打开Web.config。
  2. 在下添加以下配置 <httpModules><modules> (对于IIS 7.0或以后)元素: <add name="MssRemaper" type="Composite.Search.MicrosoftSearchServer.RemapperHttpModule" />

现在,将页面的一部分排除在由Microsoft Search Server索引中:

  1. 打开源编辑器中的页面。
  2. 找到要排除在索引中的元素。
  3. 将带有“ noindex”值的类属性添加到元素(class =“ noindex”):eg <div class="noindex">
  4. 重新索引您的网站。

确保爬行者找到您的页面

导航元素的排除将在复合C1侧发生,因此这样做将删除搜索服务器爬网的能力以遵循这些链接。您可以通过确保网站上有一个站点地图来解决此问题,并将搜索服务器索引索引到SiteMap页面。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top