Domanda

Ho notato nel mio Crawl Log sto vedendo le voci in questo modo:

Il contenuto di questo indirizzo è stato escluso dal crawler, perché questo elemento è stato contrassegnato con un no-index meta-tag. Per indicizzare questa voce, rimuovere il meta-tag e di nuova scansione.

Per lo più questi sono su directory, come: http: // localhost / pianificazione / planningfor2011 / . Tutti i nostri contenuti sono ricercabili, e ottengo i dati scansione provenienti da altre zone, ma queste directory sembrano avere problemi, per quanto posso dire che non abbiamo nessuna meta-tag a livello di directory e non fare su documenti sotto. Abbiamo Publishing acceso nella Biblioteca, vorremmo che causa un problema con la scansione del directory di primo livello o c'è qualche impostazione potremmo aver bisogno di cambiamento al livello superiore del sito? O sono questi solo una distrazione e io li posso ignorare?

I nostri siti sono impostati per eseguire la scansione dei siti di SharePoint locali, nessuna regola di ricerca per indicizzazione per eliminare queste directory e l'account ha i permessi giusti per strisciare la Biblioteca. Stiamo usando SP2010 Enterprise con Server di ricerca.

Addendum: Tutte le impostazioni Impostazioni sito e la biblioteca sono impostato per avere le pagine ei siti secondari inclusi nella ricerca, sono andato sulle impostazioni più volte e non c'è nulla di blocco che posso vedere nell'interfaccia utente.

Più informazioni: Così abbiamo alcune ricerche per indicizzazione che vanno, ma tutto quello che fanno è strisciare il livello superiore dei siti, se ci sono pagine di un sito quelle non vengono mai visto. I risultati mostrano solo le pagine di livello superiore e nient'altro. Abbiamo indicizzato e successiva scansione, ma non in grado di ottenere ulteriori pagine nell'indice.

È stato utile?

Soluzione

Così si scopre avere più regole per escludere directory specifiche causavano scansioni di smettere di fare la profondità, una volta che questi sono stati rimossi ci siamo ritrovati con Crawls che ha funzionato. Io ancora non capisco perché esclusi alcune delle directory Forms ha causato questo problema, ma quello che abbiamo finito con base incluso il seguente unico:

  • http: // * _ layout / * - esclude
  • http: //*spsdisco.aspx - esclude
  • http: // dispform.aspx - esclude
  • http: // - includere

Il tentativo di cancellare altri errori che è apparso nel registro generato non strisciando, si spera che questo vi aiuterà qualcun altro ottenere questo problema.

Altri suggerimenti

Assicurarsi che la "Consenti a questo web a comparire nei risultati di ricerca" è impostata su ogni sito e che il "Consenti articoli in questa raccolta documenti a comparire nei risultati di ricerca" è impostata sulle raccolte documenti.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a sharepoint.stackexchange
scroll top