Perché Google non offre ricerca parziale? È perché l'indice sarebbe troppo grande?

StackOverflow https://stackoverflow.com/questions/1835148

  •  11-09-2019
  •  | 
  •  

Domanda

Google / Gmail / etc. non offre parziale o prefisso di ricerca (ad esempio roba *) anche se potrebbe essere molto utile. Spesso non trovo una posta in Gmail, perché non mi ricordo l'espressione esatta.

So che c'è diraspatura e quali, ma non è la stessa cosa, soprattutto se si parla di lingue diverse dall'inglese.

Perché non Google aggiunge una tale caratteristica? È perché l'indice sarebbe esplosa? Ma i database offrono ricerca parziale, quindi sicuramente ci sono buoni algoritmi per affrontare questo problema.

Qual è il problema qui?

È stato utile?

Soluzione

Google in realtà non memorizzare il testo che si cerca. Memorizza i termini di ricerca, si collega alla pagina, e dove nella pagina esiste il termine. Quella struttura dati è indicizzato nel senso tradizionale del database. Scommetto utilizzando i caratteri jolly renderebbe l'indice dell'indice abbastanza lento e, come dice lo sviluppatore arte, non molto utile.

Altri suggerimenti

Google fa ricercare parole parziali. Gmail non fa però. Dal momento che si chiede qual è il problema qui, la mia risposta è la mancanza di sforzo. Questo problema ha una soluzione che permette di ricercare in tempo costante e spazio lineare, ma di cache non molto amichevole: Alberi suffisso. Suffisso array è un'altra opzione che è più di cache-friendly e ancora tempo efficiente.

E 'possibile tramite la Google Docs - seguire questo articolo:

http://www.labnol.org/internet/advanced-gmail -search / 21623 /

Google Code Search possibile cercare in base a espressioni regolari, in modo da so come farlo. Naturalmente, la quantità di codice di dati di ricerca deve indice è molto piccolo rispetto alla ricerca sul web. Utilizzando regex o ricerca con caratteri jolly nella ricerca web aumenterebbe dimensioni dell'indice e diminuire le prestazioni a livelli poco pratici.

Il segreto per trovare qualsiasi cosa in Google è quello di inserire una combinazione di termini di ricerca (o frasi citate) che sono molto probabile che sia nel contenuto che stai cercando, ma improbabile che appaiono insieme nei contenuti indipendenti. Un'espressione jolly fa l'opposto di questo. Basta inserire i termini che ci si aspetta il jolly per abbinare, tenendo presente che Google farà derivante per voi. Torna nei giorni in cui i computer correvano su Steam, Lycos (IIRC) aveva il pattern matching, ma lo spense diversi anni fa. Presumo che stava mettendo troppo carico sui loro server.

perché non si può ragionevolmente ricavare ciò che si intende con auto *:

Auto? Tappeti? Le carote?

Gli algoritmi di Google confrontano Testi, anche i link in entrata esterni per determinare ciò che un documento è di circa. Con questi caratteri jolly tutti questi algoritmi vanno in junk

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top