質問

何ハリソンハッシュとその応用ウェブ検索?でも与えてくれる関係す。

更新:

かったです。 こちらの は一部のテックシラバスの友人のです。私は説明しておく必要があるで彼のこのコンセプト、そしてそれはどのように応用できるアプリ開発用のjavascriptライブラリ。多くのけたのは貴重なお時間をありがとうござい.

役に立ちましたか?

解決

私はあなたが探していると思います ハッシュによるサブストリングテストの実装 マルコムC.ハリソン。 1つの文字列に指定されたサブストリングが含まれているかどうかを決定する高速実装について説明します。この手法は、大きな静的テキストファイルの検索に適しています。

また、で見つけることができます 文字列検索アルゴリズム グラハムA.スティーブン。

他のヒント

ハリソンハッシュは、急速な技術を決定する指定された部分文字列ができるのではないかと思に含まれる大きな文字列になります。最初のステップを署名すべての文字列をファイル検索用のハッシュアルゴリズムです。これらの署名は、その保存と共に実際のファイルです。通常、ファイルにつきましては、それらがいずれの個別のコンテンツの検索技術のみ、単線です。そして同じハッシュアルゴリズムの一つを構築しますの署名部分文字列が検索されます。それを適用簡易Boolean試験するかどうかを判断する部分文字列、クリーンエネルギーであるに含まれる文字列です。の場合には肯定しなければな検討、実際の文字列と部分文字列がきていることを確認して下さいようです。でも答えはノーであることは不可能のとなる部分文字列に含まれる文字列は、この特定の文字列をファイルでなくて検討します。

の署名がっているかを検討すべてのペアの連続文字は、文字列になります。このように文字列"abcdef"に対する"ab","bc","cd","で","ef".によって自然にデータをご利用されているコンピュータ、スクビットサイズのための署名をも32または64ビットが異なるサイズが可能です。次の開発のハッシュ機能する地図は文字を一つのビットの署名を表します。単純にハッシュ関数にを乗じた値を文字と分割によるビットのサイズの署名を使用します。実際にも調整が必要となく分布のビットセット全ての文字のペアになっています。また計算のハッシュをそれぞれの文字のペアとセットに対応するビットの署名を表します。が異なるペアのハッシュと同じビットのビットのご滞在の設定ができまORingのビットをセットします。的確に指示してくれますのでテーブルのすべての署名のためのすべてのラインのオリジナルソースファイルです。

検索のための部分文字列を計算する署名の部分文字列そのものです。場合に部分文字列が含まれる文字列のすべてのセットビットの署名の部分文字列の設定が必要となる署名の文字列になります。この自明のものであり、場合に部分文字列が含まれるペアの文字のハッシュされたもの17が、17ビットな設定の署名文字列、そして明確にするペアの文字は、文字列、またビットがセットされています。

場合は、署名に含まれる単一のコンピュータの言葉そしてすべてのページに載せる必要がある場合はすべてのビットの部分文字列の文字列は排他(XOR)の署名が文字列の部分文字列、および(および)この署名の部分文字列.場合には結果が非ゼロのが存在する少なくとも一つのペアの文字の部分文字列は、文字列と部分文字列のできなかに含まれる文字列です。以来、二つの論理的な業務に必要な全くあらゆる文字列をファイルのプログラムで動作します。実際にハリソンハッシュテストの除去、ファイルの配慮から、プログラムだけに限定される部分文字列の検索には非常に小さな部分のファイルです。

明かにし、アルゴリズムを用いたペアの文字が、他の変異体は三つの連続文字です。

ハリソン教授の先生にCourant研究所数理科学研究科、また、このアルゴリズムのテキスト編集。という輝かしい。

ライセンス: CC-BY-SA帰属
所属していません cs.stackexchange
scroll top