質問

誰かが、タブが解放されたテキストファイルの効率的でストリーミング交差/ユニオンを得るために、高速UNIXベースのユーティリティ(理想的にはCで書かれている)を推奨できますか?たとえば、「ファイルBの列Kに表示されない列値kを持つファイルAのすべてのエントリを教えてください」などのクエリを許可します。

たとえば、ファイルaが次の場合:

bob sally sue
bob mary john

ファイルBは次のとおりです。

john sally sue
foo bar quux

次に、列2のBに対するファイルAの補数は、「ボブメアリージョン」を返します。これは、ファイルBに表示されない列2に値を持つファイルBの唯一のファイルBであるためです。

データベースを使用したくないのですが、コマンドラインベースのユーティリティが必要です。 awkは答えですか、それとも何か簡単なものがありますか?ありがとう。

役に立ちましたか?

解決

それが特にクエリのみであれば、おそらくawk、ハッシュBの2を使用して、ハッシュに基づいてフィルターをフィルタリングします。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top