タブが区切られたテキストファイルの高速交差点、補完、結合?
-
28-10-2019 - |
質問
誰かが、タブが解放されたテキストファイルの効率的でストリーミング交差/ユニオンを得るために、高速UNIXベースのユーティリティ(理想的にはCで書かれている)を推奨できますか?たとえば、「ファイルBの列Kに表示されない列値kを持つファイルAのすべてのエントリを教えてください」などのクエリを許可します。
たとえば、ファイルaが次の場合:
bob sally sue
bob mary john
ファイルBは次のとおりです。
john sally sue
foo bar quux
次に、列2のBに対するファイルAの補数は、「ボブメアリージョン」を返します。これは、ファイルBに表示されない列2に値を持つファイルBの唯一のファイルBであるためです。
データベースを使用したくないのですが、コマンドラインベースのユーティリティが必要です。 awkは答えですか、それとも何か簡単なものがありますか?ありがとう。
解決
それが特にクエリのみであれば、おそらくawk、ハッシュBの2を使用して、ハッシュに基づいてフィルターをフィルタリングします。
所属していません StackOverflow