Быстрое пересечение, дополнение и союз текстовых файлов, определенных вкладками?
-
28-10-2019 - |
Вопрос
Может ли кто-нибудь порекомендовать быструю утилиту UNIX (в идеале, написанную в C) для получения эффективного потокового перекрестка/объединения текстовых файлов с делицированными вкладками? Например, разрешайте такие запросы, как «Дайте мне все записи, которые в файле A имеют значение столбца k, которое не отображается ни в каком столбце k файла b».
Например, если файл A есть:
bob sally sue
bob mary john
и файл B:
john sally sue
foo bar quux
Затем дополнение файла относительно B в столбце 2 вернет «Боб Мэри Джон», так как это единственный в файле B, который имеет значение в столбце 2, которое не отображается в файле B.
Я бы предпочел не использовать базу данных, но хотел бы получить утилиту на основе командной строки. Awk - ответ или есть что -то проще? Спасибо.
Решение
Если бы это было только для этого особенно запроса, я бы, вероятно, пошел бы с Awk, Hash B's 2. столбцы и фильтруют A на основе хэша.