Быстрое пересечение, дополнение и союз текстовых файлов, определенных вкладками?

StackOverflow https://stackoverflow.com/questions/8378524

Вопрос

Может ли кто-нибудь порекомендовать быструю утилиту UNIX (в идеале, написанную в C) для получения эффективного потокового перекрестка/объединения текстовых файлов с делицированными вкладками? Например, разрешайте такие запросы, как «Дайте мне все записи, которые в файле A имеют значение столбца k, которое не отображается ни в каком столбце k файла b».

Например, если файл A есть:

bob sally sue
bob mary john

и файл B:

john sally sue
foo bar quux

Затем дополнение файла относительно B в столбце 2 вернет «Боб Мэри Джон», так как это единственный в файле B, который имеет значение в столбце 2, которое не отображается в файле B.

Я бы предпочел не использовать базу данных, но хотел бы получить утилиту на основе командной строки. Awk - ответ или есть что -то проще? Спасибо.

Это было полезно?

Решение

Если бы это было только для этого особенно запроса, я бы, вероятно, пошел бы с Awk, Hash B's 2. столбцы и фильтруют A на основе хэша.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top