intersection rapide, complément et de l'union des fichiers texte délimité par des tabulations?
-
28-10-2019 - |
Question
Quelqu'un peut-il recommander un utilitaire unix rapide (idéalement écrit en C) pour obtenir efficace, intersection en continu / union des fichiers texte délimité par des tabulations? Par exemple, autoriser des requêtes telles que « me donner les toutes les entrées dans le fichier A qui ont une valeur de colonne K qui ne figure dans aucune colonne K du fichier B ».
par exemple, si le fichier A est:.
bob sally sue
bob mary john
et le fichier B est:
john sally sue
foo bar quux
puis complément du fichier A par rapport à B sur la colonne 2 retournerait « mary bob john », puisque c'est le seul dans le fichier B qui a une valeur dans la colonne 2 qui ne figure pas dans le fichier B.
Je préfère ne pas utiliser une base de données, mais souhaite un utilitaire ligne de commande. Est-awk la réponse ou est-il quelque chose de plus simple? merci.
La solution
Si ce que pour cette question en particulier, je serais probablement aller avec awk, 2. colonnes de hachage B et filtre A basé sur le hachage.