bash-誤った単語から始まる行を省略します(hunspellを使用)
-
28-10-2019 - |
質問
ファイルがあります words.txt
各行が単語であり、続いて TAB
, 、続いて整数(単語の頻度を表す)が続きます。単語が正しく綴られている行のみを含む新しいファイルを生成したいと思います。
使用 cat words.txt | hunspell -1 -G > ok_words.txt
正しい単語のリストを取得できますが、各行の残りの部分をどのように含めることができますか(つまり、 TAB
と番号)?
入力:
adwy 27
bird 10
cat 12
dog 42
erfgq 9
fish 2
希望の出力:
bird 10
cat 12
dog 42
fish 2
解決
最も簡単な方法は、を使用することです join
指図:
$ join words.txt ok_words.txt
bird 10
cat 12
dog 42
fish 2
またはタブを保存するには:
$ join -t $'\t' words.txt ok_words.txt
bird 10
cat 12
dog 42
fish 2
所属していません StackOverflow