各NA値のための唯一の1行を表示します

https://stackoverflow.com/questions/2183002

r
dataframe

24-09-2019
|

質問

私のスクリプトの中でいくつかの点で私はmissing valuesの数を確認したいです私data.frameで、それらを表示します。私の場合は私が持っています：

out <- read.csv(file="...../OUT.csv", na.strings="NULL")

sum(is.na(out$codeHelper))

out[is.na(out$codeHelper),c(1,length(colnames(out)))]

これは完全に正常に動作します。しかし、最後のコマンドが明らかに例えば、私data.frameがNAで全体TRUEを与えます：

5561                  Yemen (PDR) <NA>
5562                  Yemen (PDR) <NA>
5563                  Yemen (PDR) <NA>
5564                  Yemen (PDR) <NA>
5565                  Yemen (PDR) <NA>
5566                  Yemen (PDR) <NA>
5567                  Yemen (PDR) <NA>
5568                  Yemen (PDR) <NA>
5601 Zaire (Democ Republic Congo) <NA>
5602 Zaire (Democ Republic Congo) <NA>
5603 Zaire (Democ Republic Congo) <NA>
5604 Zaire (Democ Republic Congo) <NA>
5605 Zaire (Democ Republic Congo) <NA>

大きなフレームとかなり厄介に見えるのNAの多い

。 NAはどの国すなわち発生した場合にのみ私にとって重要です（2列目）、3列目の欠損値を有している。

それでは、どのように私はそれぞれの国のための単一の行を表示することができますか？

これは、次のようになります。

    1                  Yemen (PDR) <NA>
    2 Zaire (Democ Republic Congo) <NA>
    3                          USA <NA>
    4                     W. Samoa <NA>

解決

unique(c(1,2,3,4,4))

あなたを与えるだろう。

1 2 3 4

これ

unique(out[is.na(out$codeHelper),c(1,length(colnames(out)))])

あなたが探しているものでなければなりません？

他のヒント

このような何かを試してみてください

subset(dataframe.name, !duplicated(country.colname),
       select=c(col1.name, col2.name, ...))

部分的重複を削除する方法：

また、この関連の質問を参照データフレームからですか

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow