質問
私のスクリプトの中でいくつかの点で私はmissing values
の数を確認したいです
私data.frame
で、それらを表示します。
私の場合は私が持っています:
out <- read.csv(file="...../OUT.csv", na.strings="NULL")
sum(is.na(out$codeHelper))
out[is.na(out$codeHelper),c(1,length(colnames(out)))]
これは完全に正常に動作します。
しかし、最後のコマンドが明らかに例えば、私data.frame
がNA
で全体TRUE
を与えます:
5561 Yemen (PDR) <NA>
5562 Yemen (PDR) <NA>
5563 Yemen (PDR) <NA>
5564 Yemen (PDR) <NA>
5565 Yemen (PDR) <NA>
5566 Yemen (PDR) <NA>
5567 Yemen (PDR) <NA>
5568 Yemen (PDR) <NA>
5601 Zaire (Democ Republic Congo) <NA>
5602 Zaire (Democ Republic Congo) <NA>
5603 Zaire (Democ Republic Congo) <NA>
5604 Zaire (Democ Republic Congo) <NA>
5605 Zaire (Democ Republic Congo) <NA>
大きなフレームとかなり厄介に見えるのNAの多い。 NAはどの国すなわち発生した場合にのみ私にとって重要です (2列目)、3列目の欠損値を有している。
それでは、どのように私はそれぞれの国のための単一の行を表示することができますか?
これは、次のようになります。
1 Yemen (PDR) <NA>
2 Zaire (Democ Republic Congo) <NA>
3 USA <NA>
4 W. Samoa <NA>
解決
unique(c(1,2,3,4,4))
あなたを与えるだろう。
1 2 3 4
これ
unique(out[is.na(out$codeHelper),c(1,length(colnames(out)))])
あなたが探しているものでなければなりません?
他のヒント
このような何かを試してみてください
subset(dataframe.name, !duplicated(country.colname),
select=c(col1.name, col2.name, ...))
部分的重複を削除する方法:また、この関連の質問を参照データフレームからですか
所属していません StackOverflow