コピー方法以外のCassandraに荷重をかける方法は?
-
20-12-2019 - |
質問
.casvファイルをCassandraテーブルにCPYするためのコピー方法を使用しています。 しかし、レコードの不一致エラーを取得しています。
Record 41(Line 41) has mismatched number of records (85 instead of 82)
.
これはすべての.csvファイルとすべての.csvファイルが生成されたシステムであるすべての.csvファイルで起こります..
このエラーのために任意の作業..?
解決
あなたのエラーメッセージに基づいて、それは記録41まで、コピーコマンドがあなたのために働いているように聞こえます。区切り文字として何を使っていますか? COPY
コマンドのデフォルトの区切り文字はコンマであり、41行目に追加のコンマがいくつかあることを賭けます。
いくつかのオプション:
- データを編集して追加のコンマを削除します。
-
COPY
のデフォルトのQUOTE
の値は "であるため、すべてのフィールドの値を二重引用符でカプセル化するように変更します。これにより、テキスト内のカンマを残すことができます。< / li> - コンマの代わりにpipes | で区切るために.csvファイルを変更し、
COPY
コマンドのDELIMITER
オプションを | に設定します。 - cassandra bulk loader または json2sStableユーティリティデータをインポートします。私はそれらを使ったことがないが、あなたがあなたのデータセットにコンマがあるならば、私は似ているでしょう。
所属していません StackOverflow