質問

Amazon Elastic Map ReduceのHadoopストリーミングワークフローに取り組んでおり、いくつかのバイナリオブジェクトをシリアル化してHadoopにストリーミングすることが含まれます。 Hadoopには、ストリーミング入力に最大のライン長がありますか?

私は大きくて大きな線でテストし始めましたが、最初にここで尋ねると考えました。

役に立ちましたか?

解決

ラインの長さに制限が課されていないようです。質問をしてから、バイナリオブジェクトをシリアル化するコードを作成し、Base64でそれらをエンコードし、処理のためにストリームに入れます。その結果、いくつかの行は非常に長いです。 Hadoopは、苦情と一緒にまっすぐ噛みます。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top