O consumidor Kafka Java nunca recebe nenhuma mensagem
-
26-12-2019 - |
Pergunta
Estou tentando configurar um consumidor Java básico para receber mensagens de um tópico Kafka.Eu segui o exemplo em - https://cwiki.apache.org/confluence/display/KAFKA/Consumer+Group+Example - e tenha este código:
package org.example.kafka.client;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Properties;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import kafka.consumer.ConsumerConfig;
import kafka.consumer.KafkaStream;
import kafka.javaapi.consumer.ConsumerConnector;
public class KafkaClientMain
{
private final ConsumerConnector consumer;
private final String topic;
private ExecutorService executor;
public KafkaClientMain(String a_zookeeper, String a_groupId, String a_topic)
{
this.consumer = kafka.consumer.Consumer.createJavaConsumerConnector(
createConsumerConfig(a_zookeeper, a_groupId));
this.topic = a_topic;
}
private static ConsumerConfig createConsumerConfig(String a_zookeeper, String a_groupId) {
Properties props = new Properties();
props.put("zookeeper.connect", a_zookeeper);
props.put("group.id", a_groupId);
props.put("zookeeper.session.timeout.ms", "1000");
props.put("zookeeper.sync.time.ms", "1000");
props.put("auto.commit.interval.ms", "1000");
props.put("auto.offset.reset", "smallest");
return new ConsumerConfig(props);
}
public void shutdown() {
if (consumer != null) consumer.shutdown();
if (executor != null) executor.shutdown();
}
public void run(int a_numThreads) {
Map<String, Integer> topicCountMap = new HashMap<String, Integer>();
topicCountMap.put(topic, new Integer(a_numThreads));
Map<String, List<KafkaStream<byte[], byte[]>>> consumerMap = consumer.createMessageStreams(topicCountMap);
List<KafkaStream<byte[], byte[]>> streams = consumerMap.get(topic);
System.out.println( "streams.size = " + streams.size() );
// now launch all the threads
//
executor = Executors.newFixedThreadPool(a_numThreads);
// now create an object to consume the messages
//
int threadNumber = 0;
for (final KafkaStream stream : streams) {
executor.submit(new ConsumerTest(stream, threadNumber));
threadNumber++;
}
}
public static void main(String[] args)
{
String zooKeeper = "ec2-whatever.compute-1.amazonaws.com:2181";
String groupId = "group1";
String topic = "test";
int threads = 1;
KafkaClientMain example = new KafkaClientMain(zooKeeper, groupId, topic);
example.run(threads);
}
}
e
package org.example.kafka.client;
import kafka.consumer.ConsumerIterator;
import kafka.consumer.KafkaStream;
public class ConsumerTest implements Runnable
{
private KafkaStream m_stream;
private int m_threadNumber;
public ConsumerTest(KafkaStream a_stream, int a_threadNumber)
{
m_threadNumber = a_threadNumber;
m_stream = a_stream;
}
public void run()
{
System.out.println( "calling ConsumerTest.run()" );
ConsumerIterator<byte[], byte[]> it = m_stream.iterator();
while (it.hasNext())
{
System.out.println("Thread " + m_threadNumber + ": " + new String(it.next().message()));
}
System.out.println("Shutting down Thread: " + m_threadNumber);
}
}
O Kafka está sendo executado no host EC2 em questão e posso enviar e receber mensagens sobre o tópico "teste" usando as ferramentas kafka-console-producer.sh e kafka-console-consumer.sh.A porta 2181 está aberta e disponível na máquina em que o consumidor está executando (assim como a 9092, para garantir, mas isso também não pareceu ajudar).
Infelizmente, nunca recebo nenhuma mensagem em meu consumidor quando executo isso.Nem mensagens existentes sobre o tópico, nem mensagens recém-enviadas que envio usando kafka-console-producer.sh, enquanto o consumidor está em execução.
Isso está usando Kafka 0.8.1.1 rodando em CentOS 6.4 x64, usando OpenJDK 1.7.0_65.
Editar:FWIW, quando o programa consumidor é iniciado, vejo esta saída do Zookeeper:
[2014-08-01 15:56:38,045] INFO Accepted socket connection from /98.101.159.194:24218 (org.apache.zookeeper.server.NIOServerCnxn)
[2014-08-01 15:56:38,049] INFO Client attempting to establish new session at /98.101.159.194:24218 (org.apache.zookeeper.server.NIOServerCnxn)
[2014-08-01 15:56:38,053] INFO Established session 0x1478e963fb30008 with negotiated timeout 6000 for client /98.101.159.194:24218 (org.apache.zookeeper.server.NIOServerCnxn)
Alguma ideia do que pode estar acontecendo com isso?Toda e qualquer ajuda é muito apreciada.
Solução
Respondendo eu mesmo para a posteridade, caso alguém se depare com um problema semelhante.
A questão era esta:O corretor Kafka e o Zookeeper estavam em um nó EC2, e o consumidor estava em meu laptop rodando localmente.Ao conectar-se ao Zookeeper, o cliente recebia uma referência a "ip-10-0-x-x.ec2.internal", que não é resolvida (por padrão) de fora do EC2.Isso ficou claro quando configurei corretamente o log4j no cliente e recebi todas as mensagens de log.
A solução alternativa foi apenas colocar uma entrada no meu arquivo /etc/hosts, mapeando o nome do host interno ec2 para o endereço IP roteável publicamente.
Outras dicas
Você pode resolver esse problema definindo a seguinte propriedade no arquivo server.properties localizado na pasta de configuração kafka
anunciado.host.name=dns público do servidor Ec2