Pergunta

Estou tentando configurar um consumidor Java básico para receber mensagens de um tópico Kafka.Eu segui o exemplo em - https://cwiki.apache.org/confluence/display/KAFKA/Consumer+Group+Example - e tenha este código:

package org.example.kafka.client;

import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Properties;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

import kafka.consumer.ConsumerConfig;
import kafka.consumer.KafkaStream;
import kafka.javaapi.consumer.ConsumerConnector;

public class KafkaClientMain 
{

    private final ConsumerConnector consumer;
    private final String topic;
    private  ExecutorService executor;  


    public KafkaClientMain(String a_zookeeper, String a_groupId, String a_topic) 
    {
        this.consumer = kafka.consumer.Consumer.createJavaConsumerConnector(
                createConsumerConfig(a_zookeeper, a_groupId));

        this.topic = a_topic;
    }    


    private static ConsumerConfig createConsumerConfig(String a_zookeeper, String a_groupId) {
        Properties props = new Properties();
        props.put("zookeeper.connect", a_zookeeper);
        props.put("group.id", a_groupId);
        props.put("zookeeper.session.timeout.ms", "1000");
        props.put("zookeeper.sync.time.ms", "1000");
        props.put("auto.commit.interval.ms", "1000");
        props.put("auto.offset.reset", "smallest");

        return new ConsumerConfig(props);
    }    

    public void shutdown() {
        if (consumer != null) consumer.shutdown();
        if (executor != null) executor.shutdown();
    }    


    public void run(int a_numThreads) {
        Map<String, Integer> topicCountMap = new HashMap<String, Integer>();
        topicCountMap.put(topic, new Integer(a_numThreads));
        Map<String, List<KafkaStream<byte[], byte[]>>> consumerMap = consumer.createMessageStreams(topicCountMap);
        List<KafkaStream<byte[], byte[]>> streams = consumerMap.get(topic);

        System.out.println( "streams.size = " + streams.size() );

        // now launch all the threads
        //
        executor = Executors.newFixedThreadPool(a_numThreads);

        // now create an object to consume the messages
        //
        int threadNumber = 0;
        for (final KafkaStream stream : streams) {
            executor.submit(new ConsumerTest(stream, threadNumber));
            threadNumber++;
        }
    }    


    public static void main(String[] args) 
    {


        String zooKeeper = "ec2-whatever.compute-1.amazonaws.com:2181";
        String groupId = "group1";
        String topic = "test";

        int threads = 1;

        KafkaClientMain example = new KafkaClientMain(zooKeeper, groupId, topic);

        example.run(threads);

    }

}

e

package org.example.kafka.client;

import kafka.consumer.ConsumerIterator;
import kafka.consumer.KafkaStream;

public class ConsumerTest implements Runnable 
{

    private KafkaStream m_stream;
    private int m_threadNumber;

    public ConsumerTest(KafkaStream a_stream, int a_threadNumber) 
    {
        m_threadNumber = a_threadNumber;
        m_stream = a_stream;
    }

    public void run() 
    {
        System.out.println( "calling ConsumerTest.run()" );
        ConsumerIterator<byte[], byte[]> it = m_stream.iterator();

        while (it.hasNext())
        {    
            System.out.println("Thread " + m_threadNumber + ": " + new String(it.next().message()));
        }


        System.out.println("Shutting down Thread: " + m_threadNumber);
    }
}

O Kafka está sendo executado no host EC2 em questão e posso enviar e receber mensagens sobre o tópico "teste" usando as ferramentas kafka-console-producer.sh e kafka-console-consumer.sh.A porta 2181 está aberta e disponível na máquina em que o consumidor está executando (assim como a 9092, para garantir, mas isso também não pareceu ajudar).

Infelizmente, nunca recebo nenhuma mensagem em meu consumidor quando executo isso.Nem mensagens existentes sobre o tópico, nem mensagens recém-enviadas que envio usando kafka-console-producer.sh, enquanto o consumidor está em execução.

Isso está usando Kafka 0.8.1.1 rodando em CentOS 6.4 x64, usando OpenJDK 1.7.0_65.

Editar:FWIW, quando o programa consumidor é iniciado, vejo esta saída do Zookeeper:

[2014-08-01 15:56:38,045] INFO Accepted socket connection from /98.101.159.194:24218 (org.apache.zookeeper.server.NIOServerCnxn)
[2014-08-01 15:56:38,049] INFO Client attempting to establish new session at /98.101.159.194:24218 (org.apache.zookeeper.server.NIOServerCnxn)
[2014-08-01 15:56:38,053] INFO Established session 0x1478e963fb30008 with negotiated timeout 6000 for client /98.101.159.194:24218 (org.apache.zookeeper.server.NIOServerCnxn)

Alguma ideia do que pode estar acontecendo com isso?Toda e qualquer ajuda é muito apreciada.

Foi útil?

Solução

Respondendo eu mesmo para a posteridade, caso alguém se depare com um problema semelhante.

A questão era esta:O corretor Kafka e o Zookeeper estavam em um nó EC2, e o consumidor estava em meu laptop rodando localmente.Ao conectar-se ao Zookeeper, o cliente recebia uma referência a "ip-10-0-x-x.ec2.internal", que não é resolvida (por padrão) de fora do EC2.Isso ficou claro quando configurei corretamente o log4j no cliente e recebi todas as mensagens de log.

A solução alternativa foi apenas colocar uma entrada no meu arquivo /etc/hosts, mapeando o nome do host interno ec2 para o endereço IP roteável publicamente.

Outras dicas

Você pode resolver esse problema definindo a seguinte propriedade no arquivo server.properties localizado na pasta de configuração kafka

anunciado.host.name=dns público do servidor Ec2

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top