Pergunta

Eu só assisti a um vídeo Tech Talk Google cobrindo "Polyworld" (encontrado aqui ) e eles falam sobre a criação de duas redes neurais para formar prole. A minha pergunta é, como é que um vá sobre combinação de duas redes neurais? Eles parecem tão diferentes que qualquer tentativa de combiná-los simplesmente formar uma terceira rede, totalmente alheios. Talvez eu estou faltando alguma coisa, mas eu não vejo uma boa maneira de tirar os aspectos positivos de duas redes neurais separadas e combiná-los em uma única. Se alguém poderia elaborar sobre esse processo, eu aprecio isso.

Foi útil?

Solução

Eles não seria realmente criação de duas redes neurais juntos. Presumivelmente, eles têm uma variedade de algoritmo genético que produz uma determinada estrutura de rede neural dada uma sequência particular de "genes". Eles começariam com uma população de sequências genéticas, produzir suas redes neurais característicos, e, em seguida, expor cada uma dessas redes com o mesmo regime de treinamento. Presumivelmente, algumas dessas redes responderia à formação melhor do que alguns outros (ou seja, eles seriam mais facilmente "treinável" para alcançar o comportamento desejado). Eles, então, tomar as sequências genéticas que produziram os melhores "trainees", cross-criá-los uns com os outros, produzir suas redes neurais característicos, que passaria então a ser expostos ao mesmo regime de treinamento. Presumivelmente, algumas dessas redes neurais na segunda geração seria ainda mais treinável que os de primeira geração. Estes seriam os pais da terceira geração, e assim por diante e assim por diante.

Outras dicas

Nem resposta até agora é fiel à natureza da Polyworld! ...

Eles descrevem ambos uma aplicação típica algoritmo genético (GA). Enquanto GA incorpora alguns dos elementos encontrados em Polyworld (reprodução, seleção), GA também implica alguma forma de critérios "objetivos" que visam orientar evolução para [relativamente] metas específicas.

Polyworld, por outro lado, é uma estrutura para Vida Artificial (ALife). Com ALife, a sobrevivência das criaturas individuais e sua capacidade de transmitir seus genes para outras gerações, é dirigida não tanto pela sua capacidade para satisfazer uma "função de aptidão particular" , mas em vez disso, está ligada a < strong> vários mais amplo, não-objetivo orientado, critérios , tais como a capacidade do indivíduo de se alimentar de forma compatível com o seu tamanho e seu metabolismo, a sua capacidade de predadores evitar, a sua capacidade de encontrar parceiros de acasalamento e também várias doses de sorte e aleatoriedade.

O modelo de Polyworld associado com as criaturas e seu mundo é relativamente fixo (por exemplo, todos eles têm acesso a (embora não pode eleger para uso) vários sensores básicas (por cor, por forma ...) e vários atuadores ( "dispositivos" para comer, para acasalar, para transformar, para mover ...) e estas funções sensoriais e motoras básicas não evoluem (como for na natureza, por exemplo, quando criaturas encontrar maneiras de se tornar sensível ao calor ou a sons e / ou encontrar formas de movimento que são diferentes da moção original primitivas etc ...)

Por outro lado, o cérebro de criaturas tem estrutura e conexões que são tanto o produto de genética make-up ( "coisas" de seus ancestrais) da criatura e própria experiência . Por exemplo, o algoritmo principal usada para determinar a resistência das ligações entre os neurónios utiliza lógica Hebbiana (isto é fogo-juntos, fio-juntos) durante o tempo de vida da criatura (no início, acredito, como o algoritmo tem muitas vezes um "arrefecimento "fator que minimiza sua capacidade de mudar as coisas em grande forma, como o tempo passa). Não está claro se o modelo inclui alguma forma de evolução Lamarkian, pelo que alguns dos comportamentos de alto nível são [diretamente] transmitida através dos genes, em vez de ser [possivelmente] relearnt com cada geração (com base indirecta de alguns passou geneticamente estrutura).

A diferença marcante entre ALife e GA (e há outros!) É que, com ALife, o foco está em observando e fomentando em formas não-dirigida , comportamentos emergentes -Tanto faz que sejam - , tais como, por exemplo, quando algumas criaturas evoluir uma maquiagem que pede-lhes para esperar perto pilhas de comida verde e espera para escuras criaturas verdes para matá-los, ou algumas criaturas podem começar a colaborar um com o outro, por exemplo, buscando presença um do outro para outros fins que não o acasalamento etc. com GA, o foco é em um comportamento particular do programa sendo evoluída . Por exemplo, o objectivo pode ser o de que o programa de reconhecer bordas numa imagem de vídeo, e portanto a evolução é favorecido nesta direcção específica. programas individuais que executam essa tarefa melhor (como medida com alguma "função de fitness") são favorecidos em relação à evolução.

Outra diferença menos óbvio, mas importante diz respeito a forma como as criaturas (ou programas no caso de GA) se reproduzem. Com ALife, criaturas individuais encontrar os seus próprios parceiros de acasalamento , de forma aleatória no primeiro embora, depois de algum tempo eles podem aprender a reproduzir somente com criaturas que exibem um atributo ou comportamento particular. Com GA, por outro lado, "sexo" é deixado para o quadro GA si, que escolhe, por exemplo, de um modo preferido, os indivíduos cruzamento de raças (e clones dos mesmos) que pontuam bem sobre a função de fitness (e umlways deixando espaço para alguma aleatoriedade, para que as estadias de busca de soluções preso em algum máximos locais, mas o ponto é que o quadro GA decide principalmente quem tem relações sexuais com quem) ...

Tendo esclarecido isso, podemos voltar a pergunta original do OP ...
... como é que um vá sobre combinação de duas redes neurais? Eles parecem tão diferentes que qualquer tentativa de combiná-los simplesmente formar uma terceira rede, totalmente alheios. ... Eu não vejo uma boa maneira de tirar os aspectos positivos de duas redes neurais separadas e combiná-los em uma única ...
O "composição genética" de uma criatura particular afeta parâmetros , tais como o tamanho da criatura, sua cor e tal. Inclui também os parâmetros associados com o cérebro, em particular a sua estrutura: o número de neurónios, a existência de ligação a partir de diversos sensores (. Por exemplo, se a criatura ver a cor azul muito bem?) A existência de conexões para vários actuadores (por exemplo. se a criatura usar sua luz?). As ligações específicas entre neurónios e a força relativa destes também pode ser passado nos genes, se apenas a servir como valores iniciais, para ser rapidamente alterada durante a fase de aprendizagem cerebral.
Ao tomar duas criaturas, nós [natureza!] Pode selecionar de uma forma mais ou menos aleatória, qual parâmetro vêm da primeira criatura e que vêm da outra criatura (bem como alguns novela "mutações ", que vêm de nem os pais). Por exemplo, se o "pai" tinha muitas ligações com sensor de cor vermelha, mas a mãe não a prole pode ser parecido com o pai nesta área, mas também obter estrutura 4 de neuro-camadas de sua mãe, em vez de neuro-camadas do pai 6 estrutura .
O interesse de fazer isso é para descobrir novas capacidades dos indivíduos ; no exemplo acima, a criatura pode agora melhor detectar predadores cor vermelha, e também informações processo mais rapidamente em seu cérebro um pouco mais simples (em comparação com o pai de). Nem todos os filhos estão melhor equipados do que seus pais, tais indivíduos mais fracos, podem desaparecer em pouco tempo (ou, eventualmente, e felizmente sobreviver o tempo suficiente, para fornecer, por exemplo, a sua maneira extravagante de se mover e fugir de predadores, mesmo que seu pai fez cegar ou muito grande ou o que quer ... a principal coisa novamente:. é não estar tão preocupado com utilidade imediata de uma característica particular, apenas para vê-lo jogar no longo prazo

As redes neurais não são (provavelmente) neste árvores caso arbitrárias. Eles são provavelmente redes com uma estrutura constante, ou seja mesmos nós e conexões, então 'criação' eles envolveria 'média' dos pesos de nós. Pode-se calcular a média dos pesos para cada par de nós nas duas redes correspondentes para produzir o líquido 'descendência'. Ou você pode usar uma função mais complicada dependente cada vez mais conjuntos de nós vizinhos - as possibilidades são vastas. Minha resposta é incompleta se a suposição sobre a estrutura fixa é falsa ou injustificada.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top