Pergunta

Sinto a necessidade de velocidade. O duplo para loops está matando o desempenho dos meus aplicativos para iPad. Eu preciso de simd. Como faço para executar operações inteiras SIMD no processador iPad A4?

Obrigado,
Doug

Foi útil?

Solução

Para obter a velocidade mais rápida, você precisará escrever código de linguagem de montagem do ARM que use operações de NEON SIMD, porque os compiladores C geralmente não fazem um bom código SIMD, portanto, a montagem escrita à mão fará uma grande diferença. Eu tenho uma breve introdução aqui: http://www.servinemami.co.cc/iphoneassembly.html

Observe que o iPad A4 usa a CPU ARMV7-A; portanto, o manual de referência para as instruções de neon simd está em: http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html(Mas suas páginas de 2000 páginas e requer o entendimento do código da montagem e talvez sim em geral!).

Outras dicas

O conjunto de instruções é neon, referência intrínseca

Nunca fui capaz de encontrar uma boa documentação sobre o que todos eles realmente são. Mas você pega muito rapidamente se você teve alguma exposição ao SSE

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top