Comment puis-je effectuer des opérations SIMD entier sur le processeur A4 iPad?
Question
Je me sens le besoin de vitesse. Double pour les boucles sont en train de tuer les performances de mon iPad. J'ai besoin SIMD. Comment puis-je effectuer des opérations SIMD entier sur le processeur A4 iPad?
Merci,
Doug
La solution
Pour obtenir la plus grande vitesse, vous devez écrire du code de langue ARM Assemblée qui utilise les opérations NEON SIMD, parce que les compilateurs C ne font pas très bon code SIMD généralement, si l'Assemblée écrite à la main fera une grande différence. J'ai une brève introduction ici: http://www.shervinemami.co.cc/iphoneAssembly.html
Notez que l'iPad A4 utilise le CPU ARMv7-A, de sorte que le manuel de référence pour les instructions NEON SIMD est à: http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html (Mais ses 2000 pages et nécessite la compréhension du code Assembleur et peut-être SIMD en! Général).
Autres conseils
Le jeu d'instructions est NEON, intrinsics référence
Je ne l'ai jamais été en mesure de trouver une bonne documentation sur ce qu'ils sont en réalité. Mais vous le ramasser assez rapidement si vous avez eu une exposition à SSE