Des accélérations matérielles basées sur Intel pour DCT?
-
30-10-2019 - |
Question
Nous écrivons un algorithme de traitement d'image ciblant du matériel Intel. Généralement, nous préférons les implémentations génériques C, mais nous avons identifié un algorithme qui, à son cœur, fait une tonne de transformations de cosinus discrètes (DCT) qui fonctionnent extrêmement bien. Malheureusement, nos exigences de débit sont telles qu'une implémentation générique C est d'environ 2 ordres de grandeur trop lente. Je peux obtenir un ordre de grandeur à travers quelques autres astuces, donc si je peux améliorer mes DCT par un ordre de grandeur, j'ai un chemin vers le succès.
L'Intel MMX est-il un moyen d'obtenir l'accélération matérielle pour faire ces DCT? Y a-t-il d'autres bibliothèques et / ou matériels spécifiques à Intel que je peux exploiter pour accélérer ces mauvais garçons?
Où dois-je commencer à regarder? C'est un nouveau travail pour moi, et ma première fois à creuser durement du matériel Intel, donc tous les pointeurs seraient les plus appréciés.
Pas de solution correcte