Question

Nous écrivons un algorithme de traitement d'image ciblant du matériel Intel. Généralement, nous préférons les implémentations génériques C, mais nous avons identifié un algorithme qui, à son cœur, fait une tonne de transformations de cosinus discrètes (DCT) qui fonctionnent extrêmement bien. Malheureusement, nos exigences de débit sont telles qu'une implémentation générique C est d'environ 2 ordres de grandeur trop lente. Je peux obtenir un ordre de grandeur à travers quelques autres astuces, donc si je peux améliorer mes DCT par un ordre de grandeur, j'ai un chemin vers le succès.

L'Intel MMX est-il un moyen d'obtenir l'accélération matérielle pour faire ces DCT? Y a-t-il d'autres bibliothèques et / ou matériels spécifiques à Intel que je peux exploiter pour accélérer ces mauvais garçons?

Où dois-je commencer à regarder? C'est un nouveau travail pour moi, et ma première fois à creuser durement du matériel Intel, donc tous les pointeurs seraient les plus appréciés.

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top