Speed up hardware basati su Intel per DCT?
-
30-10-2019 - |
Domanda
Stiamo scrivendo un algoritmo di elaborazione delle immagini che mira a un hardware Intel. Generalmente preferiamo implementazioni C generiche, ma abbiamo identificato un algoritmo che nel suo nucleo fa un sacco di trasformazioni discrete del coseno (DCT) che funziona molto bene. Sfortunatamente, i nostri requisiti di throughput sono tali che un'implementazione C generica è troppo lenta di circa 2 ordini di grandezza. Posso ottenere un ordine di grandezza attraverso altri trucchi, quindi se posso migliorare i miei DCT di circa un ordine di grandezza, ho un percorso verso il successo.
L'Intel MMX è un modo per ottenere l'accelerazione hardware per fare questi DCT? Esistono altre librerie e/o hardware specifici per Intel che posso sfruttare per accelerare questi cattivi ragazzi?
Dove comincio a guardare? Questo è un nuovo lavoro per me e la mia prima volta a scavare duramente nell'hardware Intel, quindi tutti i suggerimenti sarebbero molto apprezzati.
Nessuna soluzione corretta