Domanda

Stiamo scrivendo un algoritmo di elaborazione delle immagini che mira a un hardware Intel. Generalmente preferiamo implementazioni C generiche, ma abbiamo identificato un algoritmo che nel suo nucleo fa un sacco di trasformazioni discrete del coseno (DCT) che funziona molto bene. Sfortunatamente, i nostri requisiti di throughput sono tali che un'implementazione C generica è troppo lenta di circa 2 ordini di grandezza. Posso ottenere un ordine di grandezza attraverso altri trucchi, quindi se posso migliorare i miei DCT di circa un ordine di grandezza, ho un percorso verso il successo.

L'Intel MMX è un modo per ottenere l'accelerazione hardware per fare questi DCT? Esistono altre librerie e/o hardware specifici per Intel che posso sfruttare per accelerare questi cattivi ragazzi?

Dove comincio a guardare? Questo è un nuovo lavoro per me e la mia prima volta a scavare duramente nell'hardware Intel, quindi tutti i suggerimenti sarebbero molto apprezzati.

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top