Frage

Bereits meine Anwendung beendet, die vervielfacht CRS Matrix und Vektor (spmv) und das einzige, was jetzt zu tun ist, um FLOPS habe meine Anwendung zu zählen. Meiner Meinung nach bei Sparse Matrix ist es wirklich schwer Zahl der Gleitkommaoperation zu schätzen -. Vektor-Multiplikation, da die Anzahl der Multiplikationen in einer Reihe ist wirklich „schreckhaft“ oder fließend

Ich habe nur versucht, Zeit mit "cudaprof" (erhältlich in ./CUDA/bin Verzeichnis) zu messen -. Es funktioniert

Jede sugestions und Anleitung Pasten geschätzt!

War es hilfreich?

Lösung

Das ist nicht nur Ihre Meinung; es ist einfach Tatsache, dass die Anzahl der Operationen im Fall einer dünn besetzten Matrix ist datenabhängig, und so kann man keine vernünftige Antwort bekommen, ohne etwas über die Daten zu kennen. Das macht es unmöglich, eine One-Number-fits-all-Datenschätzung haben.

Dies ist wahrscheinlich eine der möglichen Situationen, in denen Sie es für viele Stunden hart denken konnte (und tun viel Forschung) eine maybe-genaue Schätzung zu machen, oder Sie können ein paar Minuten zu schreiben eine Variante Ihrer bestehenden verbringen Umsetzung daß ein Zähler bei jedem Motor hat einen Betrieb erhöht. Sicher, das eine ganze Weile läuft dauern wird (vor allem, wenn Sie es nicht tun, in einer CUDA-fähigen Form), aber wahrscheinlich viel weniger Zeit, als es dauern würde, das Denken zu tun, und wenn die Antwort kommt, Sie müssen nicht viel Arbeit tun, um sich zu überzeugen, dass es richtig ist.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top