
Welche Methode verwenden Sie, wenn Sie Performance-Daten über bestimmte Codepfade bekommen?

Diese Methode hat einige Einschränkungen, aber ich es immer noch sehr nützlich finden. Ich werde die Grenzen Liste (ich kenne) vorne und lasse wer will es so auf eigenes Risiko verwenden tun.

  1. Die ursprüngliche Version, die ich geschrieben Zeit in rekursiven Aufrufen ausgegeben über berichtet (wie in den Kommentaren auf die Antwort darauf hingewiesen).
  2. Es ist nicht Thread sicher, es war nicht Thread-sicher, bevor ich den Code hinzugefügt Rekursion zu ignorieren und es ist sogar noch weniger Faden sicher jetzt.
  3. Obwohl es sehr effizient ist, wenn es oft (in Millionen) genannt wird, wird es einen messbaren Effekt auf das Ergebnis haben, so dass Tive Sie länger dauern messen, als Sie dies nicht tun.

Ich benutze diese Klasse, wenn das Problem bei der Hand nicht Profilierungs meinen Code alle nicht rechtfertigt oder ich einige Daten aus einem Profiler, die ich überprüfen möchten. Grundsätzlich bringt es die Zeit, die Sie in einem bestimmten Block ausgegeben und am Ende der Programmausgaben bis es an den Debug-Stream (sichtbar mit DbgView ), einschließlich wie oft wurde der Code (und den durchschnittlichen Zeitaufwand natürlich ausgeführt wird)).

#pragma once
#include <tchar.h>
#include <windows.h>
#include <sstream>
#include <boost/noncopyable.hpp>

namespace scope_timer {
    class time_collector : boost::noncopyable {
        __int64 total;
        LARGE_INTEGER start;
        size_t times;
        const TCHAR* name;

        double cpu_frequency()
        { // cache the CPU frequency, which doesn't change.
            static double ret = 0; // store as double so devision later on is floating point and not truncating
            if (ret == 0) {
                LARGE_INTEGER freq;
                ret = static_cast<double>(freq.QuadPart);
            return ret;
        bool in_use;

        time_collector(const TCHAR* n)
            : times(0)
            , name(n)
            , total(0)
            , start(LARGE_INTEGER())
            , in_use(false)

            std::basic_ostringstream<TCHAR> msg;
            msg << _T("scope_timer> ") <<  name << _T(" called: ");

            double seconds = total / cpu_frequency();
            double average = seconds / times;

            msg << times << _T(" times total time: ") << seconds << _T(" seconds  ")
                << _T(" (avg ") << average <<_T(")\n");

        void add_time(__int64 ticks)
            total += ticks;
            in_use = false;

        bool aquire()
            if (in_use)
                return false;
            in_use = true;
            return true;

    class one_time : boost::noncopyable {
        LARGE_INTEGER start;
        time_collector* collector;
        one_time(time_collector& tc)
            if (tc.aquire()) {
                collector = &tc;
                collector = 0;

            if (collector) {
                LARGE_INTEGER end;
                collector->add_time(end.QuadPart - start.QuadPart);

// Usage TIME_THIS_SCOPE(XX); where XX is a C variable name (can begin with a number)
#define TIME_THIS_SCOPE(name) \
    static scope_timer::time_collector st_time_collector_##name(_T(#name)); \
    scope_timer::one_time st_one_time_##name(st_time_collector_##name)

Ich mache meine Profile durch die Schaffung von zwei Klassen. cProfile und cProfileManager

cProfileManager hält alle Daten, die von cProfile geführt.

cProfile mit haben die folgenden Anforderungen:

  • cProfile hat einen Konstruktor, die die aktuelle Zeit initialisiert.
  • cProfile hat eine Deconstructor, die die Gesamtzeit sendet die Klasse war, am Leben cProfileManager

diese Profilklassen nutzen zu können, habe ich zunächst eine Instanz von cProfileManager machen. Dann habe ich den Code-Block, den ich ein Profil erstellen möchten, in geschweiften Klammern. Innerhalb der geschweiften Klammern, erstelle ich eine cProfile Instanz. Wenn der Codeblock endet, cProfile wird die Zeit, die für den Codeblock cProfileManager zu beenden nahm senden.

Beispiel-Code Hier ist ein Beispiel für den Code (vereinfacht):

class cProfile
        TimeStart = GetTime();

        ProfileManager->AddProfile (GetTime() - TimeStart);

    float TimeStart;

Zur Nutzung cProfile, ich würde so etwas tun:

int main()
    printf("Start test");
        cProfile Profile;

oder folgt aus:

void foobar()
    cProfile ProfileFoobar;

        cProfile ProfileBarCheck;
        while (bar())
            cProfile ProfileSpam;

Technischer Hinweis

Dieser Code tatsächlich ein Missbrauch des Weges Scoping ist, Konstrukteure und deconstructors in C ++ . cProfile existiert nur innerhalb des Blocks Umfang (der Codeblock wir testen wollen). Sobald das Programm den Block Umfang verlässt, cProfile zeichnet das Ergebnis.

Zusätzliche Erweiterungen

  • Sie können einen String-Parameter an den Konstruktor hinzufügen, so dass Sie etwas tun können: cProfile Profil ( "Profile für komplizierte Berechnung");

  • Sie ein Makro verwenden können, um den Code-Look sauberer zu machen (Vorsicht, dies nicht zu missbrauchen. Im Gegensatz zu unseren anderen Verletzungen auf der Sprache, Makros kann gefährlich sein, wenn sie verwendet werden).


    #define START_PROFILE cProfile Profil (); { #define END_PROFILE}

  • cProfileManager kann überprüfen, wie oft ein Block von Code aufgerufen wird. Aber Sie würden eine Kennung für den Codeblock benötigen. Die erste Erweiterung kann helfen, den Block zu identifizieren. Dies kann in Fällen nützlich sein, wenn der Code, den Sie ist in einer Schleife ein Profil erstellen möchten (wie das zweite Beispiel aboe). Sie können auch die durchschnittliche, schnellste und längste Ausführungszeit fügen Sie den Code-Block hat.

  • Vergessen Sie nicht, einen Scheck überspringen Profilierung hinzufügen, wenn Sie im Debug-Modus sind.

Beachten Sie, nach dem sich alle speziell für Windows geschrieben.

Ich habe auch eine Timer-Klasse, die ich schnell und unsaubere Profilierung zu tun, schrieb die Queryperformancecounter () verwendet hochpräzise Zeitpunkt zu bekommen, aber mit einem kleinen Unterschied. Mein Timer-Klasse-Dump nicht die verstrichene Zeit, wenn das Timer-Objekt außerhalb des Bereichs fällt. Stattdessen sammelt es die verstrichene Zeit in zu einer Sammlung. Ich habe eine statische Elementfunktion, dump (), die eine Tabelle von verstrichenen Zeiten erzeugt, nach Kategorie geordnet Timing (angegeben in Timer Konstruktor als String) zusammen mit einiger statistischen Analyse wie Mittelwert verstrichene Zeit, die Standardabweichung, max und min. Ich habe auch eine Clear () statische Member-Funktion, die die Sammlung löscht und lassen Sie wieder von vorn beginnen.

Wie die Timer-Klasse verwenden (psudocode):

int CInsertBuffer::Read(char* pBuf)
       // TIMER NOTES: Avg Execution Time = ~1 ms
       Timer timer("BufferRead");
       :      :
       return -1;


Timer Precision = 418.0095 ps

=== Item               Trials    Ttl Time  Avg Time  Mean Time StdDev    ===
    AddTrade           500       7 ms      14 us     12 us     24 us
    BufferRead         511       1:19.25   0.16 s    621 ns    2.48 s
    BufferWrite        516       511 us    991 ns    482 ns    11 us
    ImportPos Loop     1002      18.62 s   19 ms     77 us     0.51 s
    ImportPosition     2         18.75 s   9.38 s    16.17 s   13.59 s
    Insert             515       4.26 s    8 ms      5 ms      27 ms
    recv               101       18.54 s   0.18 s    2603 ns   1.63 s

Datei Timer.inl:

#include <map>
#include "x:\utils\stlext\stringext.h"
#include <iterator>
#include <set>
#include <vector>
#include <numeric>
#include "x:\utils\stlext\algorithmext.h"
#include <math.h>

    class Timer
        Timer(const char* name)
            label = std::safe_string(name);

        virtual ~Timer()
            __int64 clocks = stopTime.QuadPart-startTime.QuadPart;
            double elapsed = (double)clocks/(double)TimerFreq();

        static std::string Dump(bool ClipboardAlso=true)
            static const std::string loc = "Timer::Dump";

            if( TimeMap().empty() )
                return "No trials\r\n";

            std::string ret = std::formatstr("\r\n\r\nTimer Precision = %s\r\n\r\n", format_elapsed(1.0/(double)TimerFreq()).c_str());

            // get a list of keys
            typedef std::set<std::string> keyset;
            keyset keys;
            std::transform(TimeMap().begin(), TimeMap().end(), std::inserter(keys, keys.begin()), extract_key());

            size_t maxrows = 0;

            typedef std::vector<std::string> strings;
            strings lines;

            static const size_t tabWidth = 9;

            std::string head = std::formatstr("=== %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s ===", tabWidth*2, tabWidth*2, "Item", tabWidth, tabWidth, "Trials", tabWidth, tabWidth, "Ttl Time", tabWidth, tabWidth, "Avg Time", tabWidth, tabWidth, "Mean Time", tabWidth, tabWidth, "StdDev");
            ret += std::formatstr("\r\n%s\r\n", head.c_str());
            if( ClipboardAlso ) 
                lines.push_back("Item\tTrials\tTtl Time\tAvg Time\tMean Time\tStdDev\r\n");
            // dump the values for each key
            {for( keyset::iterator key = keys.begin(); keys.end() != key; ++key )
                time_type ttl = 0;
                ttl = std::accumulate(TimeMap().begin(), TimeMap().end(), ttl, accum_key(*key));
                size_t num = std::count_if( TimeMap().begin(), TimeMap().end(), match_key(*key));
                if( num > maxrows ) 
                    maxrows = num;
                time_type avg = ttl / num;

                // compute mean
                std::vector<time_type> sortedTimes;
                std::transform_if(TimeMap().begin(), TimeMap().end(), std::inserter(sortedTimes, sortedTimes.begin()), extract_val(), match_key(*key));
                std::sort(sortedTimes.begin(), sortedTimes.end());
                size_t mid = (size_t)floor((double)num/2.0);
                double mean = ( num > 1 && (num % 2) != 0 ) ? (sortedTimes[mid]+sortedTimes[mid+1])/2.0 : sortedTimes[mid];
                // compute variance
                double sum = 0.0;
                if( num > 1 )
                    for( std::vector<time_type>::iterator timeIt = sortedTimes.begin(); sortedTimes.end() != timeIt; ++timeIt )
                        sum += pow(*timeIt-mean,2.0);
                // compute std dev
                double stddev = num > 1 ? sqrt(sum/((double)num-1.0)) : 0.0;

                ret += std::formatstr("    %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s\r\n", tabWidth*2, tabWidth*2, key->c_str(), tabWidth, tabWidth, std::formatstr("%d",num).c_str(), tabWidth, tabWidth, format_elapsed(ttl).c_str(), tabWidth, tabWidth, format_elapsed(avg).c_str(), tabWidth, tabWidth, format_elapsed(mean).c_str(), tabWidth, tabWidth, format_elapsed(stddev).c_str()); 
                if( ClipboardAlso )
                    lines.push_back(std::formatstr("%s\t%s\t%s\t%s\t%s\t%s\r\n", key->c_str(), std::formatstr("%d",num).c_str(), format_elapsed(ttl).c_str(), format_elapsed(avg).c_str(), format_elapsed(mean).c_str(), format_elapsed(stddev).c_str())); 

            ret += std::formatstr("%s\r\n", std::string(head.length(),'=').c_str());

            if( ClipboardAlso )
                // dump header row of data block
                    std::string s;
                    for( keyset::iterator key = keys.begin(); key != keys.end(); ++key )
                        if( key != keys.begin() )

                // blow out the flat map of time values to a seperate vector of times for each key
                typedef std::map<std::string, std::vector<time_type> > nodematrix;
                nodematrix nodes;
                for( Times::iterator time = TimeMap().begin(); time != TimeMap().end(); ++time )

                // dump each data point
                for( size_t row = 0; row < maxrows; ++row )
                    std::string rowDump;
                    for( keyset::iterator key = keys.begin(); key != keys.end(); ++key )
                        if( key != keys.begin() )
                        if( nodes[*key].size() > row )
                            rowDump.append(std::formatstr("%f", nodes[*key][row]));

                // dump to the clipboard
                std::string dump;
                for( strings::iterator s = lines.begin(); s != lines.end(); ++s )

                HGLOBAL hg = GlobalAlloc(GMEM_MOVEABLE, dump.length()+1);
                if( hg != 0 )
                    char* buf = (char*)GlobalLock(hg);
                    if( buf != 0 )
                        std::copy(dump.begin(), dump.end(), buf);
                        buf[dump.length()] = 0;
                        SetClipboardData(CF_TEXT, hg);

            return ret;

        static void Reset()

        static std::string format_elapsed(double d) 
            if( d < 0.00000001 )
                // show in ps with 4 digits
                return std::formatstr("%0.4f ps", d * 1000000000000.0);
            if( d < 0.00001 )
                // show in ns
                return std::formatstr("%0.0f ns", d * 1000000000.0);
            if( d < 0.001 )
                // show in us
                return std::formatstr("%0.0f us", d * 1000000.0);
            if( d < 0.1 )
                // show in ms
                return std::formatstr("%0.0f ms", d * 1000.0);
            if( d <= 60.0 )
                // show in seconds
                return std::formatstr("%0.2f s", d);
            if( d < 3600.0 )
                // show in min:sec
                return std::formatstr("%01.0f:%02.2f", floor(d/60.0), fmod(d,60.0));
            // show in h:min:sec
            return std::formatstr("%01.0f:%02.0f:%02.2f", floor(d/3600.0), floor(fmod(d,3600.0)/60.0), fmod(d,60.0));

        static __int64 TimerFreq()
            static __int64 freq = 0;
            static bool init = false;
            if( !init )
                LARGE_INTEGER li;
                freq = li.QuadPart;
                init = true;
            return freq;
        LARGE_INTEGER startTime, stopTime;
        std::string label;

        typedef std::string key_type;
        typedef double time_type;
        typedef std::multimap<key_type, time_type> Times;
//      static Times times;
        static Times& TimeMap()
            static Times times_;
            return times_;

        struct extract_key : public std::unary_function<Times::value_type, key_type>
            std::string operator()(Times::value_type const & r) const
                return r.first;

        struct extract_val : public std::unary_function<Times::value_type, time_type>
            time_type operator()(Times::value_type const & r) const
                return r.second;
        struct match_key : public std::unary_function<Times::value_type, bool>
            match_key(key_type const & key_) : key(key_) {};
            bool operator()(Times::value_type const & rhs) const
                return key == rhs.first;
            match_key& operator=(match_key&) { return * this; }
            const key_type key;

        struct accum_key : public std::binary_function<time_type, Times::value_type, time_type>
            accum_key(key_type const & key_) : key(key_), n(0) {};
            time_type operator()(time_type const & v, Times::value_type const & rhs) const
                if( key == rhs.first )
                    return rhs.second + v;
                return v;
            accum_key& operator=(accum_key&) { return * this; }
            const Times::key_type key;
            mutable size_t n;

Datei stringext.h (liefert formatstr () Funktion):

namespace std
    /*  ---

    Formatted Print

        template<class C>
        int strprintf(basic_string<C>* pString, const C* pFmt, ...);

        template<class C>
        int vstrprintf(basic_string<C>* pString, const C* pFmt, va_list args);

    Returns :

        # characters printed to output

    Effects :

        Writes formatted data to a string.  strprintf() works exactly the same as sprintf(); see your
        documentation for sprintf() for details of peration.  vstrprintf() also works the same as sprintf(), 
        but instead of accepting a variable paramater list it accepts a va_list argument.

    Requires :

        pString is a pointer to a basic_string<>

    --- */

    template<class char_type> int vprintf_generic(char_type* buffer, size_t bufferSize, const char_type* format, va_list argptr);

    template<> inline int vprintf_generic<char>(char* buffer, size_t bufferSize, const char* format, va_list argptr)
#       ifdef SECURE_VSPRINTF
        return _vsnprintf_s(buffer, bufferSize-1, _TRUNCATE, format, argptr);
#       else
        return _vsnprintf(buffer, bufferSize-1, format, argptr);
#       endif

    template<> inline int vprintf_generic<wchar_t>(wchar_t* buffer, size_t bufferSize, const wchar_t* format, va_list argptr)
#       ifdef SECURE_VSPRINTF
        return _vsnwprintf_s(buffer, bufferSize-1, _TRUNCATE, format, argptr);
#       else
        return _vsnwprintf(buffer, bufferSize-1, format, argptr);
#       endif

    template<class Type, class Traits>
    inline int vstringprintf(basic_string<Type,Traits> & outStr, const Type* format, va_list args)
        // prologue
        static const size_t ChunkSize = 1024;
        size_t curBufSize = 0;

        if( !format )
            return 0;

        // keep trying to write the string to an ever-increasing buffer until
        // either we get the string written or we run out of memory
        while( bool cont = true )
            // allocate a local buffer
            curBufSize += ChunkSize;
            std::ref_ptr<Type> localBuffer = new Type[curBufSize];
            if( localBuffer.get() == 0 )
                // we ran out of memory -- nice goin'!
                return -1;
            // format output to local buffer
            int i = vprintf_generic(localBuffer.get(), curBufSize * sizeof(Type), format, args);
            if( -1 == i )
                // the buffer wasn't big enough -- try again
            else if( i < 0 )
                // something wierd happened -- bail
                return i;
            // if we get to this point the string was written completely -- stop looping
            return i;
        // unreachable code
        return -1;

    // provided for backward-compatibility
    template<class Type, class Traits>
    inline int vstrprintf(basic_string<Type,Traits> * outStr, const Type* format, va_list args)
        return vstringprintf(*outStr, format, args);

    template<class Char, class Traits>
    inline int stringprintf(std::basic_string<Char, Traits> & outString, const Char* format, ...)
        va_list args;
        va_start(args, format);
        int retval = vstringprintf(outString, format, args);
        return retval;

    // old function provided for backward-compatibility
    template<class Char, class Traits>
    inline int strprintf(std::basic_string<Char, Traits> * outString, const Char* format, ...)
        va_list args;
        va_start(args, format);
        int retval = vstringprintf(*outString, format, args);
        return retval;

    /*  ---

    Inline Formatted Print

        string strprintf(const char* Format, ...);

    Returns :

        Formatted string

    Effects :

        Writes formatted data to a string.  formatstr() works the same as sprintf(); see your
        documentation for sprintf() for details of operation.  

    --- */

    template<class Char>
    inline std::basic_string<Char> formatstr(const Char * format, ...)
        std::string outString;

        va_list args;
        va_start(args, format);
        vstringprintf(outString, format, args);
        return outString;

Datei algorithmext.h (liefert transform_if () Funktion):

/*  ---


    template<class InputIterator, class OutputIterator, class UnaryOperation, class Predicate>
        OutputIterator transform_if(InputIterator first, InputIterator last, OutputIterator result, UnaryOperation op, Predicate pred)

    template<class InputIterator1, class InputIterator2, class OutputIterator, class BinaryOperation, class Predicate>
        OutputIterator transform_if(InputIterator first, InputIterator last, OutputIterator result, BinaryOperation binary_op, Predicate pred)


    T is of type EqualityComparable (20.1.1) 
    op and binary_op have no side effects

Effects :

    Assigns through every iterator i in the range [result, result + (last1-first1)) a new corresponding value equal to one of:
        1:  op( *(first1 + (i - result)) 
        2:  binary_op( *(first1 + (i - result), *(first2 + (i - result))

Returns :

    result + (last1 - first1)

Complexity :

    At most last1 - first1 applications of op or binary_op

--- */

template<class InputIterator, class OutputIterator, class UnaryFunction, class Predicate>
OutputIterator transform_if(InputIterator first, 
                            InputIterator last, 
                            OutputIterator result, 
                            UnaryFunction f, 
                            Predicate pred)
    for (; first != last; ++first)
        if( pred(*first) )
            *result++ = f(*first);
    return result; 

template<class InputIterator1, class InputIterator2, class OutputIterator, class BinaryOperation, class Predicate>
OutputIterator transform_if(InputIterator1 first1, 
                            InputIterator1 last1, 
                            InputIterator2 first2, 
                            OutputIterator result, 
                            BinaryOperation binary_op, 
                            Predicate pred)
    for (; first1 != last1 ; ++first1, ++first2)
        if( pred(*first1) )
            *result++ = binary_op(*first1,*first2);
    return result;

Nun, ich habe zwei Code-Schnipsel. In Pseudo-Code sie suchen wie (es ist eine vereinfachte Version, ich bin mit Queryperformance tatsächlich):

Erste Snippet:

Timer timer = new Timer

Second Snippet:

show elapsed time

Ein bisschen Hot-Keys kung fu, und ich kann sagen, wie viel Zeit dieses Stück Code von meiner CPU gestohlen hat.

Der Artikel Code-Profiler und Optimierungen hat eine Menge Informationen über C ++ Code Profilierung und hat auch einen kostenlosen Download-Link zu einem Programm / Klasse, die Ihnen eine grafische Darstellung für verschiedene Codepfade / Methoden zeigen.

Ich habe eine schnelle und unsaubere Profilierung Klasse, die selbst in den engen inneren Schleifen in Profilierung verwendet werden kann. Der Schwerpunkt liegt auf extrem geringes Gewicht und einfachen Code. Die Klasse weist eine zweidimensionale Anordnung von fester Größe. Ich füge dann „Checkpoint“ ruft alle über den Ort. Wenn checkpoint N unmittelbar nach checkpoint M erreicht ist, fügen I die verstrichene Zeit (in Mikrosekunden) auf das Array-Element [M, N]. Da diese ausgelegt ist, engen Schleifen zum Profil, ich habe auch Call „von Iteration beginnen“, dass die den „letzten Checkpoint“ Variable zurücksetzt. Am Ende des Tests produziert der dumpResults() Aufruf die Liste aller Paare von Checkpoints, die ihnen gefolgt, zusammen mit der Gesamtzeit berücksichtigt und nicht nachgewiesenes.

Ich schrieb eine einfache Cross-Plattform-Klasse namens nanotimer aus diesem Grund. Ziel war es so leicht wie möglich zu sein, um nicht mit dem tatsächlichen Code Leistung stören zu viele Befehle hinzufügen und dadurch den Befehls-Cache zu beeinflussen. Es ist in der Lage mikrosekundengenau immer über Windows, Mac und Linux (und wahrscheinlich einige Unix-Varianten).

Grund Nutzung:

plf::timer t;

// stuff

double elapsed = t.get_elapsed_ns(); // Get nanoseconds

start () startet auch den Timer, wenn nötig. „Pausieren“ der Timer kann durch Speichern der verstrichenen Zeit erreicht werden kann, dann den Timer neu zu starten, wenn „Die Fortsetzung“ und zur Ergänzung der gespeicherten Ergebnisses Sie das nächste Mal die verstrichene Zeit zu überprüfen.

