

Edit: Der Code hier noch einige Fehler in ihm hat, und es könnte besser in der Performance-Abteilung, aber anstatt zu versuchen, dieses Problem zu beheben, für die Aufzeichnung habe ich das Problem über die Intel Diskussionsgruppen und haben viele tolle Feedback, und wenn alles gut geht eine polierte Version von Atomic Schwimmer wird in naher Zukunft Version von Intel Threading Building Blocks enthalten sein

Ok hier ist eine schwierige Frage, ich will einen Atomic Schwimmer, nicht für superschnelle Grafikleistung, aber routinemäßig als Daten-Elemente von Klassen verwenden. Und ich will nicht den Preis die Verwendung von Sperren auf diesen Klassen zahlen, weil es keinen zusätzlichen Nutzen für meine Bedürfnisse zur Verfügung stellt.

Jetzt mit Intel TBB und anderen Atom Bibliotheken, die ich gesehen habe, Integer-Typen werden unterstützt, aber nicht schwimmende Punkte. Also ging ich auf und implementiert ein, und es funktioniert ... aber ich bin nicht sicher, ob es wirklich funktioniert, oder ich bin einfach sehr glücklich, dass es funktioniert.

Jeder hier weiß, ob dies nicht irgendeine Form ist Häresie des Threading?

typedef unsigned int uint_32;

  struct AtomicFloat
    tbb::atomic<uint_32> atomic_value_;

    template<memory_semantics M>
    float fetch_and_store( float value ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::fetch_and_store<M>((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    float fetch_and_store( float value ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::fetch_and_store((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    template<memory_semantics M>
    float compare_and_swap( float value, float comparand ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::compare_and_swap<M>((uint_32&)value,(uint_32&)compare);
        return reinterpret_cast<const float&>(value_);

    float compare_and_swap(float value, float compare)
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::compare_and_swap((uint_32&)value,(uint_32&)compare);
        return reinterpret_cast<const float&>(value_);

    operator float() const volatile // volatile qualifier here for backwards compatibility 
        const uint_32 value_ = atomic_value_;
        return reinterpret_cast<const float&>(value_);

    float operator=(float value)
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::operator =((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    float operator+=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ + value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator*=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ * value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator/=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ / value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator-=(float value)
        return this->operator+=(-value);

    float operator++() 
        return this->operator+=(1);

    float operator--() 
        return this->operator+=(-1);

    float fetch_and_add( float addend ) 
        return this->operator+=(-addend);

    float fetch_and_increment() 
        return this->operator+=(1);

    float fetch_and_decrement() 
        return this->operator+=(-1);


Edit: geändert size_t uint32_t als Greg Rogers vorgeschlagen, auf diese Weise seine mehr tragbar

Edit:. hinzugefügt für die Auflistung der gesamten Sache, mit einigen Korrekturen

Mehr Edits: weise Leistung eines gesperrten Schwimmer für 5.000.000 + = Operationen mit 100 Fäden auf meiner Maschine nimmt 3.6s verwenden, während mein Atom Schwimmer auch mit seinem dummen do-while 0.2s nimmt die gleiche Arbeit zu tun. So ist die> 30x Leistungssteigerung bedeutet, es lohnt sich, (und das ist der Haken) wenn ihr richtig.

Noch mehr Edits: Wie awgn meine fetch_and_xxxx Teile waren alle falsch herausgestellt. Festgelegt, dass und entfernt Teile der API bin ich nicht sicher (Templat Speichermodelle). Und umgesetzt andere Operationen in Bezug auf die Operator + = Code zur Vermeidung von Wiederholungen

am: hinzugefügt Operator * = und Operator / =, da schwimmt nicht ohne sie schwimmt sein würde. Dank Peterchen Kommentar, dass dies bemerkt wurde

Edit: Die neueste Version des Codes folgt (Ich werde die alte Version als Referenz verlassen obwohl)

  #include <tbb/atomic.h>
  typedef unsigned int      uint_32;
  typedef __TBB_LONG_LONG       uint_64;

  template<typename FLOATING_POINT,typename MEMORY_BLOCK>
  struct atomic_float_
    /*  CRC Card -----------------------------------------------------
    |   Class:          atmomic float template class
    |   Responsability: handle integral atomic memory as it were a float,
    |                   but partially bypassing FPU, SSE/MMX, so it is
    |                   slower than a true float, but faster and smaller
    |                   than a locked float.
    |                       *Warning* If your float usage is thwarted by
    |                   the A-B-A problem this class isn't for you
    |                       *Warning* Atomic specification says we return,
    |                   values not l-values. So  (i = j) = k doesn't work.
    |   Collaborators:  intel's tbb::atomic handles memory atomicity
    typedef typename atomic_float_<FLOATING_POINT,MEMORY_BLOCK> self_t;

    tbb::atomic<MEMORY_BLOCK> atomic_value_;

    template<memory_semantics M>
    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    template<memory_semantics M>
    FLOATING_POINT compare_and_swap( FLOATING_POINT value, FLOATING_POINT comparand ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT compare_and_swap(FLOATING_POINT value, FLOATING_POINT compare)
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    operator FLOATING_POINT() const volatile // volatile qualifier here for backwards compatibility 
        const MEMORY_BLOCK value_ = atomic_value_;
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return the a copy of the base value not an l-value
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return an l-value when operating among atomics
    self_t& operator=(self_t& rhs) 
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return *this;

    FLOATING_POINT& _internal_reference() const
        return reinterpret_cast<FLOATING_POINT&>(atomic_value_.tbb::atomic<MEMORY_BLOCK>::_internal_reference());

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ + value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ * value;
        //floating point binary representation is not an issue becaus
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ / value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        return this->operator+=(-value); //return resulting value

    //Prefix operator
    FLOATING_POINT operator++()
        return this->operator+=(1); //return resulting value

    //Prefix operator
    FLOATING_POINT operator--() 
        return this->operator+=(-1); //return resulting value

    //Postfix operator
    FLOATING_POINT operator++(int)
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    //Postfix operator
    FLOATING_POINT operator--(int) 
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    FLOATING_POINT fetch_and_add( FLOATING_POINT addend ) 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_increment() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_decrement() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

  typedef atomic_float_<float,uint_32> AtomicFloat;
  typedef atomic_float_<double,uint_64> AtomicDouble;
würde ich ernsthaft davon abraten öffentliche Vererbung. Ich weiß nicht, was die Atom Umsetzung ist wie, aber ich bin es überladene Operatoren davon aus, dass es als integralen Typen verwenden, was bedeutet, dass diese Aktionen statt Ihrem Schwimmer in viele verwendet werden (vielleicht die meisten?) Fällen.

Ich sehe keinen Grund, warum das nicht funktionieren würde, aber wie du ich muß Weg, das beweisen ...

Ein Hinweis: Ihre operator float() Routine Last-acquire keine Semantik hat, und es sollte nicht const volatil gekennzeichnet sein (oder auf jeden Fall mindestens const)

EDIT:. Wenn Sie vorhaben, Betreiber zur Verfügung zu stellen - () Sie beide Präfix / postfix Formen bieten sollte

Es sieht aus wie Ihre Implementierung, die sizeof(size_t) == sizeof(float) annimmt. Wird das immer für Ihre Zielplattformen wahr sein?

Und ich würde nicht sagen, Threading Ketzerei so viel wie Gießen Ketzerei. :)

Obwohl die Größe eines uint32_t kann die eines float auf einem bestimmten Bogen entspricht, durch eine Besetzung von einem in die anderen neu zu interpretieren Sie implizit davon aus, dass atomic Inkrementen dekrementiert und alle anderen Operationen auf Bits sind auf beiden Typen semantisch äquivalent, die in Wirklichkeit nicht sind. Ich bezweifle es funktioniert wie erwartet.

Ich bezweifle stark, dass Sie die richtigen Werte in fetch_and_add erhalten usw., als Schwimmer zusätzlich von int hinaus unterscheidet.

Hier ist, was ich von diesem arithmetics bekommen:

1   + 1    =  1.70141e+038  
100 + 1    = -1.46937e-037  
100 + 0.01 =  1.56743e+038  
23  + 42   = -1.31655e-036  

Also ja, THREAD aber nicht das, was man erwartet.

die Lock-Free-Algorithmen (Operator + etc.) funktionieren soll Unteilbarkeit in Bezug auf (habe für den Algorithmus selbst nicht geprüft ..)

Andere Lösung: Da es alle Additionen und Subtraktionen ist, könnten Sie in der Lage sein, jedem Thread seine eigene Instanz zu geben, dann die Ergebnisse von mehreren Threads hinzuzufügen.

Dies ist der Zustand des Codes, wie es jetzt nach Gesprächen auf den Intel-Boards steht, wurde aber noch nicht gründlich in allen Szenarien arbeiten korrekt verifiziert.

  #include <tbb/atomic.h>
  typedef unsigned int      uint_32;
  typedef __TBB_LONG_LONG       uint_64;

  template<typename FLOATING_POINT,typename MEMORY_BLOCK>
  struct atomic_float_
    /*  CRC Card -----------------------------------------------------
    |   Class:          atmomic float template class
    |   Responsability: handle integral atomic memory as it were a float,
    |                   but partially bypassing FPU, SSE/MMX, so it is
    |                   slower than a true float, but faster and smaller
    |                   than a locked float.
    |                       *Warning* If your float usage is thwarted by
    |                   the A-B-A problem this class isn't for you
    |                       *Warning* Atomic specification says we return,
    |                   values not l-values. So  (i = j) = k doesn't work.
    |   Collaborators:  intel's tbb::atomic handles memory atomicity
    typedef typename atomic_float_<FLOATING_POINT,MEMORY_BLOCK> self_t;

    tbb::atomic<MEMORY_BLOCK> atomic_value_;

    template<memory_semantics M>
    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    template<memory_semantics M>
    FLOATING_POINT compare_and_swap( FLOATING_POINT value, FLOATING_POINT comparand ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT compare_and_swap(FLOATING_POINT value, FLOATING_POINT compare)
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    operator FLOATING_POINT() const volatile // volatile qualifier here for backwards compatibility 
        const MEMORY_BLOCK value_ = atomic_value_;
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return the a copy of the base value not an l-value
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return an l-value when operating among atomics
    self_t& operator=(self_t& rhs) 
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return *this;

    FLOATING_POINT& _internal_reference() const
        return reinterpret_cast<FLOATING_POINT&>(atomic_value_.tbb::atomic<MEMORY_BLOCK>::_internal_reference());

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ + value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ * value;
        //floating point binary representation is not an issue becaus
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ / value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        return this->operator+=(-value); //return resulting value

    //Prefix operator
    FLOATING_POINT operator++()
        return this->operator+=(1); //return resulting value

    //Prefix operator
    FLOATING_POINT operator--() 
        return this->operator+=(-1); //return resulting value

    //Postfix operator
    FLOATING_POINT operator++(int)
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    //Postfix operator
    FLOATING_POINT operator--(int) 
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    FLOATING_POINT fetch_and_add( FLOATING_POINT addend ) 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_increment() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_decrement() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

  typedef atomic_float_<float,uint_32> AtomicFloat;
  typedef atomic_float_<double,uint_64> AtomicDouble;

Nur eine Notiz für diese (Ich wollte einen Kommentar machen, aber anscheinend neuer Benutzer nicht äussern dürfen): Mit reinterpret_cast auf Referenzen zu falschem Code mit gcc 4.1 O3. Dies scheint in 4.4 festgelegt werden, da es funktioniert. Ändern der reinterpret_casts auf Zeiger, während etwas hässlichen, arbeitet in beiden Fällen.

Aus meiner Lektüre dieses Codes, würde ich an einer solchen Compiler wirklich verrückt sein als Montage löschte dafür, dass nicht atomar war.

Haben Sie Ihre Compiler Assembler-Code generieren und einen Blick darauf werfen. Wenn der Betrieb mehr als eine einzige Assemblersprachen- Anweisung ist, dann ist es nicht eine atomare Operation und erfordert Schlösser richtig in Multiprozessor-Systemen zu arbeiten.

Leider bin ich nicht sicher, dass auch das Gegenteil wahr ist - dass Single-Instruction-Operationen sind garantiert atomar sein. Ich weiß nicht, die Details von Multi-Prozessor-Programmierung bis zu diesem Niveau. Ich könnte einen Fall für entweder Ergebnis machen. (Wenn jemand anderes hat einige definitive Informationen über das, fühlen Sie sich frei in läuten.)

