
Editar: O código aqui ainda tem alguns bugs nele, e que poderia fazer melhor no departamento de desempenho, mas em vez de tentar corrigir isso, para o registro eu levei o problema para o grupos de discussão e Intel obteve lotes de grande gabarito, e se tudo correr bem uma versão polida de Atomic flutuador será incluído em um release futuro próximo da threading Building Blocks da Intel

Ok aqui é uma pergunta difícil, eu quero um flutuador Atómica, não para desempenho de gráficos super-rápido, mas para usar rotineiramente como data-membros de classes. E eu não quero pagar o preço do uso de bloqueios nessas aulas, pois não oferece benefícios adicionais para as minhas necessidades.

Agora, com tbb da Intel e outras bibliotecas atômicas que eu vi, tipos inteiros são suportados, mas não pontos flutuante. Então eu fui e realizadas um, e ele funciona ... mas eu não tenho certeza se ele realmente funciona, ou eu sou apenas muita sorte que ele funciona.

Alguém aqui sabe se esta não é uma forma de enfiar heresia?

typedef unsigned int uint_32;

  struct AtomicFloat
    tbb::atomic<uint_32> atomic_value_;

    template<memory_semantics M>
    float fetch_and_store( float value ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::fetch_and_store<M>((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    float fetch_and_store( float value ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::fetch_and_store((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    template<memory_semantics M>
    float compare_and_swap( float value, float comparand ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::compare_and_swap<M>((uint_32&)value,(uint_32&)compare);
        return reinterpret_cast<const float&>(value_);

    float compare_and_swap(float value, float compare)
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::compare_and_swap((uint_32&)value,(uint_32&)compare);
        return reinterpret_cast<const float&>(value_);

    operator float() const volatile // volatile qualifier here for backwards compatibility 
        const uint_32 value_ = atomic_value_;
        return reinterpret_cast<const float&>(value_);

    float operator=(float value)
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::operator =((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    float operator+=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ + value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator*=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ * value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator/=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ / value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator-=(float value)
        return this->operator+=(-value);

    float operator++() 
        return this->operator+=(1);

    float operator--() 
        return this->operator+=(-1);

    float fetch_and_add( float addend ) 
        return this->operator+=(-addend);

    float fetch_and_increment() 
        return this->operator+=(1);

    float fetch_and_decrement() 
        return this->operator+=(-1);


Editar: mudou size_t para uint32_t como Greg Rogers sugeriu, dessa forma o seu mais portátil

Editar:. acrescentou listando para toda a coisa, com algumas correções

Mais edições: Em termos de desempenho usando uma bóia bloqueado para 5.000.000 + = operações com 100 threads na minha máquina leva 3.6s, enquanto meu flutuador atômica mesmo com seu bobo do-while leva 0.2s para fazer o mesmo trabalho. Assim, o> 30x aumento de desempenho significa que a sua pena, (e esta é a captura) se o seu correto.

Mesmo mais edições: Como AWGN apontou minhas partes fetch_and_xxxx estavam todos errados. Fixos que e retiradas partes da API não tenho certeza sobre (modelos de memória templated). E implementadas outras operações em termos de operador + = a repetição de código evitar

Adicionado: operador Adicionado * = e operador / =, desde carros alegóricos não seria flutua sem eles. Graças ao comentário de Peterchen que isso foi notado

Editar: Última versão do código segue (Eu vou deixar a versão antiga para referência embora)

  #include <tbb/atomic.h>
  typedef unsigned int      uint_32;
  typedef __TBB_LONG_LONG       uint_64;

  template<typename FLOATING_POINT,typename MEMORY_BLOCK>
  struct atomic_float_
    /*  CRC Card -----------------------------------------------------
    |   Class:          atmomic float template class
    |   Responsability: handle integral atomic memory as it were a float,
    |                   but partially bypassing FPU, SSE/MMX, so it is
    |                   slower than a true float, but faster and smaller
    |                   than a locked float.
    |                       *Warning* If your float usage is thwarted by
    |                   the A-B-A problem this class isn't for you
    |                       *Warning* Atomic specification says we return,
    |                   values not l-values. So  (i = j) = k doesn't work.
    |   Collaborators:  intel's tbb::atomic handles memory atomicity
    typedef typename atomic_float_<FLOATING_POINT,MEMORY_BLOCK> self_t;

    tbb::atomic<MEMORY_BLOCK> atomic_value_;

    template<memory_semantics M>
    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    template<memory_semantics M>
    FLOATING_POINT compare_and_swap( FLOATING_POINT value, FLOATING_POINT comparand ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT compare_and_swap(FLOATING_POINT value, FLOATING_POINT compare)
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    operator FLOATING_POINT() const volatile // volatile qualifier here for backwards compatibility 
        const MEMORY_BLOCK value_ = atomic_value_;
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return the a copy of the base value not an l-value
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return an l-value when operating among atomics
    self_t& operator=(self_t& rhs) 
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return *this;

    FLOATING_POINT& _internal_reference() const
        return reinterpret_cast<FLOATING_POINT&>(atomic_value_.tbb::atomic<MEMORY_BLOCK>::_internal_reference());

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ + value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ * value;
        //floating point binary representation is not an issue becaus
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ / value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        return this->operator+=(-value); //return resulting value

    //Prefix operator
    FLOATING_POINT operator++()
        return this->operator+=(1); //return resulting value

    //Prefix operator
    FLOATING_POINT operator--() 
        return this->operator+=(-1); //return resulting value

    //Postfix operator
    FLOATING_POINT operator++(int)
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    //Postfix operator
    FLOATING_POINT operator--(int) 
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    FLOATING_POINT fetch_and_add( FLOATING_POINT addend ) 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_increment() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_decrement() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

  typedef atomic_float_<float,uint_32> AtomicFloat;
  typedef atomic_float_<double,uint_64> AtomicDouble;
Eu aconselharia a sério contra o patrimônio público. Eu não sei o que a implementação atômica é como, mas im supondo que ele tem sobrecarregado operadores que usam isso como o tipo integral, o que significa que essas promoções serão utilizados em vez de seu flutuador em muitas (talvez mais?) Casos.

Eu não vejo nenhuma razão para que isso não iria funcionar, mas como você eu tenho que maneira de provar que ...

Uma nota:? Sua rotina operator float() não tem semântica de carga adquirir, e não deveria ser marcado const volátil (ou definitivamente, pelo menos const)

EDIT:. Se você estiver indo para fornecer operador - () você deve fornecer ambas as formas de prefixo / postfix

Parece que a sua implementação assume que sizeof(size_t) == sizeof(float). Será que sempre ser verdadeiro para suas plataformas de destino?

E eu não diria rosqueamento heresia tanto como carcaça heresia. :)

Embora o tamanho de um uint32_t pode ser equivalente ao de um flutuador em um determinado arco, reinterpretando um elenco de um para o outro você está assumindo implicitamente que incrementos atômicas, diminui e todas as outras operações sobre bits são semanticamente equivalente em ambos os tipos, que não são na realidade. Eu duvido que ele funciona como esperado.

I fortemente dúvida de que você obtenha os valores corretos em fetch_and_add etc, como a adição de flutuação é diferente da adição int.

Eis o que começa a partir destes aritmética:

1   + 1    =  1.70141e+038  
100 + 1    = -1.46937e-037  
100 + 0.01 =  1.56743e+038  
23  + 42   = -1.31655e-036  

Então, sim, threadsafe, mas não o que você espera.

os algoritmos de livre-lock (operador + etc.) devem trabalhar sobre atomicity (não verificado para o próprio algoritmo ..)

Outra solução: Como se trata de todas as adições e subtrações, você pode ser capaz de dar a cada fio de sua própria instância, em seguida, adicionar os resultados de vários segmentos.

Este é o estado do código como está agora, depois de conversas sobre as placas Intel, mas ainda não foi cuidadosamente verificada para funcionar corretamente em todos os cenários.

  #include <tbb/atomic.h>
  typedef unsigned int      uint_32;
  typedef __TBB_LONG_LONG       uint_64;

  template<typename FLOATING_POINT,typename MEMORY_BLOCK>
  struct atomic_float_
    /*  CRC Card -----------------------------------------------------
    |   Class:          atmomic float template class
    |   Responsability: handle integral atomic memory as it were a float,
    |                   but partially bypassing FPU, SSE/MMX, so it is
    |                   slower than a true float, but faster and smaller
    |                   than a locked float.
    |                       *Warning* If your float usage is thwarted by
    |                   the A-B-A problem this class isn't for you
    |                       *Warning* Atomic specification says we return,
    |                   values not l-values. So  (i = j) = k doesn't work.
    |   Collaborators:  intel's tbb::atomic handles memory atomicity
    typedef typename atomic_float_<FLOATING_POINT,MEMORY_BLOCK> self_t;

    tbb::atomic<MEMORY_BLOCK> atomic_value_;

    template<memory_semantics M>
    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    template<memory_semantics M>
    FLOATING_POINT compare_and_swap( FLOATING_POINT value, FLOATING_POINT comparand ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT compare_and_swap(FLOATING_POINT value, FLOATING_POINT compare)
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    operator FLOATING_POINT() const volatile // volatile qualifier here for backwards compatibility 
        const MEMORY_BLOCK value_ = atomic_value_;
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return the a copy of the base value not an l-value
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return an l-value when operating among atomics
    self_t& operator=(self_t& rhs) 
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return *this;

    FLOATING_POINT& _internal_reference() const
        return reinterpret_cast<FLOATING_POINT&>(atomic_value_.tbb::atomic<MEMORY_BLOCK>::_internal_reference());

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ + value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ * value;
        //floating point binary representation is not an issue becaus
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ / value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        return this->operator+=(-value); //return resulting value

    //Prefix operator
    FLOATING_POINT operator++()
        return this->operator+=(1); //return resulting value

    //Prefix operator
    FLOATING_POINT operator--() 
        return this->operator+=(-1); //return resulting value

    //Postfix operator
    FLOATING_POINT operator++(int)
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    //Postfix operator
    FLOATING_POINT operator--(int) 
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    FLOATING_POINT fetch_and_add( FLOATING_POINT addend ) 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_increment() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_decrement() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

  typedef atomic_float_<float,uint_32> AtomicFloat;
  typedef atomic_float_<double,uint_64> AtomicDouble;

Apenas uma nota sobre isso (eu queria fazer um comentário, mas, aparentemente, os novos usuários não têm permissão para comentário): Usando reinterpret_cast em referências produz código incorreto com o gcc 4.1 O3. Este parece ser fixado em 4,4 porque não funciona. Alterar as reinterpret_casts para ponteiros, enquanto um pouco mais feio, funciona em ambos os casos.

De minha leitura desse código, eu ficaria muito bravo com tal compilador um como para colocar para fora de montagem para este que não era atômica.

Tenha seu compilador gerar assembly de código e ter um olhar para ele. Se a operação é mais do que uma única instrução em linguagem assembly, então é não uma operação atômica, e requer bloqueios para funcionar corretamente em sistemas com múltiplos processadores.

Infelizmente, não estou certo de que o oposto também é verdadeiro - que as operações de instrução única são garantido para ser atômica. Eu não sei os detalhes de multiprocessador programação até esse nível. Eu poderia fazer um caso para qualquer resultado. (Se alguém tem alguma informação definitiva sobre isso, não hesite em carrilhão in.)

