Regras de Alias Strict-Aliasing Vs GCC 4.4.3
-
27-09-2019 - |
Pergunta
Eu tenho algum código que uso com sucesso há alguns anos para implementar um "objeto do tipo variante"; Ou seja, um objeto C ++ que pode conter valores de vários tipos, mas apenas usa (aproximadamente) a maior memória que o maior dos tipos possíveis. O código é semelhante em espírito a uma união marcada, exceto que também suporta tipos de dados que não sejam do POD. Ele realiza essa mágica usando um buffer de char, posicionamento novo/excluir e reinterpret_cast <>.
Recentemente, tentei compilar este código no GCC 4.4.3 (com -o3 e -wall) e recebi muitos avisos como este:
warning: dereferencing type-punned pointer will break strict-aliasing rules
Pelo que li, isso é uma indicação de que o novo otimizador do GCC pode gerar código 'buggy', que eu obviamente gostaria de evitar.
Eu colei uma 'versão de brinquedo' do meu código abaixo; Existe algo que eu possa fazer no meu código para torná-lo mais seguro no GCC 4.4.3, enquanto ainda suporta tipos de dados que não são do POD? Sei que, como último recurso, eu sempre poderia compilar o código com -fno-strict-aliasing, mas seria bom ter código que não se quebre sob a otimização, para que eu prefiro não fazer isso.
(Observe que eu gostaria de evitar a introdução de uma dependência de impulso ou C ++ 0x na base de código; portanto, enquanto as soluções Boost/C ++ 0x são interessantes, eu prefiro algo um pouco mais antiquado)
#include <new>
class Duck
{
public:
Duck() : _speed(0.0f), _quacking(false) {/* empty */}
virtual ~Duck() {/* empty */} // virtual only to demonstrate that this may not be a POD type
float _speed;
bool _quacking;
};
class Soup
{
public:
Soup() : _size(0), _temperature(0.0f) {/* empty */}
virtual ~Soup() {/* empty */} // virtual only to demonstrate that this may not be a POD type
int _size;
float _temperature;
};
enum {
TYPE_UNSET = 0,
TYPE_DUCK,
TYPE_SOUP
};
/** Tagged-union style variant class, can hold either one Duck or one Soup, but not both at once. */
class DuckOrSoup
{
public:
DuckOrSoup() : _type(TYPE_UNSET) {/* empty*/}
~DuckOrSoup() {Unset();}
void Unset() {ChangeType(TYPE_UNSET);}
void SetValueDuck(const Duck & duck) {ChangeType(TYPE_DUCK); reinterpret_cast<Duck*>(_data)[0] = duck;}
void SetValueSoup(const Soup & soup) {ChangeType(TYPE_SOUP); reinterpret_cast<Soup*>(_data)[0] = soup;}
private:
void ChangeType(int newType);
template <int S1, int S2> struct _maxx {enum {sz = (S1>S2)?S1:S2};};
#define compile_time_max(a,b) (_maxx< (a), (b) >::sz)
enum {STORAGE_SIZE = compile_time_max(sizeof(Duck), sizeof(Soup))};
char _data[STORAGE_SIZE];
int _type; // a TYPE_* indicating what type of data we currently hold
};
void DuckOrSoup :: ChangeType(int newType)
{
if (newType != _type)
{
switch(_type)
{
case TYPE_DUCK: (reinterpret_cast<Duck*>(_data))->~Duck(); break;
case TYPE_SOUP: (reinterpret_cast<Soup*>(_data))->~Soup(); break;
}
_type = newType;
switch(_type)
{
case TYPE_DUCK: (void) new (_data) Duck(); break;
case TYPE_SOUP: (void) new (_data) Soup(); break;
}
}
}
int main(int argc, char ** argv)
{
DuckOrSoup dos;
dos.SetValueDuck(Duck());
dos.SetValueSoup(Soup());
return 0;
}
Solução
Ok, você pode fazer isso se estiver disposto a armazenar um vazio extra *. Eu reformatei um pouco sua amostra, por isso foi mais fácil para mim trabalhar. Veja isso e veja se atende às suas necessidades. Além disso, observe que eu forneci algumas amostras para que você possa adicionar alguns modelos a ele que ajudarão a usabilidade. Eles podem ser estendidos muito mais, mas isso deve lhe dar uma boa ideia.
Há também algumas coisas de saída para ajudá -lo a ver o que está acontecendo.
Mais uma coisa, suponho que você saiba que precisa fornecer cópia apropriada e operador de atribuição, mas esse não é o cerne desse problema.
Minhas informações da versão g ++:
G ++ --version G ++ (SUSE Linux) 4.5.0 20100604 [Revisão GCC-4_5-Branch 160292
#include <new>
#include <iostream>
class Duck
{
public:
Duck(float s = 0.0f, bool q = false) : _speed(s), _quacking(q)
{
std::cout << "Duck::Duck()" << std::endl;
}
virtual ~Duck() // virtual only to demonstrate that this may not be a POD type
{
std::cout << "Duck::~Duck()" << std::endl;
}
float _speed;
bool _quacking;
};
class Soup
{
public:
Soup(int s = 0, float t = 0.0f) : _size(s), _temperature(t)
{
std::cout << "Soup::Soup()" << std::endl;
}
virtual ~Soup() // virtual only to demonstrate that this may not be a POD type
{
std::cout << "Soup::~Soup()" << std::endl;
}
int _size;
float _temperature;
};
enum TypeEnum {
TYPE_UNSET = 0,
TYPE_DUCK,
TYPE_SOUP
};
template < class T > TypeEnum type_enum_for();
template < > TypeEnum type_enum_for< Duck >() { return TYPE_DUCK; }
template < > TypeEnum type_enum_for< Soup >() { return TYPE_SOUP; }
/** Tagged-union style variant class, can hold either one Duck or one Soup, but not both at once. */
class DuckOrSoup
{
public:
DuckOrSoup() : _type(TYPE_UNSET), _data_ptr(_data) {/* empty*/}
~DuckOrSoup() {Unset();}
void Unset() {ChangeType(TYPE_UNSET);}
void SetValueDuck(const Duck & duck)
{
ChangeType(TYPE_DUCK);
reinterpret_cast<Duck*>(_data_ptr)[0] = duck;
}
void SetValueSoup(const Soup & soup)
{
ChangeType(TYPE_SOUP);
reinterpret_cast<Soup*>(_data_ptr)[0] = soup;
}
template < class T >
void set(T const & t)
{
ChangeType(type_enum_for< T >());
reinterpret_cast< T * >(_data_ptr)[0] = t;
}
template < class T >
T & get()
{
ChangeType(type_enum_for< T >());
return reinterpret_cast< T * >(_data_ptr)[0];
}
template < class T >
T const & get_const()
{
ChangeType(type_enum_for< T >());
return reinterpret_cast< T const * >(_data_ptr)[0];
}
private:
void ChangeType(int newType);
template <int S1, int S2> struct _maxx {enum {sz = (S1>S2)?S1:S2};};
#define compile_time_max(a,b) (_maxx< (a), (b) >::sz)
enum {STORAGE_SIZE = compile_time_max(sizeof(Duck), sizeof(Soup))};
char _data[STORAGE_SIZE];
int _type; // a TYPE_* indicating what type of data we currently hold
void * _data_ptr;
};
void DuckOrSoup :: ChangeType(int newType)
{
if (newType != _type)
{
switch(_type)
{
case TYPE_DUCK: (reinterpret_cast<Duck*>(_data_ptr))->~Duck(); break;
case TYPE_SOUP: (reinterpret_cast<Soup*>(_data_ptr))->~Soup(); break;
}
_type = newType;
switch(_type)
{
case TYPE_DUCK: (void) new (_data) Duck(); break;
case TYPE_SOUP: (void) new (_data) Soup(); break;
}
}
}
int main(int argc, char ** argv)
{
Duck sample_duck; sample_duck._speed = 23.23;
Soup sample_soup; sample_soup._temperature = 98.6;
std::cout << "Just saw sample constructors" << std::endl;
{
DuckOrSoup dos;
std::cout << "Setting to Duck" << std::endl;
dos.SetValueDuck(sample_duck);
std::cout << "Setting to Soup" << std::endl;
dos.SetValueSoup(sample_soup);
std::cout << "Should see DuckOrSoup destruct which will dtor a Soup"
<< std::endl;
}
{
std::cout << "Do it again with the templates" << std::endl;
DuckOrSoup dos;
std::cout << "Setting to Duck" << std::endl;
dos.set(sample_duck);
std::cout << "duck speed: " << dos.get_const<Duck>()._speed << std::endl;
std::cout << "Setting to Soup" << std::endl;
dos.set(sample_soup);
std::cout << "soup temp: " << dos.get_const<Soup>()._temperature << std::endl;
std::cout << "Should see DuckOrSoup destruct which will dtor a Soup"
<< std::endl;
}
{
std::cout << "Do it again with only template get" << std::endl;
DuckOrSoup dos;
std::cout << "Setting to Duck" << std::endl;
dos.get<Duck>() = Duck(42.42);
std::cout << "duck speed: " << dos.get_const<Duck>()._speed << std::endl;
std::cout << "Setting to Soup" << std::endl;
dos.get<Soup>() = Soup(0, 32);
std::cout << "soup temp: " << dos.get_const<Soup>()._temperature << std::endl;
std::cout << "Should see DuckOrSoup destruct which will dtor a Soup"
<< std::endl;
}
std::cout << "Get ready to see sample destructors" << std::endl;
return 0;
}
Outras dicas
Eu teria escrito o código como assim:
typedef boost::variant<Duck, Soup> DuckOrSoup;
Mas acho que todo mundo tem seu próprio gosto.
A propósito, seu código é buggy, você não cuida de possíveis problemas de alinhamento, você não pode simplesmente colocar um objeto em nenhum momento da memória, há uma restrição a respeito, que muda com todos os tipos. Em C ++ 0x, existe o alignof
Palavra -chave para obtê -lo e alguns outros utilitários para obter armazenamento alinhado.
Eu consegui convencer o GCC (4.2.4, correr com -Wstrict-aliasing=2
) para não reclamar usando um void *
temporário, ou seja.
void SetValueDuck(const Duck & duck) {ChangeType(TYPE_DUCK); void *t=&_data; reinterpret_cast<Duck*>(t)[0] = duck;}
Ainda não consigo entender a necessidade ou o uso disso, mas o G ++ 4.4.3 com -o3 -wall funciona com o seguinte patch. Se funcionar, você pode compartilhar o caso de uso, por que precisa disso?
class DuckOrSoup
{
public:
DuckOrSoup() : _type(TYPE_UNSET) {_duck = NULL; _soup = NULL;/* empty*/}
~DuckOrSoup() {Unset();}
void Unset() {ChangeType(TYPE_UNSET);}
void SetValueDuck(const Duck & duck) {ChangeType(TYPE_DUCK); _duck = new (&_data[0])Duck (duck); }
void SetValueSoup(const Soup & soup) { ChangeType(TYPE_SOUP); _soup = new (&_data[0])Soup (soup); }
private:
void ChangeType(int newType);
template <int S1, int S2> struct _maxx {enum {sz = (S1>S2)?S1:S2};};
#define compile_time_max(a,b) (_maxx< (a), (b) >::sz)
enum {STORAGE_SIZE = compile_time_max(sizeof(Duck), sizeof(Soup))};
char _data[STORAGE_SIZE];
int _type; // a TYPE_* indicating what type of data we currently hold
Duck* _duck;
Soup* _soup;
};
void DuckOrSoup :: ChangeType(int newType)
{
if (newType != _type)
{
switch(_type)
{
case TYPE_DUCK:
_duck->~Duck();
_duck = NULL;
break;
case TYPE_SOUP:
_soup->~Soup();
_soup = NULL;
break;
}
_type = newType;
switch(_type)
{
case TYPE_DUCK: _duck = new (&_data[0]) Duck(); break;
case TYPE_SOUP: _soup = new (&_data[0]) Soup(); break;
}
}
}