En passant un coup de pouce :: unordered_set comme la carte de résultat boost :: scission
-
09-10-2019 - |
Question
Est-ce que quelqu'un sait s'il est casher de passer un coup de pouce :: unordered_set comme premier paramètre à boost :: scission? Sous libboost1.42-dev, cela semble poser des problèmes. Voici un petit exemple de programme qui cause le problème, appelez test-split.cc:
#include <boost/algorithm/string/classification.hpp>
#include <boost/algorithm/string/split.hpp>
#include <boost/unordered_set.hpp>
#include <string>
int main(int argc, char **argv) {
boost::unordered_set<std::string> tags_set;
boost::split(tags_set, "a^b^c^",
boost::is_any_of(std::string(1, '^')));
return 0;
}
Alors, si j'exécutez les commandes suivantes:
g++ -o test-split test-split.cc; valgrind ./test-split
je reçois un tas de plaintes valgrind comme celui qui suit (je vois aussi parfois coredumps sans valgrind, bien qu'il semble varier en fonction du temps):
==16843== Invalid read of size 8
==16843== at 0x4ED07D3: std::string::end() const (in /usr/lib/libstdc++.so.6.0.13)
==16843== by 0x401EE2: unsigned long boost::hash_value<char, std::allocator<char> >(std::basic_string<char, std::char_traits<char>, std::allocator<char> > const&) (in /tmp/test-split)
...
==16843== by 0x402248: boost::unordered_set<std::string, boost::hash<std::string>, std::equal_to<std::string>, std::allocator<std::string> >& boost::algorithm::split<boost::unordered_set<std::string, boost::hash<std::string>, std::equal_to<std::string>, std::allocator<std::string> >, char const [26], boost::algorithm::detail::is_any_ofF<char> >(boost::unordered_set<std::string, boost::hash<std::string>, std::equal_to<std::string>, std::allocator<std::string> >&, char const (&) [26], boost::algorithm::detail::is_any_ofF<char>, boost::algorithm::token_compress_mode_type) (in /tmp/test-split)
==16843== by 0x40192A: main (in /tmp/test-split)
==16843== Address 0x5936610 is 0 bytes inside a block of size 32 free'd
==16843== at 0x4C23E0F: operator delete(void*) (vg_replace_malloc.c:387)
==16843== by 0x4ED1EE8: std::basic_string<char, std::char_traits<char>, std::allocator<char> >::~basic_string() (in /usr/lib/libstdc++.so.6.0.13)
==16843== by 0x404A8B: void boost::unordered_detail::hash_unique_table<boost::unordered_detail::set<boost::hash<std::string>, std::equal_to<std::string>, std::allocator<std::string> > >::insert_range_impl<boost::transform_iterator<boost::algorithm::detail::copy_iterator_rangeF<std::string, char const*>, boost::algorithm::split_iterator<char const*>, boost::use_default, boost::use_default> >(std::string const&, boost::transform_iterator<boost::algorithm::detail::copy_iterator_rangeF<std::string, char const*>, boost::algorithm::split_iterator<char const*>, boost::use_default, boost::use_default>, boost::transform_iterator<boost::algorithm::detail::copy_iterator_rangeF<std::string, char const*>, boost::algorithm::split_iterator<char const*>, boost::use_default, boost::use_default>) (in /tmp/test-split)
...
==16843== by 0x402248: boost::unordered_set<std::string, boost::hash<std::string>, std::equal_to<std::string>, std::allocator<std::string> >& boost::algorithm::split<boost::unordered_set<std::string, boost::hash<std::string>, std::equal_to<std::string>, std::allocator<std::string> >, char const [26], boost::algorithm::detail::is_any_ofF<char> >(boost::unordered_set<std::string, boost::hash<std::string>, std::equal_to<std::string>, std::allocator<std::string> >&, char const (&) [26], boost::algorithm::detail::is_any_ofF<char>, boost::algorithm::token_compress_mode_type) (in /tmp/test-split)
==16843== by 0x40192A: main (in /tmp/test-split)
Ceci est une boîte de Debian Squeeze; voici mes informations système approprié:
$ g++ --version
g++ (Debian 4.4.5-2) 4.4.5
Copyright (C) 2010 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
$ dpkg -l | grep boost
ii libboost-iostreams1.42.0 1.42.0-4 Boost.Iostreams Library
ii libboost1.42-dev 1.42.0-4 Boost C++ Libraries development files
$ uname -a
Linux gcc44-buildvm 2.6.32-5-amd64 #1 SMP Fri Sep 17 21:50:19 UTC 2010 x86_64 GNU/Linux
Cependant, le code semble fonctionner très bien si je downgrade libboost1.42-dev à libboost1.40-dev. Alors, est-ce un bogue dans boost 1,42, ou suis-je utilise à mauvais escient boost :: scission en passant dans un récipient qui ne peut pas gérer des séquences? Merci!
La solution
Cela a été confirmé sur le coup de pouce utilisateurs liste de diffusion pour être un bug dans la mise en œuvre boost :: unordered_set. Il y a un patch disponible sur la liste de diffusion, et un correctif sera vérifiée dans bientôt, je l'espère à temps pour stimuler 1,45.
Boost utilisateurs: confirmation
Merci à tous pour la recherche dans ce!
Autres conseils
Je pense que la réponse devrait être oui.
La lecture des en-têtes (split.hpp
et iter_find.hpp
) split
prend un SequenceSequenceT& Result
comme premier argument, qui passe à iter_split
laquelle il couvre-produits d'assemblage de deux boost::transform_iterator
s:
SequenceSequenceT Tmp(itBegin, itEnd);
Result.swap(Tmp);
return Result;
Donc il a besoin de ce type est qu'il a un constructeur qui prend une paire de itérateurs qui déréférencer à std::string
(ou, sur le plan technique, à BOOST_STRING_TYPENAME). Et a un membre .swap () .. et a un type de SequenceSequenceT::iterator
dont le type est std::string
.
la preuve:
#include <boost/algorithm/string/classification.hpp>
#include <boost/algorithm/string/split.hpp>
#include <string>
#include <iterator>
#include <algorithm>
#include <iostream>
struct X
{
typedef std::iterator<std::forward_iterator_tag,
std::string, ptrdiff_t, std::string*, std::string&>
iterator;
X() {}
template<typename Iter> X(Iter i1, Iter i2)
{
std::cout << "Constructed X: ";
copy(i1, i2, std::ostream_iterator<std::string>(std::cout, " " ));
std::cout << "\n";
}
void swap(X&) {}
};
int main()
{
X x;
boost::split(x, "a^b^c^", boost::is_any_of(std::string(1, '^')));
}
Je pense que unordered_set<std::string>
doit satisfaire à ces exigences ainsi.
Apparemment, la réponse est pas yes .
En utilisant le code suivant, je reçois des avertissements de compilation et un assert d'exécution (Visual C ++ v10) sur le unordered_set
alors que le vector
fonctionne très bien (à l'exception d'une chaîne vide dans le dernier élément, en raison de la fuite « ^ ») .
boost::unordered_set<std::string> tags_set;
vector<string> SplitVec; // #2: Search for tokens
boost::split( SplitVec, "a^b^c^", boost::is_any_of("^") );
boost::split( tags_set, "a^b^c^", boost::is_any_of("^") );
itérateur compatibilité entre la source (string
) et le récipient cible est la question. Je posterais l'erreur d'avertissement, mais il est l'un de ces modèles « Guerre et Paix » avertissements.
EDIT:
Cela ressemble à un bug dans Boost unordered_set
? Quand j'utilise ce qui suit, il fonctionne comme on peut s'y attendre:
std::unordered_set<std::string> tags_set_std;
boost::split( tags_set_std, string("a^b^c^"), boost::is_any_of(string("^")) );