Как преобразовать CString и ::std::string ::std:: wstring друг в друга?
Вопрос
CString
это довольно удобно, в то время как std::string
более совместим с контейнером STL.Я использую hash_map
.Однако, hash_map
не поддерживает CString
как ключ, поэтому я хочу преобразовать CString
в std::string
.
Написание CString
хэш-функция, похоже, занимает много времени.
CString -----> std::string
Как я могу это сделать?
std::string -----> CString:
inline CString toCString(std::string const& str)
{
return CString(str.c_str());
}
Я прав?
Редактировать:
Вот еще вопросы:
Как я могу конвертировать wstring
, CString
друг к другу?
//wstring -> CString,
std::wstring src;
CString result(src.c_str());
//CString->wstring.
CString src;
::std::wstring des(src.GetString());
Есть ли там Любой проблема?
Как я могу конвертировать std::wstring
, std::string
друг к другу?
Решение
Согласно КодеГуру:
CString
Для std::string
:
CString cs("Hello");
std::string s((LPCTSTR)cs);
НО: std::string
не всегда можно построить из LPCTSTR
.т. е.код не будет выполнен для сборок в формате UNICODE.
Как std::string
может быть сконструирован только из LPSTR
/ LPCSTR
, программист, использующий VC ++ 7.x или лучше, может использовать классы преобразования, такие как CT2CA
в качестве посредника.
CString cs ("Hello");
// Convert a TCHAR string to a LPCSTR
CT2CA pszConvertedAnsiString (cs);
// construct a std::string using the LPCSTR input
std::string strStd (pszConvertedAnsiString);
std::string
Для CString
:(Из Часто задаваемые вопросы по CString в Visual Studio...)
std::string s("Hello");
CString cs(s.c_str());
CStringT
может создаваться как из символьных, так и из широкосимвольных строк.т. е.Он может преобразовывать из char*
(т.е. LPSTR
) или из wchar_t*
(LPWSTR
).
Другими словами, char-специализация (из CStringT
) т. е. CStringA
, wchar_t
-специализация CStringW
, и TCHAR
-специализация CString
может быть сконструирован из любого char
или широкосимвольный, нулевое завершение (здесь очень важно нулевое завершение) источники строк.
Хотя Иинспектируемый вносит изменения в часть "нулевое завершение" в комментариях:
NUL-завершение не требуется.
CStringT
имеет конструкторы преобразования, которые принимают явный аргумент длины.Это также означает, что вы можете построитьCStringT
объекты изstd::string
объекты со встроеннымиNUL
Персонажи.
Другие советы
Решите это с помощью std::basic_string<TCHAR>
вместо того , чтобы std::string
и это должно работать нормально, независимо от настроек вашего персонажа.
Более эффективно преобразовывать CString
Для std::string
используя преобразование, в котором указана длина.
CString someStr("Hello how are you");
std::string std(somStr, someStr.GetLength());
В замкнутом цикле это значительно повышает производительность.
Если вы хотите что-то более похожее на C ++, это то, что я использую.Хотя это зависит от Boost, это только для исключений.Вы можете легко удалить их, оставив это зависеть только от STL и WideCharToMultiByte()
Вызов Win32 API.
#include <string>
#include <vector>
#include <cassert>
#include <exception>
#include <boost/system/system_error.hpp>
#include <boost/integer_traits.hpp>
/**
* Convert a Windows wide string to a UTF-8 (multi-byte) string.
*/
std::string WideStringToUtf8String(const std::wstring& wide)
{
if (wide.size() > boost::integer_traits<int>::const_max)
throw std::length_error(
"Wide string cannot be more than INT_MAX characters long.");
if (wide.size() == 0)
return "";
// Calculate necessary buffer size
int len = ::WideCharToMultiByte(
CP_UTF8, 0, wide.c_str(), static_cast<int>(wide.size()),
NULL, 0, NULL, NULL);
// Perform actual conversion
if (len > 0)
{
std::vector<char> buffer(len);
len = ::WideCharToMultiByte(
CP_UTF8, 0, wide.c_str(), static_cast<int>(wide.size()),
&buffer[0], static_cast<int>(buffer.size()), NULL, NULL);
if (len > 0)
{
assert(len == static_cast<int>(buffer.size()));
return std::string(&buffer[0], buffer.size());
}
}
throw boost::system::system_error(
::GetLastError(), boost::system::system_category);
}
(Начиная с версии VS2012 ...и, по крайней мере, до версии VS2017 версии 15.8.1)
Поскольку это проект MFC, а CString - класс MFC, MS предоставляет техническое примечание TN059:Использование макросов преобразования MFC MBCS / Unicode и Универсальные Макросы преобразования:
A2CW (LPCSTR) -> (LPCWSTR)
A2W (LPCSTR) -> (LPWSTR)
W2CA (LPCWSTR) -> (LPCSTR)
W2A (LPCWSTR) -> (LPSTR)
Использование:
void Example() // ** UNICODE case **
{
USES_CONVERSION; // (1)
// CString to std::string / std::wstring
CString strMfc{ "Test" }; // strMfc = L"Test"
std::string strStd = W2A(strMfc); // ** Conversion Macro: strStd = "Test" **
std::wstring wstrStd = strMfc.GetString(); // wsrStd = L"Test"
// std::string to CString / std::wstring
strStd = "Test 2";
strMfc = strStd.c_str(); // strMfc = L"Test 2"
wstrStd = A2W(strStd.c_str()); // ** Conversion Macro: wstrStd = L"Test 2" **
// std::wstring to CString / std::string
wstrStd = L"Test 3";
strMfc = wstrStd.c_str(); // strMfc = L"Test 3"
strStd = W2A(wstrStd.c_str()); // ** Conversion Macro: strStd = "Test 3" **
}
--
Примечания:
(1) Для того, чтобы в макросах преобразования было место для хранения временной длины, необходимо объявить локальную переменную с именем _convert
это делается в каждой функции, использующей макросы преобразования.Это делается путем вызова USES_CONVERSION
макрос.В коде MFC VS2017 (atlconv.h) это выглядит примерно так:
#ifndef _DEBUG
#define USES_CONVERSION int _convert; (_convert); UINT _acp = ATL::_AtlGetConversionACP() /*CP_THREAD_ACP*/; (_acp); LPCWSTR _lpw; (_lpw); LPCSTR _lpa; (_lpa)
#else
#define USES_CONVERSION int _convert = 0; (_convert); UINT _acp = ATL::_AtlGetConversionACP() /*CP_THREAD_ACP*/; (_acp); LPCWSTR _lpw = NULL; (_lpw); LPCSTR _lpa = NULL; (_lpa)
#endif
Это продолжение ответа Сэла, где он / она предоставил решение:
CString someStr("Hello how are you");
std::string std(somStr, someStr.GetLength());
Это полезно также при преобразовании нетипичной C-строки в std::string
Примером использования для меня был предварительно выделенный массив символов (например, C-String), но он не завершается NUL.(т.е.SHA digest).Приведенный выше синтаксис позволяет мне указать длину дайджеста SHA массива char, чтобы std::string не приходилось искать завершающий символ NUL, который может быть там, а может и не быть.
Такие , как:
unsigned char hashResult[SHA_DIGEST_LENGTH];
auto value = std::string(reinterpret_cast<char*>hashResult, SHA_DIGEST_LENGTH);
Это работает нормально:
//Convert CString to std::string
inline std::string to_string(const CString& cst)
{
return CT2A(cst.GetString());
}
из этого поста (Спасибо Марк Рэнсом )
Преобразовать CString в string (VC6)
Я протестировал это, и это работает нормально.
std::string Utils::CString2String(const CString& cString)
{
std::string strStd;
for (int i = 0; i < cString.GetLength(); ++i)
{
if (cString[i] <= 0x7f)
strStd.append(1, static_cast<char>(cString[i]));
else
strStd.append(1, '?');
}
return strStd;
}
Работает на меня:
std::wstring CStringToWString(const CString& s)
{
std::string s2;
s2 = std::string((LPCTSTR)s);
return std::wstring(s2.begin(),s2.end());
}
CString WStringToCString(std::wstring s)
{
std::string s2;
s2 = std::string(s.begin(),s.end());
return s2.c_str();
}
Все остальные ответы не совсем соответствовали тому, что я искал, а именно преобразованию CString
"на лету", в отличие от сохранения результата в переменной.
Решение аналогично приведенному выше, но нам нужен еще один шаг, чтобы создать экземпляр безымянного объекта.Я иллюстрирую это примером.Вот моя функция, которая нуждается std::string
но у меня есть CString
.
void CStringsPlayDlg::writeLog(const std::string &text)
{
std::string filename = "c:\\test\\test.txt";
std::ofstream log_file(filename.c_str(), std::ios_base::out | std::ios_base::app);
log_file << text << std::endl;
}
Как это назвать, когда у вас есть CString
?
std::string firstName = "First";
CString lastName = _T("Last");
writeLog( firstName + ", " + std::string( CT2A( lastName ) ) );
Обратите внимание, что последняя строка не является прямым приведением к типу, но мы создаем безымянный std::string
возражать и предоставлять CString
через его конструктор.
Есть ли там Любой проблема?
Есть несколько проблем:
CString
является шаблонной специализацией Стрингт.В зависимости от Базовый тип описывая тип персонажа, можно выделить две конкретные специализации:CStringA
(используяchar
) иCStringW
(используяwchar_t
).- В то время как
wchar_t
в Windows повсеместно используется для хранения единиц кода в кодировке UTF-16, используяchar
является двусмысленным.Последний обычно хранит символы в кодировке ANSI, но также может хранить ASCII, UTF-8 или даже двоичные данные. - Мы не знаем кодировку символов (или даже тип символа)
CString
(который контролируется с помощью_UNICODE
символ препроцессора), что делает вопрос неоднозначным.Мы также не знаем желаемую кодировку символовstd::string
. - Преобразование между Unicode и ANSI по своей сути приводит к потерям:Кодировка ANSI может представлять только подмножество набора символов Unicode.
Чтобы решить эти проблемы, я собираюсь предположить, что wchar_t
будет хранить кодированные единицы кода в формате UTF-16, и char
будет содержать октетные последовательности UTF-8.Это единственный разумный выбор, который вы можете сделать, чтобы гарантировать, что строки источника и назначения сохраняют одну и ту же информацию, не ограничивая решение подмножеством доменов источника или назначения.
Следующие реализации преобразуют между CStringA
/CStringW
и std::wstring
/std::string
преобразование из UTF-8 в UTF-16 и наоборот:
#include <string>
#include <atlconv.h>
std::string to_utf8(CStringW const& src_utf16)
{
return { CW2A(src_utf16.GetString(), CP_UTF8).m_psz };
}
std::wstring to_utf16(CStringA const& src_utf8)
{
return { CA2W(src_utf8.GetString(), CP_UTF8).m_psz };
}
Оставшиеся две функции конструируют строковые объекты C ++ из строк MFC, оставляя кодировку неизменной.Обратите внимание, что в то время как предыдущие функции не могут справиться со встроенными символами NUL, эти функции невосприимчивы к этому.
#include <string>
#include <atlconv.h>
std::string to_std_string(CStringA const& src)
{
return { src.GetString(), src.GetString() + src.GetLength() };
}
std::wstring to_std_wstring(CStringW const& src)
{
return { src.GetString(), src.GetString() + src.GetLength() };
}
Вы можете использовать CT2CA
CString datasetPath;
CT2CA st(datasetPath);
string dataset(st);
Если вы хотите легко конвертировать между другими типами строк, возможно, _bstr_t
класс был бы более подходящим?Он поддерживает диалог между char
, wchar_t
и BSTR
.
Один интересный подход заключается в приведении CString
Для CStringA
внутри string
конструктор.В отличие от std::string s((LPCTSTR)cs);
это будет работать, даже если _UNICODE
определяется.Однако, если это так, это приведет к преобразованию из Unicode в ANSI, поэтому небезопасно использовать более высокие значения Unicode за пределами набора символов ASCII.Такое преобразование осуществляется в соответствии с _CSTRING_DISABLE_NARROW_WIDE_CONVERSION
определение препроцессора. https://msdn.microsoft.com/en-us/library/5bzxfsea.aspx
CString s1("SomeString");
string s2((CStringA)s1);