Помогите улучшить этот код синтаксического анализа INI.
Вопрос
Это что-то простое, что я придумал для этот вопрос.Я не совсем доволен этим и рассматривал это как шанс улучшить использование STL и программирования на основе потоков.
std::wifstream file(L"\\Windows\\myini.ini");
if (file)
{
bool section=false;
while (!file.eof())
{
std::wstring line;
std::getline(file, line);
if (line.empty()) continue;
switch (line[0])
{
// new header
case L'[':
{
std::wstring header;
size_t pos=line.find(L']');
if (pos!=std::wstring::npos)
{
header=line.substr(1, pos);
if (header==L"Section")
section=true;
else
section=false;
}
}
break;
// comments
case ';':
case ' ':
case '#':
break;
// var=value
default:
{
if (!section) continue;
// what if the name = value does not have white space?
// what if the value is enclosed in quotes?
std::wstring name, dummy, value;
lineStm >> name >> dummy;
ws(lineStm);
WCHAR _value[256];
lineStm.getline(_value, ELEMENTS(_value));
value=_value;
}
}
}
}
Как бы вы это улучшили?Пожалуйста, не рекомендуйте альтернативные библиотеки — мне просто нужен простой метод анализа некоторых строк конфигурации из INI-файла.
Решение
// что, если имя = значение не содержит пробелов?
// что, если значение заключено в кавычки?
Я бы использовал boost::regex для сопоставления каждого типа элемента, например:
boost::smatch matches;
boost::regex name_value("(\S+)\s*=\s*(\S+)");
if(boost::regex_match(line, matches, name_value))
{
name = matches[1];
value = matches[2];
}
регулярные выражения могут нуждаться в некоторой доработке.
Я бы также заменил destream.getline на std::getline, избавившись от статического массива символов.
Другие советы
Этот:
for (size_t i=1; i<line.length(); i++)
{
if (line[i]!=L']')
header.push_back(line[i]);
else
break;
}
следует упростить вызовом wstrchr, wcschr, WSTRCHR или чего-то еще, в зависимости от того, на какой платформе вы находитесь.
// как превратить строку в строку за один раз?
Используйте (не член) получить линию функция из стандартного заголовка строки.