Ajuda a melhorar esta código de análise INI
Pergunta
Este é algo simples que eu vim com para esta questão . Não estou inteiramente feliz com ele e eu vi isso como uma oportunidade para ajudar a melhorar o meu uso da STL e córregos programação baseada.
std::wifstream file(L"\\Windows\\myini.ini");
if (file)
{
bool section=false;
while (!file.eof())
{
std::wstring line;
std::getline(file, line);
if (line.empty()) continue;
switch (line[0])
{
// new header
case L'[':
{
std::wstring header;
size_t pos=line.find(L']');
if (pos!=std::wstring::npos)
{
header=line.substr(1, pos);
if (header==L"Section")
section=true;
else
section=false;
}
}
break;
// comments
case ';':
case ' ':
case '#':
break;
// var=value
default:
{
if (!section) continue;
// what if the name = value does not have white space?
// what if the value is enclosed in quotes?
std::wstring name, dummy, value;
lineStm >> name >> dummy;
ws(lineStm);
WCHAR _value[256];
lineStm.getline(_value, ELEMENTS(_value));
value=_value;
}
}
}
}
Como você melhorar isso? Por favor, não recomendo bibliotecas alternativas - Eu só quero um método simples para analisar algumas cordas de configuração de um arquivo INI
.Solução
// e se o name = valor não tem espaço em branco?
// e se o valor está entre aspas?
Gostaria de usar boost :: regex para corresponder para cada tipo diferente de elemento, algo como:
boost::smatch matches;
boost::regex name_value("(\S+)\s*=\s*(\S+)");
if(boost::regex_match(line, matches, name_value))
{
name = matches[1];
value = matches[2];
}
as expressões regulares pode precisar de alguns ajustes.
Eu também iria substituir de stream.getline com std :: getline, livrar-se da matriz de char estático.
Outras dicas
Este:
for (size_t i=1; i<line.length(); i++)
{
if (line[i]!=L']')
header.push_back(line[i]);
else
break;
}
deve ser simplificado por uma chamada para wstrchr, wcschr, WSTRCHR, ou qualquer outra coisa, dependendo de qual plataforma você está.
// como obter uma linha em uma string de uma só vez?
Use o (não membro) getline função do cabeçalho cadeia de caracteres padrão.