Ayuda a mejorar este código de análisis INI
Pregunta
Esto es algo simple que se me ocurrió para esta pregunta . No estoy del todo contento con eso y lo vi como una oportunidad para ayudar a mejorar mi uso de STL y la programación basada en secuencias.
std::wifstream file(L"\\Windows\\myini.ini");
if (file)
{
bool section=false;
while (!file.eof())
{
std::wstring line;
std::getline(file, line);
if (line.empty()) continue;
switch (line[0])
{
// new header
case L'[':
{
std::wstring header;
size_t pos=line.find(L']');
if (pos!=std::wstring::npos)
{
header=line.substr(1, pos);
if (header==L"Section")
section=true;
else
section=false;
}
}
break;
// comments
case ';':
case ' ':
case '#':
break;
// var=value
default:
{
if (!section) continue;
// what if the name = value does not have white space?
// what if the value is enclosed in quotes?
std::wstring name, dummy, value;
lineStm >> name >> dummy;
ws(lineStm);
WCHAR _value[256];
lineStm.getline(_value, ELEMENTS(_value));
value=_value;
}
}
}
}
¿Cómo mejorarías esto? No recomiende bibliotecas alternativas, solo quiero un método simple para analizar algunas cadenas de configuración de un archivo INI.
Solución
// ¿Qué pasa si el nombre = valor no tiene espacios en blanco?
// ¿Qué pasa si el valor está entre comillas?
Usaría boost :: regex para hacer coincidir cada tipo diferente de elemento, algo como:
boost::smatch matches;
boost::regex name_value("(\S+)\s*=\s*(\S+)");
if(boost::regex_match(line, matches, name_value))
{
name = matches[1];
value = matches[2];
}
las expresiones regulares pueden necesitar algunos ajustes.
También reemplazaría de stream.getline con std :: getline, eliminando la matriz de caracteres estáticos.
Otros consejos
Esto:
for (size_t i=1; i<line.length(); i++)
{
if (line[i]!=L']')
header.push_back(line[i]);
else
break;
}
debe simplificarse con una llamada a wstrchr, wcschr, WSTRCHR, o algo más, dependiendo de la plataforma en la que se encuentre.
// ¿cómo obtener una línea en una cadena de una sola vez?
Use la función (no miembro) getline del encabezado de cadena estándar.