converter string para argv no c ++
Pergunta
Eu tenho um std :: string que contém um comando a ser executado com execv, qual é a melhor maneira "C ++" para convertê-lo para o "char * argv []" que é exigido pelo segundo parâmetro de execv () ?
Para esclarecer:
std::string cmd = "mycommand arg1 arg2";
char *cmd_argv[];
StrToArgv(cmd, cmd_argv); // how do I write this function?
execv(cmd_argv[0], cmd_argv);
Solução
std::vector<char *> args;
std::istringstream iss(cmd);
std::string token;
while(iss >> token) {
char *arg = new char[token.size() + 1];
copy(token.begin(), token.end(), arg);
arg[token.size()] = '\0';
args.push_back(arg);
}
args.push_back(0);
// now exec with &args[0], and then:
for(size_t i = 0; i < args.size(); i++)
delete[] args[i];
Claro, isso não vai funcionar com commans que usam citando como rm "a file.mp3"
. Você pode considerar a função POSIX wordexp
que se preocupa com isso e muito mais.
Outras dicas
respostas muito não-UNIXy aqui. O que há de errado com:
std::string cmd = "echo hello world";
execl("/bin/sh", "/bin/sh", "-c", cmd.c_str(), NULL);
Por que se preocupar escrevendo um analisador de linha de comando quando há um perfeitamente bom que já está no sistema?
(Nota: uma razão boa é porque você não confia a seqüência que você está prestes a executar espera-se que isso já é verdade, mas o shell vai fazer "mais" com essa seqüência de um espaço em branco-splitter ingênuo. vontade e, portanto, mais aberto brechas de segurança se você não for cuidadoso.)
A combinação do c_str () método de cordas e strtok () para dividi-la por espaços deverá fazê-lo o conjunto de cordas que você precisa para passar para exec () e suas funções relacionadas.
Talvez split_winmain
de Boost.ProgramOptions. Boost é uma boa escolha na maioria dos casos.
http://www.boost.org/ doc / libs / 1_40_0 / doc / html / program_options / HOWTO.html # id1396212
Se você está interessado apenas no Windows (outros kernels geralmente não sabem sobre linhas de comando no sentido Windows), você pode usar o CommandLineToArgvW
função API que utiliza as mesmas convenções como o tempo de execução MS C.
Em geral, depende do estilo citando da plataforma e / ou o shell. A Microsoft C Runtime usa um estilo completamente diferente do que, por exemplo, Bash!
OK, eu fui tropeçando isso mesmo suficiente vezes. Esta é reto "C", para que ele possa ser conectado em C ou C ++. Trata cordas aspas simples e duplas de forma diferente. O chamador é responsável por desalocá argv [0] (se não NULL) e argv.
#include
#include
#include
#include
typedef enum {
STR2AV_OK = 0,
STR2AV_UNBALANCED_QUOTE
} str_to_argv_err_t;
#ifndef NUL
#define NUL '\0'
#endif
static char const nomem[] = "no memory for %d byte allocation\n";
static str_to_argv_err_t
copy_raw_string(char ** dest_p, char ** src_p);
static str_to_argv_err_t
copy_cooked_string(char ** dest_p, char ** src_p);
static inline void *
Xmalloc(size_t sz)
{
void * res = malloc(sz);
if (res == NULL) {
fprintf(stderr, nomem, sz);
exit(EXIT_FAILURE);
}
return res;
}
static inline void *
Xrealloc(void * ptr, size_t sz)
{
void * res = realloc(ptr, sz);
if (res == NULL) {
fprintf(stderr, nomem, sz);
exit(EXIT_FAILURE);
}
return res;
}
str_to_argv_err_t
string_to_argv(char const * str, int * argc_p, char *** argv_p)
{
int argc = 0;
int act = 10;
char ** res = Xmalloc(sizeof(char *) * 10);
char ** argv = res;
char * scan;
char * dest;
str_to_argv_err_t err;
while (isspace((unsigned char)*str)) str++;
str = scan = strdup(str);
for (;;) {
while (isspace((unsigned char)*scan)) scan++;
if (*scan == NUL)
break;
if (++argc >= act) {
act += act / 2;
res = Xrealloc(res, act * sizeof(char *));
argv = res + (argc - 1);
}
*(argv++) = dest = scan;
for (;;) {
char ch = *(scan++);
switch (ch) {
case NUL:
goto done;
case '\\':
if ( (*(dest++) = *(scan++)) == NUL)
goto done;
break;
case '\'':
err = copy_raw_string(&dest, &scan);
if (err != STR2AV_OK)
goto error_leave;
break;
case '"':
err = copy_cooked_string(&dest, &scan);
if (err != STR2AV_OK)
goto error_leave;
break;
case ' ':
case '\t':
case '\n':
case '\f':
case '\r':
case '\v':
case '\b':
goto token_done;
default:
*(dest++) = ch;
}
}
token_done:
*dest = NUL;
}
done:
*argv_p = res;
*argc_p = argc;
*argv = NULL;
if (argc == 0)
free((void *)str);
return STR2AV_OK;
error_leave:
free(res);
free((void *)str);
return err;
}
static str_to_argv_err_t
copy_raw_string(char ** dest_p, char ** src_p)
{
for (;;) {
char ch = *((*src_p)++);
switch (ch) {
case NUL: return STR2AV_UNBALANCED_QUOTE;
case '\'':
*(*dest_p) = NUL;
return STR2AV_OK;
case '\\':
ch = *((*src_p)++);
switch (ch) {
case NUL:
return STR2AV_UNBALANCED_QUOTE;
default:
/*
* unknown/invalid escape. Copy escape character.
*/
*((*dest_p)++) = '\\';
break;
case '\\':
case '\'':
break;
}
/* FALLTHROUGH */
default:
*((*dest_p)++) = ch;
break;
}
}
}
static char
escape_convt(char ** src_p)
{
char ch = *((*src_p)++);
/*
* Escape character is always eaten. The next character is sometimes
* treated specially.
*/
switch (ch) {
case 'a': ch = '\a'; break;
case 'b': ch = '\b'; break;
case 't': ch = '\t'; break;
case 'n': ch = '\n'; break;
case 'v': ch = '\v'; break;
case 'f': ch = '\f'; break;
case 'r': ch = '\r'; break;
}
return ch;
}
static str_to_argv_err_t
copy_cooked_string(char ** dest_p, char ** src_p)
{
for (;;) {
char ch = *((*src_p)++);
switch (ch) {
case NUL: return STR2AV_UNBALANCED_QUOTE;
case '"':
*(*dest_p) = NUL;
return STR2AV_OK;
case '\\':
ch = escape_convt(src_p);
if (ch == NUL)
return STR2AV_UNBALANCED_QUOTE;
/* FALLTHROUGH */
default:
*((*dest_p)++) = ch;
break;
}
}
}
Esta é uma variação sobre a resposta de litb, mas sem toda a alocação de memória manual. Ele ainda não vai lidar com citando.
#include <vector>
#include <string>
#include <sstream>
std::string cmd = "mycommand arg1 arg2";
std::istringstream ss(cmd);
std::string arg;
std::list<std::string> ls;
std::vector<char*> v;
while (ss >> arg)
{
ls.push_back(arg);
v.push_back(const_cast<char*>(ls.back().c_str()));
}
v.push_back(0); // need terminating null pointer
execv(v[0], &v[0]);
Eu me sinto uma espécie de sujo sobre o const_cast <>, mas os programas realmente não deve ser modificando o conteúdo das cordas argv.
Você pode usar a função c_str () de std :: string para converter para char *. A função strtok vai dividir a string usando o '' delimitador.
Matt Peitrek LIBTINYC tem um módulo chamado argcargv.cpp que leva uma corda e analisa-lo para a matriz argumento tomando argumentos citados em conta. Nota que é específico para Windows, mas é muito simples de modo deve ser fácil para se deslocar para qualquer plataforma que você quiser.
Se você fizer isso, também alterá-lo para tomar como parâmetros o loaction para colocar a contagem e a um ponteiro para a matriz argv em vez de usar externs (apenas o meu pouco de aconselhamento). Matt não precisava disso, porque LIBTINYC foi o tempo de execução.
Como alternativa, você pode olhar na fonte de tempo de execução do seu compilador (quase todos fornecê-la) para ver o que eles fazem para analisar a linha de comando e qualquer chamada que diretamente (se isso acaba por ser viável) ou pedir emprestado as idéias de que pouco de código.
Pode ser que seja tarde demais para responder a esta pergunta, mas você poderia usar do standart funções POSIX glob ou wordexp :
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <wordexp.h>
int
main(int argc, char **argv)
{
wordexp_t p;
char *exec_path = "/bin/ls";
p.we_offs = 1;
wordexp("-l -t /etc", &p, WRDE_DOOFFS);
p.we_wordv[ 0 ] = exec_path;
execv(exec_path, p.we_wordv);
/* This code is unreachable */
exit(EXIT_SUCCESS);
}
Ele iria preparar 3 parâmetros: -l
(listando formato longo), -t
(classificar por data de modificação) e /etc
diretório à lista, e /bin/ls
prazo. Chamada wordexp()
lhe dá exatamente o mesmo resultado que /bin/sh -c
chamada recomendado anteriormente, mas processo spawaned teriam processo pai não /bin/sh
.
Como se verificou a exist função um pouco escondido em opções de programas impulso para isso. Os split_unix () funciona de função com linhas de comando escaparam e citados.
#include "boost/program_options/parsers.hpp"
auto parts = boost::program_options::split_unix(commandLine);
std::vector<char*> cstrings ;
for(auto& str : parts){
cstrings.push_back(const_cast<char*> (str.c_str()));
}
int argc = (int)cstrings.size();
char** argv = cstrings.data();