Pergunta

Eu tenho um std :: string que contém um comando a ser executado com execv, qual é a melhor maneira "C ++" para convertê-lo para o "char * argv []" que é exigido pelo segundo parâmetro de execv () ?

Para esclarecer:

std::string cmd = "mycommand arg1 arg2";
char *cmd_argv[];

StrToArgv(cmd, cmd_argv); // how do I write this function?

execv(cmd_argv[0], cmd_argv);
Foi útil?

Solução

std::vector<char *> args;
std::istringstream iss(cmd);

std::string token;
while(iss >> token) {
  char *arg = new char[token.size() + 1];
  copy(token.begin(), token.end(), arg);
  arg[token.size()] = '\0';
  args.push_back(arg);
}
args.push_back(0);

// now exec with &args[0], and then:

for(size_t i = 0; i < args.size(); i++)
  delete[] args[i];

Claro, isso não vai funcionar com commans que usam citando como rm "a file.mp3". Você pode considerar a função POSIX wordexp que se preocupa com isso e muito mais.

Outras dicas

respostas muito não-UNIXy aqui. O que há de errado com:

std::string cmd = "echo hello world";
execl("/bin/sh", "/bin/sh", "-c", cmd.c_str(), NULL);

Por que se preocupar escrevendo um analisador de linha de comando quando há um perfeitamente bom que já está no sistema?

(Nota: uma razão boa é porque você não confia a seqüência que você está prestes a executar espera-se que isso já é verdade, mas o shell vai fazer "mais" com essa seqüência de um espaço em branco-splitter ingênuo. vontade e, portanto, mais aberto brechas de segurança se você não for cuidadoso.)

A combinação do c_str () método de cordas e strtok () para dividi-la por espaços deverá fazê-lo o conjunto de cordas que você precisa para passar para exec () e suas funções relacionadas.

Talvez split_winmain de Boost.ProgramOptions. Boost é uma boa escolha na maioria dos casos. http://www.boost.org/ doc / libs / 1_40_0 / doc / html / program_options / HOWTO.html # id1396212

Se você está interessado apenas no Windows (outros kernels geralmente não sabem sobre linhas de comando no sentido Windows), você pode usar o CommandLineToArgvW função API que utiliza as mesmas convenções como o tempo de execução MS C.

Em geral, depende do estilo citando da plataforma e / ou o shell. A Microsoft C Runtime usa um estilo completamente diferente do que, por exemplo, Bash!

OK, eu fui tropeçando isso mesmo suficiente vezes. Esta é reto "C", para que ele possa ser conectado em C ou C ++. Trata cordas aspas simples e duplas de forma diferente. O chamador é responsável por desalocá argv [0] (se não NULL) e argv.

#include 
#include 
#include 
#include 

typedef enum {
    STR2AV_OK       = 0,
    STR2AV_UNBALANCED_QUOTE
} str_to_argv_err_t;

#ifndef NUL
#define NUL '\0'
#endif

static char const nomem[] = "no memory for %d byte allocation\n";

static str_to_argv_err_t
copy_raw_string(char ** dest_p, char ** src_p);

static str_to_argv_err_t
copy_cooked_string(char ** dest_p, char ** src_p);

static inline void *
Xmalloc(size_t sz)
{
    void * res = malloc(sz);
    if (res == NULL) {
        fprintf(stderr, nomem, sz);
        exit(EXIT_FAILURE);
    }
    return res;
}

static inline void *
Xrealloc(void * ptr, size_t sz)
{
    void * res = realloc(ptr, sz);
    if (res == NULL) {
        fprintf(stderr, nomem, sz);
        exit(EXIT_FAILURE);
    }
    return res;
}

str_to_argv_err_t
string_to_argv(char const * str, int * argc_p, char *** argv_p)
{
    int     argc = 0;
    int     act  = 10;
    char ** res  = Xmalloc(sizeof(char *) * 10);
    char ** argv = res;
    char *  scan;
    char *  dest;
    str_to_argv_err_t err;

    while (isspace((unsigned char)*str))  str++;
    str = scan = strdup(str);

    for (;;) {
        while (isspace((unsigned char)*scan))  scan++;
        if (*scan == NUL)
            break;

        if (++argc >= act) {
            act += act / 2;
            res  = Xrealloc(res, act * sizeof(char *));
            argv = res + (argc - 1);
        }

        *(argv++) = dest = scan;

        for (;;) {
            char ch = *(scan++);
            switch (ch) {
            case NUL:
                goto done;

            case '\\':
                if ( (*(dest++) = *(scan++)) == NUL)
                    goto done;
                break;

            case '\'':
                err = copy_raw_string(&dest, &scan);
                if (err != STR2AV_OK)
                    goto error_leave;
                break;

            case '"':
                err = copy_cooked_string(&dest, &scan);
                if (err != STR2AV_OK)
                    goto error_leave;
                break;

            case ' ':
            case '\t':
            case '\n':
            case '\f':
            case '\r':
            case '\v':
            case '\b':
                goto token_done;

            default:
                *(dest++) = ch;
            }
        }

    token_done:
        *dest = NUL;
    }

done:

    *argv_p = res;
    *argc_p = argc;
    *argv   = NULL;
    if (argc == 0)
        free((void *)str);

    return STR2AV_OK;

error_leave:

    free(res);
    free((void *)str);
    return err;
}

static str_to_argv_err_t
copy_raw_string(char ** dest_p, char ** src_p)
{
    for (;;) {
        char ch = *((*src_p)++);

        switch (ch) {
        case NUL: return STR2AV_UNBALANCED_QUOTE;
        case '\'':
            *(*dest_p) = NUL;
            return STR2AV_OK;

        case '\\':
            ch = *((*src_p)++);
            switch (ch) {
            case NUL:
                return STR2AV_UNBALANCED_QUOTE;

            default:
                /*
                 * unknown/invalid escape.  Copy escape character.
                 */
                *((*dest_p)++) = '\\';
                break;

            case '\\':
            case '\'':
                break;
            }
            /* FALLTHROUGH */

        default:
            *((*dest_p)++) = ch;
            break;
        }
    }
}

static char
escape_convt(char ** src_p)
{
    char ch = *((*src_p)++);

    /*
     *  Escape character is always eaten.  The next character is sometimes
     *  treated specially.
     */
    switch (ch) {
    case 'a': ch = '\a'; break;
    case 'b': ch = '\b'; break;
    case 't': ch = '\t'; break;
    case 'n': ch = '\n'; break;
    case 'v': ch = '\v'; break;
    case 'f': ch = '\f'; break;
    case 'r': ch = '\r'; break;
    }

    return ch;
}


static str_to_argv_err_t
copy_cooked_string(char ** dest_p, char ** src_p)
{
    for (;;) {
        char ch = *((*src_p)++);
        switch (ch) {
        case NUL: return STR2AV_UNBALANCED_QUOTE;
        case '"':
            *(*dest_p) = NUL;
            return STR2AV_OK;

        case '\\':
            ch = escape_convt(src_p);
            if (ch == NUL)
                return STR2AV_UNBALANCED_QUOTE;
            /* FALLTHROUGH */

        default:
            *((*dest_p)++) = ch;
            break;
        }
    }
}

Esta é uma variação sobre a resposta de litb, mas sem toda a alocação de memória manual. Ele ainda não vai lidar com citando.

#include <vector>
#include <string>
#include <sstream>

std::string cmd = "mycommand arg1 arg2";
std::istringstream ss(cmd);
std::string arg;
std::list<std::string> ls;
std::vector<char*> v;
while (ss >> arg)
{
   ls.push_back(arg); 
   v.push_back(const_cast<char*>(ls.back().c_str()));
}
v.push_back(0);  // need terminating null pointer

execv(v[0], &v[0]);

Eu me sinto uma espécie de sujo sobre o const_cast <>, mas os programas realmente não deve ser modificando o conteúdo das cordas argv.

Você pode usar a função c_str () de std :: string para converter para char *. A função strtok vai dividir a string usando o '' delimitador.

Matt Peitrek LIBTINYC tem um módulo chamado argcargv.cpp que leva uma corda e analisa-lo para a matriz argumento tomando argumentos citados em conta. Nota que é específico para Windows, mas é muito simples de modo deve ser fácil para se deslocar para qualquer plataforma que você quiser.

Se você fizer isso, também alterá-lo para tomar como parâmetros o loaction para colocar a contagem e a um ponteiro para a matriz argv em vez de usar externs (apenas o meu pouco de aconselhamento). Matt não precisava disso, porque LIBTINYC foi o tempo de execução.

Como alternativa, você pode olhar na fonte de tempo de execução do seu compilador (quase todos fornecê-la) para ver o que eles fazem para analisar a linha de comando e qualquer chamada que diretamente (se isso acaba por ser viável) ou pedir emprestado as idéias de que pouco de código.

Pode ser que seja tarde demais para responder a esta pergunta, mas você poderia usar do standart funções POSIX glob ou wordexp :

#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <wordexp.h>

int
main(int argc, char **argv)
{
   wordexp_t p;
   char *exec_path = "/bin/ls";

   p.we_offs = 1;
   wordexp("-l -t /etc", &p, WRDE_DOOFFS);
   p.we_wordv[ 0 ] = exec_path;
   execv(exec_path, p.we_wordv);

   /* This code is unreachable */
   exit(EXIT_SUCCESS);
}

Ele iria preparar 3 parâmetros: -l (listando formato longo), -t (classificar por data de modificação) e /etc diretório à lista, e /bin/ls prazo. Chamada wordexp() lhe dá exatamente o mesmo resultado que /bin/sh -c chamada recomendado anteriormente, mas processo spawaned teriam processo pai não /bin/sh.

Como se verificou a exist função um pouco escondido em opções de programas impulso para isso. Os split_unix () funciona de função com linhas de comando escaparam e citados.

#include "boost/program_options/parsers.hpp"


auto parts = boost::program_options::split_unix(commandLine);
std::vector<char*> cstrings ;
for(auto& str : parts){
    cstrings.push_back(const_cast<char*> (str.c_str()));
}

int argc = (int)cstrings.size();
char** argv = cstrings.data();
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top