Pergunta

Eu estou trabalhando com números muito quando a edição de um determinado tipo de arquivo, e é principalmente um trabalho tedioso. O arquivo tem um formato parecido com isto:

damagebase = 8.834
    "abc_foo.odf" 3.77
    "def_bar.odf" 3.77
    "ghi_baz.odf" 3.77
    "jkl_blah.odf" 4.05
    ...

O que você recomendaria para escrever um script que analisa isso e me permite alterar programaticamente cada número?

Idioma: Eu uso C #, alguns F # (Noob) e Lua. Se você sugerir expressões regulares, você poderia fornecer as específicas como eu não estou familiarizado com eles?

Foi útil?

Solução

Você pode combinar corridas de não-espaço em branco e punt para Double.Parse :

int multiplier = 3;

string input =
  "damagebase = 8.834\n" +
  "  \"abc.odf\" 3.77\n" +
  "  \"def.odf\" 3.77\n" +
  "  \"ghi.odf\" .77\n" +
  "  \"jkl.odf\" -4.05\n" +
  "  \"mno.odf\" 5\n";

Regex r = new Regex(@"^(\w+)\s*=\s*(\S+)" +
                    @"(?:\s+""([^""]+)""\s+(\S+))+",
                    RegexOptions.Compiled | RegexOptions.Multiline);

Match m = r.Match(input);
if (m.Success) {
  double header = Double.Parse(m.Groups[2].Value);
  Console.WriteLine("{0} = {1}", m.Groups[1].Value,
                                 header * multiplier);

  CaptureCollection files = m.Groups[3].Captures;
  CaptureCollection nums  = m.Groups[4].Captures;
  for (int i = 0; i < files.Count; i++) {
    double val = Double.Parse(nums[i].Value);
    Console.WriteLine(@"  ""{0}"" {1}", files[i].Value,
                                        val * multiplier);
  }
}
else
  Console.WriteLine("no match");

Running dá

damagebase = 26.502
  "abc.odf" 11.31
  "def.odf" 11.31
  "ghi.odf" 2.31
  "jkl.odf" -12.15
  "mno.odf" 15

Outras dicas

Perl é bom bastante para coisas como esta. Aqui está um script Perl que vai fazer o que quiser.

#!/usr/bin/env perl

$multiplier = 2.0;

while (<>)
{
    $n = /=/ ? 2 : 1;
    @tokens = split;
    $tokens[$n] *= $multiplier;

    print "\t" if not /=/;
    print join(' ', @tokens) . "\n";
}

Uso:

./file.pl input_file > output_file

Se isso é realmente tudo o que você quer fazer, uso awk:

awk '{$NF *= 2.5 ; print }' < input_file > output_file

EDITADO:. Tudo bem, se você quiser manter o espaço em branco como você descreve, isso deve funcionar (embora ele está ficando deselegante)

awk '{$NF *= 2.5} /^\"/{print "\t" $0} !/^\"/{print}' < input_file > output_file

Você pode usar AWK como este (nota como a formatação foi convertida facilmente para o efeito),

sed 's/damagebase =/damagebase=/g' input.txt |\
    awk '{printf "     %s %s\n",$1,3.1*$2}' |\
    sed 's/.*damagebase=/damagebase =/g'

Eu estou multiplicando a segunda coluna por 3.1 neste exemplo de script.
Note-se que para restaurar a sua formatação,
há uma TAB inserido no início do printf e,
os dois comandos sed traduzir-e-volta o seu formato para um adequado para o comando AWK

Eu tentei

static void Main(string[] args)
{
    Console.WriteLine("Please enter the multiplier:");
    string stringMult = Console.ReadLine();
    int multiplier;
    Int32.TryParse(stringMult, out multiplier);
    StreamReader sr = new StreamReader(@"C:\Users\[obscured]\Desktop\Fleetops Mod\Data To Process.txt", true);
    string input = sr.ReadToEnd();
    sr.Close();
    StreamWriter sw = new StreamWriter(@"C:\Users\[obscured]\Desktop\Fleetops Mod\Data To Process.txt", false);
    Regex r = new Regex(@"^(\w+)\s*=\s*(\S+)" +
            @"(?:\s+""([^""]+)""\s+(\S+))+",
            RegexOptions.Compiled | RegexOptions.MultiLine);
    Match m = r.Match(input);
    if (m.Success) {
        double header = Double.Parse(m.Groups[2].Value);
        sw.WriteLine("{0} = {1}", m.Groups[1].Value,
                         header * multiplier);
        CaptureCollection files = m.Groups[3].Captures;
        CaptureCollection nums  = m.Groups[4].Captures;
        for (int i = 0; i < files.Count; i++) {
            double val = Double.Parse(nums[i].Value);
            sw.WriteLine(@"  ""{0}"" {1}", files[i].Value,
                                val * multiplier);
        }
    }
    else
        Console.WriteLine("no match");
    sw.Close();
    Console.WriteLine("Done!");
    Console.ReadKey();
}

(graças gbacon) e ele vem de volta com "nenhuma correspondência", mesmo quando eu coloco nos dados direita. Por que ele faz isso? Aqui está a dados de teste:

damagebase = 8.098
    "bor_adaptor_03.odf" 3.77
    "bor_adaptor_13.odf" 3.77
    "bor_adaptor_23.odf" 3.77
    "bor_adaptor_33.odf" 4.05
    "bor_adaptor_R3.odf" 3.77
    "bor_adaptor_T3.odf" 3.77
    "bor_cube_BHHHMM.odf" 6.48
    "bor_cube_BRHHHM.odf" 4.52
    "bor_cube_BRHHMM.odf" 6.48
    "bor_cube_BTHHHM.odf" 4.52
    "bor_cube_BTHHMM.odf" 6.48
    "bor_cube_BTRHHM.odf" 4.52
    "bor_cube_BTRHMM.odf" 6.48
    "bor_cube_BTTHHM.odf" 4.52
    "bor_cube_BTTHMM.odf" 6.48
    "bor_cube_BTTRHM.odf" 4.52
    "bor_cube_BTTRMM.odf" 6.48
    "bor_cube_BTTTHM.odf" 4.52
    "bor_cube_BTTTMM.odf" 6.48
    "bor_cube_BTTTRM.odf" 4.52
    "bor_cube_RHHHMM.odf" 6.48
    "bor_cube_THHHMM.odf" 6.48
    "bor_cube_TRHHHM.odf" 4.52
    "bor_cube_TRHHMM.odf" 6.48
    "bor_cube_TTHHHM.odf" 4.52
    "bor_cube_TTHHMM.odf" 6.48
    "bor_cube_TTRHHM.odf" 4.52
    "bor_cube_TTRHMM.odf" 6.48
    "bor_cube_TTTHHM.odf" 4.52
    "bor_cube_TTTHMM.odf" 6.48
    "bor_cube_TTTRHM.odf" 4.52
    "bor_cube_TTTRMM.odf" 6.48
    "dom_battle_cruiserY2r6.odf" 4.123
    "dom_battle_cruiserYr6.odf" 4.123
    "dom_battle_cruiserZ2r6.odf" 4.123
    "dom_battle_cruiserZr6.odf" 4.123
    "dom_battle_cruiser_fed2r6.odf" 4.123
    "dom_battle_cruiser_fedr6.odf" 4.123
    "dom_defenderr4.odf" 7.775
    "dom_defenderr5.odf" 7.452
    "dom_defenderr6.odf" 3.793
    "dom_dreadnought_borr4.odf" 3.77
    "dom_dreadnought_borr5.odf" 3.77
    "dom_dreadnought_borr6.odf" 3.77
    "dom_dreadnought_fedr4.odf" 3.77
    "dom_dreadnought_fedr5.odf" 3.77
    "dom_dreadnought_fedr6.odf" 3.77
    "dom_dreadnought_klir4.odf" 3.77
    "dom_dreadnought_klir5.odf" 3.77
    "dom_dreadnought_klir6.odf" 3.77
    "dom_dreadnought_romr4.odf" 3.77
    "dom_dreadnought_romr5.odf" 3.77
    "dom_dreadnought_romr6.odf" 3.77
    "dom_intercept_destr4.odf" 5.346
    "dom_intercept_destr5.odf" 2.673
    "dom_intercept_destr6.odf" 2.673
    "dom_intercept_dest_romr4.odf" 5.346
    "dom_intercept_dest_romr5.odf" 2.673
    "dom_intercept_dest_romr6.odf" 2.673
    "fed_ambassadorMr6.odf" 5.67
    "fed_ambassadorr6.odf" 5.67
    "fed_intrepidYr6.odf" 5.67
    "fed_intrepidZr6.odf" 5.67
    "fed_intrepid_borr6.odf" 5.67
    "fed_mirandaii.odf" 5.905
    "fed_mirandaiiM.odf" 5.905
    "fed_mirandaiiMr2.odf" 5.905
    "fed_mirandaiiMr3.odf" 5.905
    "fed_mirandaiiMr4.odf" 5.905
    "fed_mirandaiiMr5.odf" 5.905
    "fed_mirandaiiMr6.odf" 5.905
    "fed_mirandaiir2.odf" 5.905
    "fed_mirandaiir3.odf" 5.905
    "fed_mirandaiir4.odf" 5.905
    "fed_mirandaiir5.odf" 5.905
    "fed_mirandaiir6.odf" 5.905
    "fed_monsoonr4.odf" 4.782
    "fed_monsoonr5.odf" 2.31
    "fed_monsoonr6.odf" 3.726
    "fed_monsoonZr4.odf" 4.782
    "fed_monsoonZr5.odf" 2.31
    "fed_monsoonZr6.odf" 3.726
    "fed_monsoon_bor.odf" 4.52
    "fed_monsoon_borr2.odf" 4.52
    "fed_monsoon_borr3.odf" 4.52
    "fed_monsoon_borr4.odf" 6.32
    "fed_monsoon_borr5.odf" 3.315
    "fed_monsoon_borr6.odf" 2.916
    "fed_monsoon_klir4.odf" 4.782
    "fed_monsoon_klir5.odf" 2.31
    "fed_monsoon_klir6.odf" 3.726
    "fed_sovereignr4.odf" 6.69
    "fed_sovereignr5.odf" 5.51
    "fed_sovereignr6.odf" 5.51
    "fed_sovereignYr4.odf" 6.69
    "fed_sovereignYr5.odf" 5.51
    "fed_sovereignYr6.odf" 5.51
    "kli_brelr4.odf" 7.452
    "kli_brelr5.odf" 6.69
    "kli_brelr6.odf" 6.69
    "kli_brelZr4.odf" 7.452
    "kli_brelZr5.odf" 6.69
    "kli_brelZr6.odf" 6.69
    "kli_brel_borr4.odf" 7.452
    "kli_brel_borr5.odf" 6.69
    "kli_brel_borr6.odf" 6.69
    "kli_brel_romr4.odf" 7.452
    "kli_brel_romr5.odf" 6.69
    "kli_brel_romr6.odf" 6.69
    "kli_edjenr4.odf" 7.452
    "kli_edjenr5.odf" 6.69
    "kli_edjenr6.odf" 6.69
    "kli_kvortr6.odf" 6.69
    "kli_kvortZr6.odf" 6.69
    "kli_kvort_fedr6.odf" 6.69
    "rom_generix_dreadr4.odf" 7.723
    "rom_generix_dreadr5.odf" 7.21
    "rom_generix_dreadr6.odf" 7.21
    "rom_generix_dreadYr4.odf" 7.723
    "rom_generix_dreadYr5.odf" 7.21
    "rom_generix_dreadYr6.odf" 7.21
    "rom_generix_dread_klir4.odf" 7.723
    "rom_generix_dread_klir5.odf" 7.21
    "rom_generix_dread_klir6.odf" 7.21

A minha teoria é que, porque o espaço em branco que precede cada linha não-cabeçalho é um guia (e ele não vai aparecer dessa forma aqui), o regex não corresponde. Caso você esteja se perguntando, o espaço em branco é importante.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top