需要在textwrangler中使用正则表达式查找和替换

https://stackoverflow.com/questions/4586414

14-10-2019
|

题

我有此CSV文件，在这里纯文本： http://pastie.org/1425970

在Excel中的外观： http://cl.ly/3qxk

我希望它看起来像的示例（仅以第一行为例）： http://cl.ly/3Qyt

第一行的纯文本： http://pastie.org/1425979

我需要创建一个CSV文件，以将所有信息导入数据库表。

我可以手动创建CSV，但是我想看看是否可以使用Textwrangler（GREP）中的正则表达式来完成此操作

解决方案

正则表达并不是实现这一目标的最佳方法。正如其他人所指出的那样，您最好编写一些代码将文件解析为所需的格式。

话虽如此，这条丑陋的正则应将您带到那里：

寻找：

(\d+),"?(?:(\d+),? ?)?(?:(\d+),? ?)?(?:(\d+),? ?)?(?:(\d+),? ?)?(?:(\d+),? ?)?(?:(\d+),? ?)?(?:(\d+),? ?)?"?

代替：

\1,\2\r\1,\3\r\1,\4\r\1,\5\r\1,\6\r\1,\7\r\1,\8

这会给您带来一些额外的行，如下：

1,1
1,8
1,11
1,13
1,
1,
1,
2,10
2,11
2,12
2,
2,
...

您可以手动清洁额外的行，也可以使用以下正则表达式：

寻找：

\d+,\r

代替：

(empty string)

其他提示

使用Perl，您可以做这样的事情：

open(my $read,"<","input.csv") or die ("Gah, couldn't read input.csv!\n"); open(my $write,">","output.csv") or die ("WHAAAARGARBL!\n"); while(<$read>) { chomp; if(/(\d+),"(.*)"/) { my @arr=split(/,/,$2); foreach(@arr) { print $write $1.",".$2."\n"; } } } close($read); close($write);

我不认识文字同伴。但是总的来说，我可以描述在伪代码中需要做什么。

loop, read each line  
   strip off the newline
   split into an array using /[, "]+/ as delimeter regex
   loop using result. an array slice from element 1 to the last element
       print element 0, comma, then itterator value
   end loop
end loop

在珀尔，类似的东西..

while ($line = <DATA> ) {
    chomp $line;
    @data_array = split /[, "]+/, $line;
    for $otherfield ( @data_array[ 1 .. $#data_array ]) {
        print "$data_array[0], $otherfield\n";
    }
}

如果您具有分裂功能，应该很容易。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow