题
我发现这个 Perl 脚本 将我的 SQLite 数据库迁移到 mysql
我想知道(因为我不懂 Perl)如何用 Python 重写它?
最短(代码)答案的奖励积分:)
编辑: :抱歉,我的意思是最短的代码,而不是严格意义上的最短答案
#! /usr/bin/perl
while ($line = <>){
if (($line !~ /BEGIN TRANSACTION/) && ($line !~ /COMMIT/) && ($line !~ /sqlite_sequence/) && ($line !~ /CREATE UNIQUE INDEX/)){
if ($line =~ /CREATE TABLE \"([a-z_]*)\"(.*)/){
$name = $1;
$sub = $2;
$sub =~ s/\"//g; #"
$line = "DROP TABLE IF EXISTS $name;\nCREATE TABLE IF NOT EXISTS $name$sub\n";
}
elsif ($line =~ /INSERT INTO \"([a-z_]*)\"(.*)/){
$line = "INSERT INTO $1$2\n";
$line =~ s/\"/\\\"/g; #"
$line =~ s/\"/\'/g; #"
}else{
$line =~ s/\'\'/\\\'/g; #'
}
$line =~ s/([^\\'])\'t\'(.)/$1THIS_IS_TRUE$2/g; #'
$line =~ s/THIS_IS_TRUE/1/g;
$line =~ s/([^\\'])\'f\'(.)/$1THIS_IS_FALSE$2/g; #'
$line =~ s/THIS_IS_FALSE/0/g;
$line =~ s/AUTOINCREMENT/AUTO_INCREMENT/g;
print $line;
}
}
成功迁移 sqlite 数据库需要一些额外的代码(处理一行创建表语句、外键、修复原始程序中转换空字段的错误) ''
到 \'
.
解决方案
下面是一个相当直译只有最小的明显的风格变化(把所有的代码放到一个函数,使用字符串,而不是重新操作如果可能的话)。
import re, fileinput
def main():
for line in fileinput.input():
process = False
for nope in ('BEGIN TRANSACTION','COMMIT',
'sqlite_sequence','CREATE UNIQUE INDEX'):
if nope in line: break
else:
process = True
if not process: continue
m = re.search('CREATE TABLE "([a-z_]*)"(.*)', line)
if m:
name, sub = m.groups()
line = '''DROP TABLE IF EXISTS %(name)s;
CREATE TABLE IF NOT EXISTS %(name)s%(sub)s
'''
line = line % dict(name=name, sub=sub)
else:
m = re.search('INSERT INTO "([a-z_]*)"(.*)', line)
if m:
line = 'INSERT INTO %s%s\n' % m.groups()
line = line.replace('"', r'\"')
line = line.replace('"', "'")
line = re.sub(r"([^'])'t'(.)", r"\1THIS_IS_TRUE\2", line)
line = line.replace('THIS_IS_TRUE', '1')
line = re.sub(r"([^'])'f'(.)", r"\1THIS_IS_FALSE\2", line)
line = line.replace('THIS_IS_FALSE', '0')
line = line.replace('AUTOINCREMENT', 'AUTO_INCREMENT')
print line,
main()
其他提示
亚历克斯·马尔泰利的解决方案工作良好,但需要一些修正和补充:
在使用正则表达式替换的线,所述匹配组的插入必须是双重逸出OR替换字符串必须随r标记前缀是作为正则表达式:
line = re.sub(r"([^'])'t'(.)", "\\1THIS_IS_TRUE\\2", line)
或
line = re.sub(r"([^'])'f'(.)", r"\1THIS_IS_FALSE\2", line)
另外,该线路应该被打印之前添加:
line = line.replace('AUTOINCREMENT', 'AUTO_INCREMENT')
最后,在创建报表的列名应该是在MySQL反引号。在管线15中添加这样的:
sub = sub.replace('"','`')
下面是具有修饰的完整的脚本:
import re, fileinput
def main():
for line in fileinput.input():
process = False
for nope in ('BEGIN TRANSACTION','COMMIT',
'sqlite_sequence','CREATE UNIQUE INDEX'):
if nope in line: break
else:
process = True
if not process: continue
m = re.search('CREATE TABLE "([a-z_]*)"(.*)', line)
if m:
name, sub = m.groups()
sub = sub.replace('"','`')
line = '''DROP TABLE IF EXISTS %(name)s;
CREATE TABLE IF NOT EXISTS %(name)s%(sub)s
'''
line = line % dict(name=name, sub=sub)
else:
m = re.search('INSERT INTO "([a-z_]*)"(.*)', line)
if m:
line = 'INSERT INTO %s%s\n' % m.groups()
line = line.replace('"', r'\"')
line = line.replace('"', "'")
line = re.sub(r"([^'])'t'(.)", "\\1THIS_IS_TRUE\\2", line)
line = line.replace('THIS_IS_TRUE', '1')
line = re.sub(r"([^'])'f'(.)", "\\1THIS_IS_FALSE\\2", line)
line = line.replace('THIS_IS_FALSE', '0')
line = line.replace('AUTOINCREMENT', 'AUTO_INCREMENT')
if re.search('^CREATE INDEX', line):
line = line.replace('"','`')
print line,
main()
下面是一个稍微好一些版本的原始的。
#! /usr/bin/perl
use strict;
use warnings;
use 5.010; # for s/\K//;
while( <> ){
next if m'
BEGIN TRANSACTION |
COMMIT |
sqlite_sequence |
CREATE UNIQUE INDEX
'x;
if( my($name,$sub) = m'CREATE TABLE \"([a-z_]*)\"(.*)' ){
# remove "
$sub =~ s/\"//g; #"
$_ = "DROP TABLE IF EXISTS $name;\nCREATE TABLE IF NOT EXISTS $name$sub\n";
}elsif( /INSERT INTO \"([a-z_]*)\"(.*)/ ){
$_ = "INSERT INTO $1$2\n";
# " => \"
s/\"/\\\"/g; #"
# " => '
s/\"/\'/g; #"
}else{
# '' => \'
s/\'\'/\\\'/g; #'
}
# 't' => 1
s/[^\\']\K\'t\'/1/g; #'
# 'f' => 0
s/[^\\']\K\'f\'/0/g; #'
s/AUTOINCREMENT/AUTO_INCREMENT/g;
print;
}
这个网页的所有脚本不能处理简单的sqlite3:
PRAGMA foreign_keys=OFF;
BEGIN TRANSACTION;
CREATE TABLE Filename (
FilenameId INTEGER,
Name TEXT DEFAULT '',
PRIMARY KEY(FilenameId)
);
INSERT INTO "Filename" VALUES(1,'');
INSERT INTO "Filename" VALUES(2,'bigfile1');
INSERT INTO "Filename" VALUES(3,'%gconf-tree.xml');
没有一个能够重新格式化“表格名”到适当的MySQL的`table_name`。一些弄乱了空字符串值。
我不知道什么是很难理解这个,它需要一个卑鄙的话在你上面的评论。需要注意的是<>
被称为钻石运营商。 s///
是替换操作符和//
是匹配操作符m//
。
基于 http://docs.python.org/dev/howto/regex.html ...
- 代替
$line =~ /.*/
和re.search(r".*", line)
. $line !~ /.*/
只是!($line =~ /.*/)
.- 代替
$line =~ s/.*/x/g
和line=re.sub(r".*", "x", line)
. - 代替
$1
通过$9
里面re.sub
和\1
通过\9
分别。 - 在子程序之外,保存返回值,即
m=re.search()
, ,并替换$1
返回值为m.group(1)
. - 为了
"INSERT INTO $1$2\n"
具体来说,你可以做"INSERT INTO %s%s\n" % (m.group(1), m.group(2))
.
真正的问题是你真的知道如何迁移数据库?什么被呈现仅仅是搜索和替换循环。
最短?波浪号表示在Perl的正则表达式。 “再进口”,并从那里走。唯一的主要区别是,你将使用\ 1 \ 2而不是$ 1和$ 2,当你指定的值,你就可以用%s,当你替换字符串内正则表达式匹配的。