Используйте BCP для импорта файла CSV в SQL 2005 или 2008
-
06-09-2019 - |
Вопрос
У меня есть файл CSV, и мне нужно импортировать его в таблицу в SQL 2005 или 2008. Имена столбцов и подсчет в CSV отличаются от имен столбцов таблицы и подсчета. CSV разделен A ';' Анкет
Пример
CSV FileContents:
FirstName;LastName;Country;Age
Roger;Mouthout;Belgium;55
Таблица SQL Person
Columns: FName,LName,Country
Решение
Я бы создал временную таблицу, вставьте лот, выберите в новую таблицу, что вам нужно, и отбросил временную таблицу.
Что-то типа
CREATE TABLE dbo.TempImport
(
FirstName varchar(255),
LastName varchar(255),
Country varchar(255),
Age varchar(255)
)
GO
BULK INSERT dbo.TempImport FROM 'PathToMyTextFile' WITH (FIELDTERMINATOR = ';', ROWTERMINATOR = '\n')
GO
INSERT INTO dbo.ExistingTable
(
FName,
LName,
Country
)
SELECT FirstName,
LastName,
Country
FROM dbo.TempImport
GO
DROP TABLE dbo.TempImport
GO
Другие советы
Вы можете использовать файл формата при импорте с BCP:
Создайте файл формата для вашей таблицы:
bcp [table_name] format nul -f [format_file_name.fmt] -c -T
9.0
4
1 SQLCHAR 0 100 "," 1 FName SQL_Latin1_General_CP1_CI_AS
2 SQLCHAR 0 100 "," 2 LName SQL_Latin1_General_CP1_CI_AS
3 SQLCHAR 0 100 "," 3 Country SQL_Latin1_General_CP1_CI_AS
4 SQLCHAR 0 100 "\r\n" 0 Age SQL_Latin1_General_CP1_CI_AS
Измените файл импорта. Хитрость заключается в том, чтобы добавить фиктивную строку для поля, которое вы хотите пропустить, и добавить «0» в качестве порядка столбца сервера.
Затем импортируйте данные, используя этот файл формата, указав ваш inputfile, этот файл формата и Seperator:
bcp [table_name] in [data_file_name] -t , -f [format_file_name.fmt] -T
Теперь я предпочитаю использовать такие файлы формата XML с объемной вставкой или OpenRowset:
<?xml version="1.0"?>
<BCPFORMAT xmlns="http://schemas.microsoft.com/sqlserver/2004/bulkload/format" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<RECORD>
<FIELD ID="1" xsi:type="CharTerm" TERMINATOR="|" COLLATION="SQL_Latin1_General_CP1_CI_AS"/>
<FIELD ID="2" xsi:type="CharTerm" TERMINATOR="|" MAX_LENGTH="37"/>
<FIELD ID="3" xsi:type="CharTerm" TERMINATOR="|" MAX_LENGTH="41"/>
<FIELD ID="4" xsi:type="CharTerm" TERMINATOR="|" MAX_LENGTH="17"/>
<FIELD ID="5" xsi:type="CharTerm" TERMINATOR="\r\n" MAX_LENGTH="10" COLLATION="SQL_Latin1_General_CP1_CI_AS"/>
</RECORD>
<ROW>
<COLUMN SOURCE="1" NAME="i" xsi:type="SQLCHAR"/>
<COLUMN SOURCE="2" NAME="j" xsi:type="SQLUNIQUEID"/>
<COLUMN SOURCE="3" NAME="k" xsi:type="SQLNUMERIC" PRECISION="18" SCALE="0"/>
<COLUMN SOURCE="4" NAME="l" xsi:type="SQLBINARY"/>
<COLUMN SOURCE="5" NAME="m" xsi:type="SQLVARYCHAR"/>
</ROW>
</BCPFORMAT>
Затем вы можете использовать команду объемного вставки на стороне сервера следующим образом:
BULK INSERT foo FROM '\\mydomain.com\bar\bletch' WITH (FORMATFILE='foo.xml', ERRORFILE='foo.errors', FIRSTROW = 1, BATCHSIZE=10000)
В качестве альтернативы, если вы хотите изменить данные «в полете», вы можете использовать
INSERT foo(i, j,k)
SELECT foo_delimited.i, foo_delimited.j, foo_delimited.k * 2
OPENROWSET(BULK 'foo',
FORMATFILE= 'foo.xml')
AS foo_delimited
Для получения информации, с той же структурой, вы можете использовать этот вид оператора:
bcp schema.Table in "/Samples/AdventureWorksDW/DimCurrency.csv" \
-S db.url \
-d databaseName \
-U userName \
-P pwd \
-t ; `# The field separator ` \
-c `# Insert as character and doesn't ask the data type` \
-q `# With quote -- seems to be mandatory`
Видеть пример