Inserimento in blocco di un file con un campo di testo con ritorno a capo (entra)
-
22-07-2019 - |
Domanda
Sto riscontrando problemi con l'inserimento di massa di un file che contiene un campo nel testo del tipo di dati, contiene inserimenti e il delimitatore per i campi sono pipe " | " e il terminatore di riga è " | \ n "
Viene visualizzato un errore di troncamento per i campi accanto al campo di testo. Penso che l'inserto in blocco pensi che gli inserimenti nel secondo campo siano le righe successive.
DECLARE @sql varchar(2000)
PRINT 'xyz table'
SET @sql =
'BULK INSERT xyz
FROM ''\\' + @@servername + '\Import\xyz.txt''
WITH
(
DATAFILETYPE = ''char'',
FIELDTERMINATOR = ''|'',
ROWTERMINATOR = ''|\n'',
TABLOCK,
ROWS_PER_BATCH = 2000,
MAXERRORS = 1000
)
'
PRINT @sql
EXECUTE (@sql)
PRINT ''
GO
Questo è l'esempio di dati
467507**|**08-20-09\
[8:55:03 AM] *** miked@wkaiser-6793 is Not Available [Ext. away]\(CR)
[9:00:57 AM] *** miked@wkaiser-6793 is Online [Online]\(CR)
[9:01:00 AM] <jeffp> Howdy. Time slip update game! Update TS#467493 & 467507 with a (CR)comment and see if you win! [9:01:30 AM] *** miked@wkaiser-6793 is Away [Away]\
\(CR)
08-18-09\(CR)
[10:13:15 AM] *** miked@wkaiser-6793 is Online [Online]\(CR)
[10:13:59 AM] <jeffp> Howdy; welcome back from lunch.. Just pinging you for an update in TS#467493 & 467507. Since 467493 is pri9, want a stock e-mail to go out to the customer to get them moving?\(CR)
[10:14:47 AM] <miked@wkaiser-6793> thats ok i got it\(CR)
[10:14:53 AM] <jeffp> Aiight.**|**2009-08-18 00:00:00**|**2009-08-20 00:00:00**|**JDP**|**JDP**|**
Lo schema della tabella è:
create table xyz
(
xyz_id VARCHAR(200), --INT TO VARCHAR
notes text,
create_date varchar(32), --DATETIME
create_user varchar(12),
modify_date varchar(32), --DATETIME
modify_user varchar(12)
)
Come puoi vedere (beh, non puoi vedere) ci sono entrate (contrassegnate con CR) e l'inserzione in blocco le confonde con una nuova riga.
Qualsiasi aiuto sarà apprezzato.
Grazie
Soluzione
MODIFICA: non non è necessario un file di formato:
IF OBJECT_ID('tempdb..#rawdata') IS NOT NULL DROP TABLE #rawdata
create table #rawdata (
xyz_id VARCHAR(200)
, notes text
, create_date varchar(32)
, modify_date varchar(32)
, create_user varchar(12)
, modify_user varchar(12)
)
BULK INSERT #rawdata
FROM 'C:\temp\file.txt'
WITH (
FIELDTERMINATOR = '**|**'
, ROWTERMINATOR = '**|**\n'
, TABLOCK
)
SELECT * FROM #rawdata
Potrebbe essere necessario giocare con ** | ** \ n
(LF) vs ** | ** \ r \ n
(CRLF) vs ** | ** \ r
(CR), a seconda che il file sia Unix, DOS o simile a MAC.
/ EDIT
Non può essere fatto senza un file di formato. Quindi, crea un file di formato:
8.0
7
1 SQLCHAR 0 0 "**|**" 1 xyz_id ""
2 SQLCHAR 0 0 "**|**" 2 notes ""
3 SQLCHAR 0 0 "**|**" 3 create_date ""
4 SQLCHAR 0 0 "**|**" 4 modify_date ""
5 SQLCHAR 0 0 "**|**" 5 create_user ""
6 SQLCHAR 0 0 "**|**" 6 modify_user ""
7 SQLCHAR 0 0 "\n" 0 omitted ""
Quindi:
IF OBJECT_ID('tempdb..#rawdata') IS NOT NULL DROP TABLE #rawdata
create table #rawdata (
xyz_id VARCHAR(200)
, notes text
, create_date varchar(32)
, modify_date varchar(32)
, create_user varchar(12)
, modify_user varchar(12)
)
BULK INSERT #rawdata
FROM '\\folder\file.txt'
WITH (
FORMATFILE = '\\folder\file.fmt'
, TABLOCK
)
Oppure, in SQL 2005+:
SELECT * FROM OPENROWSET(
BULK '\\folder\file.txt'
, FORMATFILE = '\\folder\file.fmt'
) a
Altri suggerimenti
I dati non sono coerenti. Hai alcune righe che terminano \ (cr)
con un campo, altri (cr)
che terminano con | separatori di colonna
O quello o hai dei separatori di colonne incoerenti, alcuni \ (cr)
, alcuni |
.
In tal caso, avrai bisogno di un file in formato per gestire ciascuna colonna " separata " ;.