Inserimento in blocco di un file con un campo di testo con ritorno a capo (entra)

https://stackoverflow.com/questions/1645887

22-07-2019
|

Domanda

Sto riscontrando problemi con l'inserimento di massa di un file che contiene un campo nel testo del tipo di dati, contiene inserimenti e il delimitatore per i campi sono pipe " | " e il terminatore di riga è " | \ n "

Viene visualizzato un errore di troncamento per i campi accanto al campo di testo. Penso che l'inserto in blocco pensi che gli inserimenti nel secondo campo siano le righe successive.

DECLARE @sql varchar(2000)
PRINT 'xyz table'
SET @sql = 
'BULK INSERT xyz 
   FROM ''\\' + @@servername + '\Import\xyz.txt''
   WITH 
      (
                DATAFILETYPE   = ''char'',
                FIELDTERMINATOR         = ''|'',
                ROWTERMINATOR           = ''|\n'',
                TABLOCK,
                ROWS_PER_BATCH         = 2000,
                MAXERRORS      = 1000

                )
'
PRINT @sql
EXECUTE (@sql)
PRINT ''
GO

Questo è l'esempio di dati

467507**|**08-20-09\
[8:55:03 AM] *** miked@wkaiser-6793 is Not Available [Ext. away]\(CR)
[9:00:57 AM] *** miked@wkaiser-6793 is Online [Online]\(CR)
[9:01:00 AM] <jeffp> Howdy.  Time slip update game!  Update TS#467493 & 467507 with a (CR)comment and see if you win! [9:01:30 AM] *** miked@wkaiser-6793 is Away [Away]\
\(CR)
08-18-09\(CR)
[10:13:15 AM] *** miked@wkaiser-6793 is Online [Online]\(CR)
[10:13:59 AM] <jeffp> Howdy; welcome back from lunch..  Just pinging you for an update in TS#467493 & 467507.  Since 467493 is pri9, want a stock e-mail to go out to the customer to get them moving?\(CR)
[10:14:47 AM] <miked@wkaiser-6793> thats ok i got it\(CR)
[10:14:53 AM] <jeffp> Aiight.**|**2009-08-18 00:00:00**|**2009-08-20 00:00:00**|**JDP**|**JDP**|**

Lo schema della tabella è:

create table xyz
  (
    xyz_id VARCHAR(200), --INT TO VARCHAR
    notes text,
    create_date varchar(32), --DATETIME
    create_user varchar(12),
    modify_date varchar(32), --DATETIME
    modify_user varchar(12)
  )

Come puoi vedere (beh, non puoi vedere) ci sono entrate (contrassegnate con CR) e l'inserzione in blocco le confonde con una nuova riga.

Qualsiasi aiuto sarà apprezzato.

Grazie

Soluzione

MODIFICA: non non è necessario un file di formato:

IF OBJECT_ID('tempdb..#rawdata') IS NOT NULL DROP TABLE #rawdata
create table #rawdata (
  xyz_id VARCHAR(200)
, notes text
, create_date varchar(32)
, modify_date varchar(32)
, create_user varchar(12)
, modify_user varchar(12)
)

BULK INSERT #rawdata 
FROM 'C:\temp\file.txt'
WITH (
    FIELDTERMINATOR = '**|**'
  , ROWTERMINATOR = '**|**\n'
  , TABLOCK
  )

SELECT * FROM #rawdata

Potrebbe essere necessario giocare con ** | ** \ n (LF) vs ** | ** \ r \ n (CRLF) vs ** | ** \ r (CR), a seconda che il file sia Unix, DOS o simile a MAC.

/ EDIT

Non può essere fatto senza un file di formato. Quindi, crea un file di formato:

8.0
7
1 SQLCHAR 0 0 "**|**" 1 xyz_id        ""
2 SQLCHAR 0 0 "**|**" 2 notes         ""
3 SQLCHAR 0 0 "**|**" 3 create_date   ""
4 SQLCHAR 0 0 "**|**" 4 modify_date   ""
5 SQLCHAR 0 0 "**|**" 5 create_user   ""
6 SQLCHAR 0 0 "**|**" 6 modify_user   ""
7 SQLCHAR 0 0 "\n"    0 omitted       ""

Quindi:

IF OBJECT_ID('tempdb..#rawdata') IS NOT NULL DROP TABLE #rawdata
create table #rawdata (
  xyz_id VARCHAR(200)
, notes text
, create_date varchar(32)
, modify_date varchar(32)
, create_user varchar(12)
, modify_user varchar(12)
)

BULK INSERT #rawdata 
FROM '\\folder\file.txt'
WITH (
    FORMATFILE = '\\folder\file.fmt'
  , TABLOCK
  )

Oppure, in SQL 2005+:

SELECT * FROM OPENROWSET(
    BULK '\\folder\file.txt'
  , FORMATFILE = '\\folder\file.fmt'
  ) a

Altri suggerimenti

I dati non sono coerenti. Hai alcune righe che terminano \ (cr) con un campo, altri (cr) che terminano con | separatori di colonna

O quello o hai dei separatori di colonne incoerenti, alcuni \ (cr) , alcuni | . In tal caso, avrai bisogno di un file in formato per gestire ciascuna colonna " separata " ;.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow