Frage

Ich arbeite an einem AA -Tool, um TSV -Dateien für den Import in eine Datenbank mit bcp.exe zu generieren, und ich möchte meine Ausgabe validieren. Ich kann dies tun, indem ich die Datei, die ich generiere, mit den Dateien vergleichen kann, die durch Exportieren mit BCP aus einer vorhandenen Datenbank erstellt wurden. Mein Problem ist, dass die Bestellung manchmal zwischen Dateien unterschiedlich sein kann. Ich hätte gerne ein Tool, das mir nur sagt, ob es Zeilen gibt, die in zwei Dateien keine genaue Übereinstimmung haben, unabhängig von der Reihenfolge der Zeilen.

War es hilfreich?

Lösung

"Unabhängig", ob "unabhängig" ein Wort ist...

Der zuverlässige Weg, diesen Vergleich durchzuführen, besteht darin, die beiden Dateien in dieselbe Reihenfolge zu sortieren und dann einen Dateivergleich durchzuführen. Da Sie 'bcp.exe' erwähnen, klingt das eher nach Windows und wahrscheinlich nach MS SQL Server als nach Unix und Sybase.

Ich würde wahrscheinlich Cygwin und beide verwenden diff oder comm vergleichen (und sort zu bestellen) die Dateien oder ein äquivalentes Unix Workalike Toolset (MKS, ...). Andere Personen können andere Tools empfehlen. Es hängt zum Teil davon ab, wie viele Unterschiede Sie wahrscheinlich normal finden und wie Sie mit ihnen umgehen werden, nachdem Sie sie gefunden haben. Ist eine GUI -Ausgabe notwendig? Außerdem stehen Sie vor einem Problem, das die Unterschiede auf bestimmte Zeilennummern in den ungeortierten Datendateien zurückverfolgt.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top