Java - Aufteilung einer großen SQL -Textdatei auf dem Delimeter mit Scanner (outofMemoryError)

Question 1

Erstens, warum Sie erstellen oder einen anderen Prozess erstellen, ist eine 60 -GB -Datei! Vielleicht müssen Sie sich diesen Prozess ansehen, um diesen Prozess zu beheben, um eine kleinere SQL -Textdatei zu generieren, anstatt einen neuen Prozess zu erstellen. Wenn dies jedoch eine einmalige Sache ist, die Sie tun müssen, könnte dies in Ordnung sein, aber um Ihre Frage zu beantworten, würde ich den BufferedReader verwenden, um die Datensätze zu lesen und zu verarbeiten, wenn es sich um eine große Datei handelt, wie Sie angegeben sind.

BufferedReader br = new BufferedReader(new FileReader(file));
String line;
while ((line = br.readLine()) != null) {
   // process the line. and write into your output file and close the file.
   }
br.close();

Question 2

Ich persönlich: Ich benutze BufferedReader am Standpunkt des Scanners. Es hat auch eine praktische Readline () -Methode und ich hatte noch nie Probleme mit der Leistung. Das einzige, was Sie manuell prüfen müssen, ob eine Lektüre eine Linie ist, die Sie verarbeiten möchten, aber das ist normalerweise so einfach wie die Anwendung der String -Klassenmethoden.

Das ist keine Antwort auf Ihre tatsächliche Frage, aber ich halte es für eine angemessene benutzerfreundliche Alternative.

Question 3

Probieren Sie so etwas (aber hübscher) aus:

Scanner sc = new Scanner(new BufferedReader(new FileReader(file)));

Dies dekoriert das Ganze mit einem BufferedReader, was bedeutet, dass nicht der gesamte Inhalt der Datei gleichzeitig in den Speicher geladen wird. Sie können den Scanner auf die gleiche Weise verwenden.

Question 4

Versuchen Sie, einen BufferedReader zu verwenden. Direkte Verwendung von Scanner mit Datei- oder Rohdatei -Streams. Laden Sie die Daten im Speicher und spülen Sie sie nicht auf GC aus. Der BET -Ansatz besteht darin, BufferedReader zu verwenden und jeweils eine Zeile zu lesen und manuelle Zeichenfolgenprüfungen und Spalten durchzuführen. Wenn Sie auf diese Weise richtig gemacht werden, können Sie der GC genügend Gelegenheit geben, bei Bedarf das Gedächtnis zurückzugewinnen