Java - Splitting grand fichier texte SQL sur délimiter à l'aide du scanner (outofMemoryError)

Question 1

Tout d'abord, pourquoi vous créez ou un autre processus crée un fichier de 60 Go! Vous devez peut-être jeter un œil à ce processus pour corriger ce processus pour générer un fichier texte SQL plus petit au lieu de créer un nouveau processus. Cependant, s'il s'agit d'une chose unique que vous devez faire, cela pourrait être bien, mais pour répondre à votre question, j'utiliserais le BufferedReader pour lire et traiter les enregistrements s'il s'agit d'un fichier important comme vous l'avez indiqué.

BufferedReader br = new BufferedReader(new FileReader(file));
String line;
while ((line = br.readLine()) != null) {
   // process the line. and write into your output file and close the file.
   }
br.close();

Question 2

Moi personnellement: j'utilise BufferedReader à la place du scanner. Il a également une méthode Readline () pratique et je n'ai jamais eu de problèmes de performances avec. La seule chose est que vous devez vérifier manuellement si une lecture de ligne est celle que vous souhaitez traiter, mais c'est généralement aussi simple que d'appliquer les méthodes de classe de chaîne.

Ce n'est pas une réponse à votre question réelle, mais je le considère comme une alternative facile à utiliser.

Question 3

Essayez quelque chose comme ça (mais plus joli):

Scanner sc = new Scanner(new BufferedReader(new FileReader(file)));

Cela décore le tout avec un BufferedReader, ce qui signifie que tout le contenu du fichier ne sera pas chargé en mémoire à la fois. Vous pouvez utiliser le scanner de la même manière.

Question 4

Essayez d'utiliser un BufferedReader. Utilisation directe du scanner avec un fichier ou des flux de fichiers bruts pour charger les données en mémoire et ne pas le éliminer sur GC. L'approche des paris consiste à utiliser BufferedReader et à lire une ligne à la fois et à effectuer des vérifications manuelles de chaîne et une division. Si vous faites correctement de cette façon, vous pouvez donner au GC suffisamment l'occasion de récupérer la mémoire en cas de besoin