Java: dividir el archivo de texto SQL grande en el delimeter usando Scanner (OutOfMemoryError)

Question 1

Primero, ¡por qué está creando o algún otro proceso es crear un archivo de 60 GB! Tal vez deba echar un vistazo a ese proceso para corregir ese proceso para generar un archivo de texto SQL más pequeño en lugar de crear un nuevo proceso. Sin embargo, si esto es algo único que debe hacer, entonces eso podría estar bien, pero para abordar su pregunta, usaría el BufferedReader para leer y procesar los registros si es un archivo grande como lo indicó.

BufferedReader br = new BufferedReader(new FileReader(file));
String line;
while ((line = br.readLine()) != null) {
   // process the line. and write into your output file and close the file.
   }
br.close();

Question 2

Yo personalmente: uso BufferedReader en lugar del escáner. También tiene un método conveniente de readline () y nunca he tenido problemas de rendimiento con él. Lo único es que necesitaría verificar manualmente si una lectura de línea es una que desea procesar, pero eso generalmente es tan simple como aplicar los métodos de clase de cadena.

Esa no es una respuesta a su pregunta real, pero considero que es una alternativa decente fácil de usar.

Question 3

Prueba algo como esto (pero más bonito):

Scanner sc = new Scanner(new BufferedReader(new FileReader(file)));

Esto decora todo con un BufferedReader, lo que significa que no todo el contenido del archivo se cargará en la memoria a la vez. Puede usar el escáner de la misma manera.

Question 4

Intenta usar un BufferedReader. El uso directo del escáner con el archivo o las secuencias de archivos sin procesar cargarán los datos en la memoria y no lo eliminarán en GC. El enfoque de BETS es usar BufferedReader y leer una línea a la vez y hacer verificaciones de cadenas manuales y dividir. Si se hace correctamente de esta manera, puede darle al GC suficiente oportunidad para reclamar la memoria cuando sea necesario