Java - Verdeling van groot SQL -tekslêer op Delimeter met behulp van Scanner (OutOfMemoryError)

Question 1

Eerstens, waarom u skep of 'n ander proses is om 60 GB -lêer te skep! Miskien moet u na die proses kyk om die proses reg te stel om kleiner SQL -tekslêer te genereer in plaas daarvan om 'n nuwe proses te skep. As dit egter 'n eenmalige ding is wat u moet doen, kan dit goed gaan, maar om u vraag aan te spreek, sou ek die bufferedReader gebruik om die rekords te lees en te verwerk as dit 'n groot lêer is soos u aangedui het.

BufferedReader br = new BufferedReader(new FileReader(file));
String line;
while ((line = br.readLine()) != null) {
   // process the line. and write into your output file and close the file.
   }
br.close();

Question 2

Ek persoonlik: ek gebruik BufferedReader in die plek van die skandeerder. Dit het ook 'n gerieflike metode () -metode () en ek het nog nooit enige prestasieprobleme daarmee gehad nie. Die enigste ding is dat u met die hand moet kyk of 'n reël wat gelees word, een is wat u wil verwerk, maar dit is gewoonlik so eenvoudig soos om die stringklasmetodes toe te pas.

Dit is nie 'n antwoord op u werklike vraag nie, maar ek beskou dit as 'n ordentlike alternatief vir maklik om te gebruik.

Question 3

Probeer so iets (maar mooier):

Scanner sc = new Scanner(new BufferedReader(new FileReader(file)));

Dit versier die hele ding met 'n bufferedleser, wat beteken dat nie die inhoud van die lêer tegelyk in die geheue gelaai sal word nie. U kan die skandeerder op dieselfde manier gebruik.

Question 4

Probeer om 'n bufferedReader te gebruik. Direkte gebruik van skandeerder met lêer- of rou lêerstrome sal die data in die geheue laai en dit nie op GC uitspoel nie. Weddus -benadering is om BufferedReader te gebruik en een reël op 'n slag te lees en handmatige string -tjeks en splitsing te doen. As u op hierdie manier korrek gedoen word, kan u die GC genoeg geleentheid gee om die geheue te herwin indien nodig