텍스트 파일을 읽고 처리하는 가장 좋은 방법
-
18-09-2019 - |
문제
탭으로 유명한 텍스트 파일을 처리하는 데 가장 좋아하는 방법/ 유용한 라이브러리가 있는지 궁금하십니까? 이 파일에는 평균 30,000-50,000 행이 있습니다. 각 행을 읽고 데이터베이스에 버려야합니다. 그러나 모든 데이터를 일시적으로 저장해야합니다. 그 이유는 데이터를 보유한 테이블이 1,000,00 행 이상이되면 새 테이블을 만들고 데이터를 넣어야하기 때문입니다. 코드는 Windows 서비스에서 실행되므로 처리 시간이 걱정되지 않습니다.
단지 표준을 수행하는 것에 대해 생각하고 있었는데 (sr.readline ()) ... 어떤 제안이 있습니까?
건배,
숀.
해결책
이 도서관 매우 유연하고 빠릅니다. 나는 그것을 추천하지 않는다. 기본값은 ',', ', 구분 기자로서' t '로 쉽게 변경할 수 있습니다.
다른 팁
"데이터베이스에 던지는 것"은 라인을 버퍼에 읽는 것보다 적어도 1 크기가 더 오래 걸리므로 데이터를 사전 스캔하여 행의 수를 계산할 수 있습니다 (구문 분석하지 않고). 그런 다음 데이터베이스 결정을 내립니다. 그런 다음 실제 작업을 수행하는 데이터를 다시 읽으십시오. 운이 좋으면 OS는 파일을 캐시하여 더 빨리 읽습니다.
제휴하지 않습니다 StackOverflow