는 무료 데이터베이스 시스템에 저장하는 것이 가장 좋습니다,및 계산 분석 큰 텍스트를 비교하는 데이터베이스를 만들 것 사용 가능한 통계는?[마감]

StackOverflow https://stackoverflow.com/questions/202715

  •  03-07-2019
  •  | 
  •  

문제

나는 스크립트를 만드는 비교할 수천 개의 큰 텍스트(다).이 MySQL 가를위한 최고의 솔루션입니다.은 거기에 다른 데이타베이스 시스템을 사용할 수 있게 하는 간단하지만 프로세서 시간이 소요 컴퓨팅?

십시오,던져 나에게 당신의 지식이 수영장!

편집:자연의 문서 500-7000 문자 문서,->을 비교하는 경우 문서 텍스트와 일치하는 다른 문서(표절)및 통계->%의 경기장을 발견된 좋은 설정을 다음과 같고 싶을 설정하는 방법을 많은 문자가 다른 문자열이 될 수 있는 다른 수도로 간주됩 일치하는 것으로..

기술해야 할 서버를 기반으로,나는 더 interestedin DB 그리고 나서 선택하는 적절한 언어하는 스크립트니다.

더 많은 사양:의 크기는 DB 해야 무한합니다.

도움이 되었습니까?

해결책

를 사용하는 것을 고려해야 합니다 루씬.그것을 저장할 수 있습 많은 양의 텍스트와 그들이 정말 빠르다.좋은 관련성에 일치하는 너무입니다.

다른 팁

당신이 언급하지 않는 기술을 사용하는 것입;의 크기는 텍스트 또는 항목의 성격 비교할 수 있습니다.그러나,내가 설립 h2 데이터베이스 하실 수 있습니다.그것은 기본 java 로 사용할 수 있습니다 메모리 데이터베이스에는 설치 하는 것입니다.

PostgreSql 무료 데이터베이스 엔진에는 확장 가능하고 널리 이용되는 외에,MySQL.

Sql Server 익스프레스

나 MySQL.그것은 많은 내장된 문자열 처리 기능입니다.

인을 지정하지 않는지 왜 SQL Server2008Express Edition?

모든 검색 기능과 형 SQL Server2008 으로만 문제는 당신을 초과할 수 없습 4Gb 의 데이터베이스입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top