문제

우리는 사용자가 문서를 업로드하고 자신만의 문서를 만드는 등의 작업을 수행할 수 있는 웹 앱을 보유하고 있습니다.업로드된 파일은 Amazon S3에 저장되고, 생성된 정보는 MySQL 데이터베이스에 저장됩니다.내가 찾고 있는 것은 일종의 검색 엔진으로, 각각 고유한 ID가 있는 모든 텍스트 문서를 제공하고 색인 등을 작성합니다.나중에 검색 쿼리를 제공하면 일치하는 텍스트 조각과 함께 가장 일치하는 문서(ID를 통해)를 가져옵니다.

기본적으로 우리는 사용자가 다른 사용자가 공개로 표시한 모든 항목과 함께 업로드된 항목의 저장소를 검색할 수 있도록 하려고 합니다.솔루션은 표준 Linux 서버에서 실행되어야 하며 이상적으로는 오픈 소스이지만 가격이 터무니없이 비싸지 않다면 유료 솔루션도 고려할 것입니다.

지금까지 저는 세 가지 잠재적 후보를 찾았습니다.

  1. MySQL 전체 텍스트 검색 - 내가 읽은 일부 보고에 따르면 속도가 매우 느리다는 것입니다.
  2. 아파치 루씬 - 불행하게도 Java로 작성되었지만 필요할 경우 사용하겠습니다.아마도 빠르다
  3. 스핑크스 - 그다지 인기가 없는 것 같습니다. 이상적으로는 제가 찾은 솔루션이 무엇이든 많은 커뮤니티 지원을 받게 될 것입니다.

제가 간과한 다른 좋은 선택 사항이 있거나 위의 사항에 대한 경험이 있다면 알려 주시기 바랍니다.

도움이 되었습니까?

해결책

보세요 솔르.Lucene 기반이라 매우 빠르고, 어떤 플랫폼에서나 사용하기가 정말 쉽습니다.

다른 팁

스핑크스 여러 일반적인 RDMS(특히 MySQL)와 잘 작동하므로 고려해 볼 가치가 있습니다.

도 있습니다 사피안 이는 빠르고 사용자 정의가 가능합니다.

S3에 저장된 문서에 유용할 수 있는 데이터베이스에 저장되지 않은 데이터를 인덱싱할 수 있는 사용자 지정 인덱서를 지원합니다.

나는 그것을 상상한다 Google 귀하의 요구를 충족하는 솔루션을 갖게 될 것입니다.여기에서 시작하세요: 구글 엔터프라이즈

"라는 Lucene의 Ruby 포트가 있습니다.가는 리본".Ruby API 외에도 "cFerret"이라는 기본 c 구현을 얻을 수 있습니다.

루씬은 매우 좋습니다.그리고 원래는 Java로 작성되었지만 PHP 구현이 있습니다. http://framework.zend.com/manual/en/zend.search.lucene.html

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top