Pergunta

A necessidade do cliente um documento sistema de gestão e eu estou construindo informações sobre isso.

Eu sei sobre o SharePoint e ao ar livre, mas neste caso estou avaliando a informação necesary para construir a partir do zero, de modo que evite a sugerir o uso de qualquer um destes (estamos fazendo a avaliação deles separadamente, este é tudo sobre o desenvolvimento, não implementar uma solução existente).

Este são os requerimentos:

  • Tenha um requeriment muito específico de gestão legal dos documentos que é específico para o nosso governo local, mas para além deste:
  • Uma operação semelhante ao Google docs do ponto de vista do utilizador final
  • info loja Necessidade de 200 + usuários finais (UPDATE: são realmente +700 usuários finais)
  • Principalmente documentos de escritório, pdf, texto. Eu já tenho a extração de texto simples a partir desta arquivos binários.
  • No wiki, nenhuma criação portal, mal fluxo de trabalho, mas muito simples, só é gestão de arquivos
  • repositório central, participação em toda a empresa, integrado com o Active Directory
  • A procura rápida
  • integração com o desktop transparente
  • Interface Web
  • Multiplataforma, se possível

Então, isso é as coisas que tenho em cima da minha cabeça:

  • Armazenamento: Eu sei que o SharePoint Salvar tudo no db (Alfresco também?). Isso é um pesadelo, IMHO. Eu prefiro colocar os metadados em um banco de dados e os arquivos no disco.

I pensar em vigor o uso de ZFS, neste caso, e alavancar suas capacidades de controle de versão, instantâneos e escamação. Ou talvez usar git como backend de armazenamento (git vai funcionar bem?)

Então, onde eu posso saber mais sobre como lidar com um grande conjunto de documentos, no ZFS ou qualquer sistema de arquivos regular? Por exemplo, como o layout da estrutura de pastas para fácil managemnt & respostas rápidas, fácil backup, etc.

  • Metadados: Eu acho que em um DB regular aqui, mas me pergunto se tem mais mérito salvar tudo em Lucene (eu tenho alguma experiência em Lucene, mas a preocupação porque Lucene não pode ser federado, rigth?)
  • .

Se eu usar um motor de busca como base de metadados que pode poupar algum trabalho (não precisa de uma segunda passagem para a indexação), mas um motor de banco de dados regular é mais padrão.

  • Tecnologia:. Eu provavelmente irá construir isso no Django, PyLucene, Postgress, e fazer a integração shell para Windows (não tenho problemas para fazer isso)

Vou apreciate quaisquer sugestões ou informações em como implementar adequadamente esta solução.

Foi útil?

Solução

Pessoalmente acho os "semelhantes ao Google Docs" e requisitos "integração de desktop transparente" um pouco vago, IMHO. Mas a julgar pela pergunta que você está mais preocupado com o armazenamento de backend e documento, e olhando mais sobre o uso de uma pilha fonte mais aberta (com integração com o AD)?

De qualquer forma, eu, pessoalmente, estou usando KnowledgeTree como o nosso Sistema de Gestão de Documentos e sua implementação é que todos os arquivos reside em um diretório de arquivos e banco de dados irá acompanhar no caminho, metadados, logs de acesso correspondente e controle de versão informações. Eles basicamente mantidas várias versões do mesmo arquivo se um documento foi atualizado -. Que eu acho que foi um justo ideia implementação sábio considerando documentos do Microsoft Office são principalmente binário (até 2003)

Você pode querer entender o quanto os documentos que têm actualmente e quantos documentos que eles são uma espécie de esperando a fluir para este sistema em uma base diária. (Ou a partir de um ponto de vista diferente, que tipo de documentos que estão planejando para armazenar, em geral, dar dicas sobre que tipo de carga o servidor é suposto alça)

Meu palpite é que provavelmente você poderia fugir com a configuração de ter sistemas de arquivos locais e de banco de dados que armazenam material metadados menos que tenha certeza de que o sistema está prevista para ser lidar com uma carga enorme de documentos em uma base diária (imagine ser Flickr para documentos;.))

Outras dicas

  1. SharePoint e Alfresco são plataformas onde você pode fazer um pouco de personalização, por isso mesmo usá-los realmente significa que você está construindo algo.

  2. SharePoint armazena blobs no DB, por padrão, , mas tem maneiras de colocá-los em um sistema de arquivos

  3. Se você fazer isso sozinho, apoiar as extensões do FrontPage que aplicativos do Office usam para se comunicar com o SharePoint e Alfresco, e servir os documentos com os cabeçalhos corretos que contam IE para iniciar o aplicativo. Dessa forma você obtém a mesma integração de aplicativos Office que o SharePoint tem (usuários realmente amo esse recurso) - é apenas um protocolo HTTP simples

  4. Se você vai com SharePoint, minha empresa como um visualizador que possa ver PDF e em breve têm documentos do Office. Nós vendemos a tecnologia subjacente, mas é somente para Windows.

  5. Eu amo Django, e usá-lo para todos os projetos pessoais, mas eu realmente acho .NET e Java terá mais apoio de terceiros para as coisas que você precisa, e muito do seu código será portátil para SharePoint ou Alfresco, se você decidir ir por esse caminho mais tarde.

Editar : Mais informações sobre o nº 3, conforme solicitado

http://blogs.msdn.com/mikefitz /archive/2005/03/14/395112.aspx http://blogs.msdn.com/stcheng/archive/2008/12/17/wss-use-rpc-protocol-to-access- WSS-v3-site.aspx docs oficiais: http://msdn.microsoft.com/en-us/library/ms442469. aspx

Alfresco deve ser uma grande solução aqui. Ele suporta cada um de sua lista de exigências, exceto para a coisa do governo.

Mas se você está construindo "a partir do zero", talvez tomar as idéias dele, pelo menos?

armazenamento: o conteúdo do arquivo é salvo no sistema de arquivos. Fácil de gerenciar, armazenar, backup e outras coisas. Os arquivos não manter os nomes, porém, apenas seu conteúdo é salvo no formato binário e o arquivo é nomeado como hashes (acho hash do conteúdo?)

Metadados: é colocado no banco de dados. Rápido de acesso, rectificação, actualização e outras coisas. Cada nó tem propriedades - esses são nome, título, descripion, datas, informações de auditoria, o que você precisa. É apenas informações e tudo é guardado nas "propriedades" da tabela.

Pesquisar: Alfresco usa Solr para pesquisa, que costumava ser Lucene. Eu tinha muito grandes instalações, e se você colocar índice Lucene no SSD, é super rápido. (Lucene é rápido de qualquer maneira). Ele índices tanto de conteúdo arquivo e Propriedades -. Então você começa ao ID do nó muito rápido

Alfresco tem CIFS implementadas, bem como o WebDAV, ftp e outros enfeites. O ponto é, você pode simplesmente montá-lo para desktops dos usuários como pastas ou discos.

interface de Web está lá, MGMT repo central é lá, todos os reqs. E uma vez que é open source, você pode obter alguns dos que a fonte e usá-lo em seu projeto. Apesar de que seria muito melhor para tomar Alfresco Community e apenas contribuir um pouco para trás se você se sentir bem.

Você está tentando construir o sistema de gestão de documentos? Alfresco & SharePoint? Alfresco & SharePoint são as soluções de gerenciamento de projeto não as soluções de gestão de documentos. Alfresco é algum tipo de solução DMS, mas não o bom nisso. Sim! Para a solução de gerenciamento de projeto, é um software bom.

Eu sugiro que você compre a solução de gerenciamento de documentos que é gestão jurídica fo os documentos e também específico para o governo local. Existem alguns fornecedores de sistemas de gestão de documentos como Laserfiche & OnBase, seu trabalho é semelhante ao Google Docs. Você pode criar uma conta para cada funcionário da empresa ou do negócio.

Sim, todos os documentos estão no formato MS Office como o MS-Word, MS-Excel, PDF e PPT

Fluxo de trabalho com o sistema de gestão de documentos é muito eficiente e fácil de manusear

Sim no utilizando DMS você pode facilmente encontrar o arquivo em poucos minutos (Laserfiche Software levar 10 balas para extrair o arquivo ou pasta) Laserfiche DMs é software de interface web. Você pode fazer o login no software e alcançar o arquivo ou pasta a partir de diferentes locais de fácil

Armazenamento

sistema Em DMS todos os dados são garantidos e armazenados em um armazenamento em nuvem. Você pode facilmente chegar o documento apenas fazendo login em sua conta. Em caso de perda ou qualquer disforme, você pode obter os dados perdidos da empresa.

Meta Data

sistema DMs é o motor de banco de dados regular como todos os dados de negócio é garantido no armazenamento em nuvem na base regular

Tecnologia

Não há necessidade de construir qualquer coisa; você só precisa comprar o software DMS. Eu recomendo que você o Laserfiche porque estamos usando os seus serviços

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top