Pregunta

Un cliente necesita un sistema de gestión de documentos y estoy recopilando información sobre esto.

Sé sobre sharepoint & amp; al aire libre, pero en este caso estoy evaluando la información necesaria para construirla desde cero, así que por favor abstenerse de sugerir el uso de cualquiera de estos (estamos haciendo la evaluación de ellos por separado, esto se trata de desarrollar, no implementar un existente solución).

Estos son los requisitos:

  • Tener un requisito muy específico de la gestión legal de los documentos que es específico de nuestro gobierno local, pero aparte de esto:
  • Una operación similar a los documentos de Google desde el punto de vista del usuario final
  • Necesita información de la tienda de más de 200 usuarios finales (ACTUALIZACIÓN: Son realmente +700 usuarios finales)
  • Principalmente documentos de oficina, pdf, texto. Ya tengo la extracción de texto plano de estos archivos binarios.
  • Sin wiki, sin creación de portal, apenas flujo de trabajo pero muy simple, es solo administración de archivos
  • Repositorio central, compartir en toda la empresa, integrado con el directorio activo
  • Búsqueda rápida
  • Integración de escritorio transparente
  • Interfaz web
  • Multiplataforma, si es posible

Entonces, estas son las cosas que tengo encima de mi cabeza:

  • Almacenamiento: sé que sharepoint guarda todo en la base de datos (¿Alfresco también?). Eso es una pesadilla, en mi humilde opinión. Prefiero poner los metadatos en una base de datos y los archivos en el disco.

Estoy pensando en forzar el uso de ZFS en este caso & amp; aprovechar sus capacidades para el control de versiones, instantáneas y amp; escalada. O tal vez use git como backend de almacenamiento (¿git funcionará bien?)

Entonces, ¿dónde puedo saber más sobre cómo manejar un gran conjunto de documentos, en ZFS o en cualquier sistema de archivos normal? Por ejemplo, cómo diseñar la estructura de carpetas para administrar fácilmente & amp; respuestas rápidas, copia de seguridad fácil, etc.

  • Metadatos: Creo que en una base de datos normal aquí, pero me pregunto si tengo más mérito para guardar todo en Lucene (tengo algo de experiencia en Lucene, pero me preocupo porque Lucene no puede ser federado, ¿verdad?).

Si uso un motor de búsqueda como base de datos de metadatos, puedo guardar algo de trabajo (no necesito un segundo pase para la indexación), pero un motor de base de datos normal es más estándar.

  • Tecnología: Probablemente construiré esto en Django, PyLucene, Postgress y haré la integración de shell para Windows (no tengo problemas para hacerlo).

Apreciaré cualquier pista o información sobre cómo implementar correctamente esta solución.

¿Fue útil?

Solución

Personalmente, encuentro el " similar a Google Docs " y "Integración de escritorio transparente" requisitos un poco vagos, en mi humilde opinión. Pero a juzgar por la pregunta, ¿está más preocupado por el backend y el almacenamiento de documentos, y busca más sobre el uso de una pila de código abierto (con integración con AD)?

De todos modos, personalmente estoy usando KnowledgeTree como nuestro sistema de gestión de documentos y su implementación es que todos los archivos reside en un directorio de archivos y la base de datos realizará un seguimiento de la ruta, los metadatos correspondientes, los registros de acceso y la información de versiones. Básicamente, mantuvieron varias versiones del mismo archivo si se actualizó un documento, lo que creo que fue una idea bastante acertada para la implementación teniendo en cuenta que los documentos de Microsoft Office son en su mayoría binarios (hasta 2003).

Es posible que desee comprender cuántos documentos tienen actualmente y cuántos documentos esperan recibir diariamente en este sistema. (O desde un punto de vista diferente, el tipo de documentos que planean almacenar generalmente le daría pistas sobre qué tipo de carga debe manejar su servidor)

Supongo que lo más probable es que puedas salirte con la configuración de tener sistemas de archivos locales y bases de datos que almacenen metadatos a menos que estés seguro de que se espera que el sistema maneje una carga masiva de documentos a diario (imagina que eres Flickr para documentos;)).

Otros consejos

  1. SharePoint y Alfresco son plataformas en las que puedes personalizar un poco, por lo que incluso usarlas realmente significa que estás creando algo.

  2. SharePoint almacena blobs en la base de datos de forma predeterminada, pero tiene formas de colocarlos en un sistema de archivos

  3. Si lo hace usted mismo, admita las extensiones de portada que usan las aplicaciones de Office para comunicarse con SharePoint y Alfresco, y sirva los documentos con los encabezados correctos que le indican a IE que inicie la aplicación. De esta forma, obtiene la misma integración a las aplicaciones de Office que SharePoint (los usuarios realmente adoran esta característica): es solo un simple protocolo HTTP

  4. Si va con SharePoint, mi compañía como vista previa gratuita de documentos que puede ver PDF y pronto lo hará tener documentos de Office. Vendemos la tecnología subyacente, pero es solo Windows.

  5. Me encanta Django, y lo uso para todos los proyectos personales, pero realmente creo que .NET y Java tendrán más soporte de terceros para las cosas que necesita, y gran parte de su código será portátil para SharePoint o Alfresco si decides ir por ese camino más tarde.

EDITAR : Más información sobre el # 3 según lo solicitado

http://blogs.msdn.com/mikefitz /archive/2005/03/14/395112.aspx http://blogs.msdn.com/stcheng/archive/2008/12/17/wss-use-rpc-protocol-to-access- wss-v3-site.aspx Documentos oficiales: http://msdn.microsoft.com/en-us/library/ms442469. aspx

Alfresco debería ser una gran solución aquí. Es compatible con todos y cada uno de los requisitos de su lista, excepto para el gobierno.

Pero si está construyendo "desde cero", ¿tal vez tome las ideas de eso, al menos?

Almacenamiento: el contenido del archivo se guarda en el sistema de archivos. Fácil de administrar, almacenar, respaldar y otras cosas. Sin embargo, los archivos no mantienen los nombres, solo su contenido se guarda en formato binario y el archivo se nombra como hash (¿supongo que hash del contenido?)

Metadatos: se coloca en la base de datos. Rápido para acceder, cambiar, actualizar y otras cosas. Cada nodo tiene propiedades: nombre, título, descripción, fechas, información de auditoría, lo que sea que necesite. Es solo información y todo se guarda en las "propiedades". mesa.

Búsqueda: Alfresco usa Solr para la búsqueda, solía ser Lucene. Tuve instalaciones bastante grandes, y si pones el índice lucene en el SSD, es increíblemente rápido. (Lucene es rápido de todos modos). Indexa tanto el contenido como las propiedades del archivo, por lo que accede al ID del nodo muy rápido.

Alfresco tiene implementado CIFS, así como webdav, ftp y otras cosas. El punto es que puede montarlo en los escritorios de los usuarios como carpetas o discos.

La interfaz web está ahí, la administración central de repositorios está ahí, todas las solicitudes. Y dado que es de código abierto, puede obtener parte de esa fuente y utilizarla en su proyecto. Aunque sería mucho mejor tomar Alfresco Community y solo contribuir un poco si te sientes bien.

¿Está tratando de construir el sistema de gestión de documentos? Alfresco & amp; SharePoint? Alfresco & amp; SharePoint son las soluciones de gestión de proyectos, no las soluciones de gestión de documentos. Alfresco es algún tipo de solución DMS, pero no es bueno en eso. ¡Sí! Para la solución de gestión de proyectos, es un buen software.

Le sugiero que compre la solución de gestión de documentos, que es la gestión legal de los documentos y también específica para el gobierno local. Hay algunos proveedores de sistemas de gestión de documentos como Laserfiche & amp; OnBase, su trabajo es similar al de Google Docs. Puede crear una cuenta para cada empleado de la empresa o del negocio.

Sí, todos los documentos están en formato MS Office como Ms-Word, Ms-excel, PDF & amp; PPT

El flujo de trabajo con el sistema de gestión de documentos es mucho más eficiente y fácil de manejar

Sí, al usar DMS puede encontrar fácilmente el archivo en cuestión de minutos (el software Laserfiche tarda 10 minutos en extraer el archivo o la carpeta) Laserfiche DMs es un software de interfaz web. Puede iniciar sesión en el software y acceder fácilmente al archivo o carpeta desde diferentes ubicaciones

Almacenamiento

En el sistema DMS, todos los datos están protegidos y almacenados en un almacenamiento en la nube. Puede acceder fácilmente al documento simplemente iniciando sesión en su cuenta. En caso de pérdida o deformación, puede obtener los datos perdidos de la empresa.

Metadatos

El sistema DM es el motor de base de datos normal, ya que todos los datos comerciales están protegidos en el almacenamiento en la nube de forma regular

Tecnología

No hay necesidad de construir nada; solo necesita comprar el software DMS. Te recomiendo el Laserfiche porque estamos usando sus servicios

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top