Question

Un client a besoin d'un système de gestion de documents et crée des informations à ce sujet.

Je connais le sharepoint & amp; alfresco, mais dans ce cas, j’évalue l’information nécessaire pour le construire à partir de zéro, évitez donc de suggérer l’utilisation de l’un d’eux (nous en faisons l’évaluation séparément, il s’agit de développer, de ne pas implémenter un solution).

Ce sont les requeriments:

  • Vous avez une exigence très spécifique de la part de la direction légale des documents qui est spécifique à notre gouvernement local, mais à part cela:
  • Une opération similaire à Google Documents du point de vue de l'utilisateur final
  • Besoin d'informations sur les magasins de plus de 200 utilisateurs finaux (UPDATE: ce sont vraiment +700 utilisateurs finaux)
  • Principalement des documents de bureau, pdf, texte. J'ai déjà extrait le texte brut de ces fichiers binaires.
  • Pas de wiki, pas de création de portail, processus simple mais très simple, n’est que la gestion de fichiers
  • Référentiel central, partagé dans toute la société, intégré à Active Directory
  • Recherche rapide
  • Intégration de bureau transparente
  • interface Web
  • Multiplateform, si possible

Voilà donc ce que j'ai sur la tête:

  • Stockage: Je sais que le SharePoint sauvegarde tout dans la base de données (Alfresco aussi?). C'est un cauchemar, à mon humble avis. Je préfère mettre les métadonnées dans une base de données et les fichiers sur le disque.

Je songe à forcer l'utilisation de ZFS dans ce cas & amp; tirer parti de leurs capacités pour la gestion des versions, des instantanés et mise à l'échelle. Ou peut-être utiliser git comme backend de stockage (git fonctionnera bien?)

Alors, où puis-je en savoir plus sur la façon de gérer un grand pool de documents, dans ZFS ou tout système de fichiers classique? Par exemple, comment mettre en forme la structure de dossiers facile à managemnt & amp; réponses rapides, sauvegarde facile, etc.

  • Métadonnées: Je pense que dans une base de données classique ici, mais je me demande si nous avons plus de mérite que de tout sauvegarder dans Lucene (j'ai de l'expérience sur Lucene, mais je m'inquiète parce que Lucene ne peut pas être fédérée, n'est-ce pas?).

Si j'utilise un moteur de recherche comme base de métadonnées, je peux économiser du travail (un second passage pour l'indexation n'est pas nécessaire), mais un moteur de base de données classique est plus standard.

  • Tech: Je vais probablement construire cela dans Django, PyLucene, Postgress et faire l’intégration du shell pour Windows (je n’ai pas de problèmes pour le faire).

Je vais apprécier toutes les astuces ou informations utiles à la mise en œuvre de cette solution.

Était-ce utile?

La solution

Personnellement, je trouve le " similaire à Google Docs " et " Intégration de bureau transparente " exigences un peu vagues, à mon humble avis. Mais à en juger par la question, vous êtes plus préoccupé par le backend et le stockage de documents que par l’utilisation d’une pile plus open source (avec intégration avec AD)?

Quoi qu'il en soit, personnellement, j'utilise KnowledgeTree comme système de gestion de documents et leur implémentation est que tous les fichiers réside dans un répertoire de fichiers et la base de données gardera trace du chemin, des métadonnées correspondantes, des journaux d'accès et des informations de version. Ils ont en principe conservé plusieurs versions du même fichier si un document avait été mis à jour - ce qui, à mon avis, était une idée assez juste en termes de mise en œuvre, étant donné que les documents Microsoft Office sont principalement binaires (jusqu'en 2003).

Vous voudrez peut-être comprendre combien de documents ils ont actuellement et combien de documents ils espèrent recevoir dans ce système quotidiennement. (Ou d’un autre point de vue, le type de documents qu’ils prévoient de stocker vous indiquerait généralement le type de charge que votre serveur est supposé gérer.)

À mon avis, il est fort probable que vous pourriez vous permettre de créer des systèmes de fichiers locaux et une base de données stockant des métadonnées, sauf si vous êtes certain que le système traitera une charge de documents considérable quotidiennement (imaginez être Flickr). pour les documents;)).

Autres conseils

  1. SharePoint et Alfresco sont des plates-formes sur lesquelles vous pouvez faire beaucoup de personnalisation. Même les utiliser signifie donc que vous construisez quelque chose.

  2. SharePoint stocke les blobs dans la base de données par défaut, , mais dispose de moyens pour les placer sur un système de fichiers

  3. Si vous le réalisez vous-même, prenez en charge les extensions de page de garde que les applications Office utilisent pour communiquer avec SharePoint et Alfresco, et servez les documents avec les en-têtes appropriés qui indiquent à IE de démarrer l'application. De cette manière, vous obtenez la même intégration aux applications Office que celle de SharePoint (les utilisateurs adorent cette fonctionnalité) - il ne s'agit que d'un simple protocole HTTP

  4. Si vous utilisez SharePoint, mon entreprise sera un prévisualiseur de document gratuit pouvant afficher les fichiers PDF et sera bientôt disponible. avoir des documents Office. Nous vendons la technologie sous-jacente, mais il s’agit uniquement de Windows.

  5. J'adore Django et je l'utilise pour tous les projets personnels, mais je pense vraiment que .NET et Java auront davantage de support tiers pour les choses dont vous avez besoin, et une grande partie de votre code sera portable à SharePoint ou Alfresco si vous décidez d’y aller plus tard.

MODIFIER : plus d'informations sur le n ° 3 à la demande

http://blogs.msdn.com/mikefitz /archive/2005/03/14/395112.aspx http://blogs.msdn.com/stcheng/archive/2008/12/17/wss-use-rpc-protocol-toaccess- wss-v3-site.aspx Documents officiels: http://msdn.microsoft.com/en-us/library/ms442469. aspx

Alfresco devrait être une excellente solution ici. Il répond à chacune de vos exigences, à l’exception du gouvernement.

Mais si vous construisez "à partir de zéro", prenez peut-être les idées, au moins?

Stockage: le contenu du fichier est enregistré sur le système de fichiers. Facile à gérer, stocker, sauvegarder et tout. Les fichiers ne conservent pas les noms, cependant, leur contenu est enregistré au format binaire et le fichier est nommé hachage (je suppose que le contenu est haché?)

Métadonnées: est placé dans la base de données. Rapide d'accès, de modification, de mise à jour et de contenu. Chaque nœud a des propriétés - nom, titre, description, dates, informations d'audit, quels que soient vos besoins. Ce ne sont que des informations et tout est enregistré dans les "propriétés". table.

Recherche: Alfresco utilise Solr pour la recherche, il s’agissait de Lucene. J'ai eu de très grosses installations, et si vous mettez Lucene Index sur le SSD, ça va vite. (lucene est rapide quand même). Il indexe à la fois le contenu et les propriétés du fichier - vous accédez donc rapidement à l'ID du nœud.

Alfresco a implémenté CIFS, ainsi que webdav, ftp et ainsi de suite. Le fait est que vous pouvez simplement le monter sur le bureau des utilisateurs en tant que dossiers ou disques.

L’interface Web existe, le rapport de gestion central est présent, tous les critères requis. Et comme il est open source, vous pouvez en obtenir une partie et l’utiliser dans votre projet. Bien qu’il soit préférable de prendre Alfresco Community et de contribuer un peu en arrière si vous vous sentez bien.

Essayez-vous de construire le système de gestion de documents? Alfresco & amp; SharePoint? Alfresco & amp; SharePoint sont les solutions de gestion de projet et non les solutions de gestion de documents. Alfresco est une sorte de solution DMS mais ce n’est pas une bonne chose en ce sens. Oui! Pour la solution de gestion de projet, c'est un bon logiciel.

Je vous suggère d'acheter la solution de gestion de documents, qui est une gestion légale des documents et également spécifique au gouvernement local. Il existe des fournisseurs de systèmes de gestion de documents tels que Laserfiche & amp; OnBase, leur travail est similaire à celui de Google Docs. Vous pouvez créer un compte pour chaque employé de l'entreprise ou de l'entreprise.

Oui, tous les documents sont au format MS Office, tels que Ms-Word, Ms-excel, PDF & amp; PPT

Le flux de travail avec le système de gestion des documents est très efficace et facile à gérer

Oui, en utilisant DMS, vous pouvez facilement trouver le fichier en quelques minutes (Laserfiche Software prend 10 minutes pour extraire le fichier ou le dossier). Laserfiche DMs est un logiciel d'interface Web. Vous pouvez vous connecter au logiciel et accéder facilement au fichier ou au dossier depuis différents emplacements.

Stockage

Dans le système DMS, toutes les données sont sécurisées et stockées dans un stockage en nuage. Vous pouvez facilement accéder au document simplement en vous connectant à votre compte. En cas de perte ou de déformation, vous pouvez récupérer les données perdues auprès de la société.

Métadonnées

Le système de DM est le moteur de base de données habituel, car toutes les données de l'entreprise sont régulièrement sécurisées dans le stockage en nuage

Tech

Il n’est pas nécessaire de construire quoi que ce soit; il vous suffit d'acheter le logiciel DMS. Je vous recommande le Laserfiche parce que nous utilisons leurs services

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top