Domanda

Un cliente ha bisogno di un sistema di gestione dei documenti e sto costruendo informazioni su questo.

So di sharepoint & amp; al di fuori, ma in questo caso sto valutando le informazioni necessarie per costruirlo da zero, quindi per favore astieniti a suggerire l'uso di uno di questi (stiamo facendo la valutazione separatamente, si tratta solo di sviluppare, non implementare un esistente soluzione).

Questi sono i requisiti:

  • Avere un requisito molto specifico dalla gestione legale dei documenti che è specifico per il nostro governo locale, ma a parte questo:
  • Un'operazione simile a Google Documenti dal punto di vista dell'utente finale
  • Hai bisogno di informazioni sul negozio da oltre 200 utenti finali (AGGIORNAMENTO: sono davvero +700 utenti finali)
  • Principalmente documenti per ufficio, pdf, testo. Ho già l'estrazione di testo semplice da questi file binari.
  • Nessuna wiki, nessuna creazione di portale, flusso di lavoro a malapena ma molto semplice, è solo una gestione dei file
  • Repository centrale, condivisione in tutta l'azienda, integrato con Active Directory
  • Ricerca veloce
  • Integrazione desktop trasparente
  • Interfaccia Web
  • Multiplataform, se possibile

Quindi, queste sono le cose che ho in testa:

  • Archiviazione: so che sharepoint salva tutto nel db (anche Alfresco?). È un incubo, IMHO. Preferisco mettere i metadati in un DB e i file su disco.

Sto pensando di forzare l'uso di ZFS in questo caso & amp; sfruttare le loro capacità per versioning, snapshot e amp; scaling. O forse usa git come backend di archiviazione (git funzionerà bene?)

Quindi, dove posso sapere di più su come gestire un grande pool di documenti, in ZFS o in qualsiasi normale file system? Ad esempio, come layout la struttura delle cartelle per gestire facilmente & amp; risposte rapide, backup semplice, ecc.

  • Metadati: penso in un normale DB qui, ma mi chiedo se abbia più merito a salvare tutto in Lucene (ho una certa esperienza su Lucene, ma preoccupati perché Lucene non può essere federato, giusto?).

Se uso un motore di ricerca come database di metadati posso risparmiare un po 'di lavoro (non ho bisogno di un secondo passaggio per l'indicizzazione), ma un normale motore di database è più standard.

  • Tecnologia: probabilmente lo costruirò in Django, PyLucene, Postgress e farò l'integrazione della shell per Windows (non ho problemi per farlo).

Apprezzerò qualsiasi suggerimento o informazione su come implementare correttamente questa soluzione.

È stato utile?

Soluzione

Personalmente trovo il " simile a Google Documenti " e "integrazione desktop trasparente" requisiti un po 'vaghi, IMHO. Ma a giudicare dalla domanda sei più preoccupato per il backend e l'archiviazione dei documenti e stai cercando di più sull'uso di uno stack più open source (con l'integrazione con AD)?

In ogni caso, personalmente sto usando KnowledgeTree come nostro sistema di gestione dei documenti e la loro implementazione è che tutti i file risiede in una directory di file e il database terrà traccia del percorso, dei metadati corrispondenti, dei registri di accesso e delle informazioni sulla versione. Fondamentalmente hanno mantenuto diverse versioni dello stesso file se un documento è stato aggiornato - che penso sia stata un'idea abbastanza equa per l'implementazione saggia considerando che i documenti di Microsoft Office sono per lo più binari (fino al 2003).

Potresti voler capire quanti documenti hanno attualmente e quanti documenti si aspettano di confluire in questo sistema su base giornaliera. (O da un altro punto di vista, il tipo di documenti che stanno pianificando di archiviare in genere ti darebbe suggerimenti su quale tipo di carico dovrebbe gestire il tuo server)

La mia ipotesi è che molto probabilmente potresti cavartela con l'installazione di file system locali e database che memorizzano roba di metadati a meno che tu non sia sicuro che il sistema gestisca un carico enorme di documenti su base giornaliera (immagina di essere Flickr per i documenti;)).

Altri suggerimenti

  1. SharePoint e Alfresco sono piattaforme in cui puoi fare un bel po 'di personalizzazione, quindi anche usarle significa davvero che stai costruendo qualcosa.

  2. SharePoint archivia i BLOB nel DB per impostazione predefinita, ma ha dei modi per inserirli in un filesystem

  3. Se ce la fai tu stesso, supporta le estensioni di frontpage utilizzate dalle app di Office per comunicare con SharePoint e Alfresco e pubblica i documenti con le intestazioni giuste che indicano a IE di avviare l'app. In questo modo ottieni la stessa integrazione con le app di Office di SharePoint (gli utenti adorano davvero questa funzionalità): è solo un semplice protocollo HTTP

  4. Se vai con SharePoint, la mia azienda come visualizzatore di documenti gratuito che può visualizzare PDF e presto lo farà avere documenti di Office. Vendiamo la tecnologia di base, ma è solo Windows.

  5. Adoro Django e lo uso per tutti i progetti personali, ma penso davvero che .NET e Java avranno più supporto di terze parti per le cose di cui hai bisogno e gran parte del tuo codice sarà portabile su SharePoint o Alfresco se decidi di procedere in questo modo in seguito.

MODIFICA : ulteriori informazioni su # 3 come richiesto

http://blogs.msdn.com/mikefitz /archive/2005/03/14/395112.aspx http://blogs.msdn.com/stcheng/archive/2008/12/17/wss-use-rpc-protocol-to-access- WSS-v3-site.aspx Documenti ufficiali: http://msdn.microsoft.com/en-us/library/ms442469. aspx

Alfresco dovrebbe essere un'ottima soluzione qui. Supporta ognuno dei tuoi elenchi di requisiti ad eccezione del governo.

Ma se stai costruendo " da zero " forse potresti prendere le idee da esso, almeno?

Archiviazione: il contenuto del file viene salvato sul filesystem. Facile da gestire, archiviare, eseguire il backup e altro. Tuttavia, i file non mantengono i nomi, solo il loro contenuto viene salvato in formato binario e il file viene denominato come hash (immagino l'hash del contenuto?)

Metadati: viene inserito nel database. Accesso rapido, modifica, aggiornamento e altro. Ogni nodo ha proprietà: sono nome, titolo, descrizione, date, informazioni di controllo, qualunque cosa tu abbia bisogno. Sono solo informazioni ed è tutto salvato nelle " proprietà " tavolo.

Ricerca: Alfresco usa Solr per la ricerca, era Lucene. Avevo installazioni piuttosto grandi e se hai messo l'indice lucene sull'SSD, è velocissimo. (lucene è comunque veloce). Indica sia il contenuto che le proprietà del file, in modo da raggiungere l'ID nodo molto velocemente.

Alfresco ha implementato CIFS, nonché webdav, ftp e quant'altro. Il punto è che puoi semplicemente montarlo sui desktop degli utenti come cartelle o dischi.

L'interfaccia Web è lì, il repo centrale mgmt è lì, tutti i req. E dal momento che è open source, potresti ottenerne una parte e utilizzarla nel tuo progetto. Anche se sarebbe molto meglio prendere Alfresco Community e contribuire un po 'indietro se ti senti bene.

Stai cercando di costruire il sistema di gestione dei documenti? Alfresco & amp; SharePoint? Alfresco & amp; SharePoint sono le soluzioni di gestione dei progetti non le soluzioni di gestione dei documenti. Alfresco è una sorta di soluzione DMS, ma non è il massimo. Sì! Per la soluzione di gestione del progetto, è un buon software.

Ti suggerirò di acquistare la soluzione di gestione dei documenti che è la gestione legale dei documenti e anche specifica per il governo locale. Ci sono alcuni fornitori di sistemi di gestione dei documenti come Laserfiche & amp; OnBase, il loro lavoro è simile a Google Docs. Puoi creare un account per ogni dipendente dell'azienda o dell'azienda.

Sì, tutti i documenti sono in formato MS Office come Ms-Word, Ms-excel, PDF & amp; PPT

Il flusso di lavoro con il sistema di gestione dei documenti è molto efficiente e facile da gestire

Sì, utilizzando DMS è possibile trovare facilmente il file in pochi minuti (il software Laserfiche richiede 10 minuti per estrarre il file o la cartella) Laserfiche DMs è un software di interfaccia web. Puoi accedere al software e raggiungere facilmente il file o la cartella da diverse posizioni

Archiviazione

Nel sistema DMS tutti i dati sono protetti e archiviati in un archivio cloud. Puoi facilmente raggiungere il documento semplicemente accedendo al tuo account. In caso di smarrimento o perdita di forma, è possibile ottenere i dati persi dalla società

Meta data

Il sistema DMs è il normale motore di database in quanto tutti i dati aziendali sono protetti regolarmente nel cloud storage

Tecnologia

Non è necessario costruire nulla; devi solo acquistare il software DMS. Ti consiglio Laserfiche perché stiamo usando i loro servizi

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top