C'è qualche libreria Java (forse POI?), Che permette di unire i file docx? [chiuso]
Domanda
Ho bisogno di scrivere un'applicazione Java che può unire file docx. Qualche suggerimento?
Soluzione
Le seguenti API Java sono a disposizione per gestire documenti MS Word OpenXML con Java:
C'è stato un altro, ma non ricordo più il nome.
Per quanto la vostra esigenza funzionale: la fusione di due documenti è tecnicamente difficile da raggiungere il risultato come utente finale si aspetterebbe. La maggior parte delle API di non permetterlo. Avrete bisogno di estrarre le informazioni desiderate da due documenti e quindi creare un nuovo documento basato su queste informazioni da soli.
Altri suggerimenti
Con POI la mia soluzione è:
public static void merge(InputStream src1, InputStream src2, OutputStream dest) throws Exception {
OPCPackage src1Package = OPCPackage.open(src1);
OPCPackage src2Package = OPCPackage.open(src2);
XWPFDocument src1Document = new XWPFDocument(src1Package);
CTBody src1Body = src1Document.getDocument().getBody();
XWPFDocument src2Document = new XWPFDocument(src2Package);
CTBody src2Body = src2Document.getDocument().getBody();
appendBody(src1Body, src2Body);
src1Document.write(dest);
}
private static void appendBody(CTBody src, CTBody append) throws Exception {
XmlOptions optionsOuter = new XmlOptions();
optionsOuter.setSaveOuter();
String appendString = append.xmlText(optionsOuter);
String srcString = src.xmlText();
String prefix = srcString.substring(0,srcString.indexOf(">")+1);
String mainPart = srcString.substring(srcString.indexOf(">")+1,srcString.lastIndexOf("<"));
String sufix = srcString.substring( srcString.lastIndexOf("<") );
String addPart = appendString.substring(appendString.indexOf(">") + 1, appendString.lastIndexOf("<"));
CTBody makeBody = CTBody.Factory.parse(prefix+mainPart+addPart+sufix);
src.set(makeBody);
}
Con Docx4j la mia soluzione è:
public class MergeDocx {
private static long chunk = 0;
private static final String CONTENT_TYPE = "application/vnd.openxmlformats-officedocument.wordprocessingml.document";
public void mergeDocx(InputStream s1, InputStream s2, OutputStream os) throws Exception {
WordprocessingMLPackage target = WordprocessingMLPackage.load(s1);
insertDocx(target.getMainDocumentPart(), IOUtils.toByteArray(s2));
SaveToZipFile saver = new SaveToZipFile(target);
saver.save(os);
}
private static void insertDocx(MainDocumentPart main, byte[] bytes) throws Exception {
AlternativeFormatInputPart afiPart = new AlternativeFormatInputPart(new PartName("/part" + (chunk++) + ".docx"));
afiPart.setContentType(new ContentType(CONTENT_TYPE));
afiPart.setBinaryData(bytes);
Relationship altChunkRel = main.addTargetPart(afiPart);
CTAltChunk chunk = Context.getWmlObjectFactory().createCTAltChunk();
chunk.setId(altChunkRel.getId());
main.addObject(chunk);
}
}
Sembra certo, come POI può lavorare con i file docx
. Stai cercando di capire come unire loro?
Come estrarre testo normale da un file DOCX utilizzando il nuovo supporto OOXML in Apache POI 3.5?
Aspose API è il migliore finora per unire file word doc o docx finora, ma che non è libero o open source, se avete bisogno di un libero e aperto strumenti di origine ci sono un paio di API è possibile scegliere, si possono trovare un commento su di loro qui,
http://www.esupu.com/open -source-ufficio-documento-java-api-recensione /