Pergunta

Existe uma maneira de exportar uma página HTML simples para o Word (formato .doc, não .docx) sem ter o Microsoft Word instalado?

Foi útil?

Solução

Se você tiver apenas páginas HTML simples como disse, elas podem ser abertas com o Word.

Caso contrário, existem algumas bibliotecas que podem fazer isso, mas não tenho experiência com elas.

Minha última ideia é que se você estiver usando ASP.NET, tente adicionar application/msword ao cabeçalho e você pode salvá-lo como um documento do Word (não será um documento real do Word, apenas um HTML renomeado para doc para poder abrir).

Outras dicas

Existe uma ferramenta chamada JODConverter que se conecta ao open office para expor seus conversores de formato de arquivo, há versões disponíveis como um webapp (fica no Tomcat) no qual você posta e uma ferramenta de linha de comando.Tenho disparado html nele e convertido para .doc e pdf com sucesso. É um projeto bastante grande, ainda não foi lançado, mas acho que vou usá-lo.http://sourceforge.net/projects/jodconverter/

Existe um projeto de código aberto chamado HTML para Word que permite aos usuários inserir fragmentos de HTML bem formado (XHTML) em um documento do Word como texto formatado.

Documentação HTMLtoWord

Embora seja possível criar um arquivo ".doc" do Microsoft Word, provavelmente seria mais fácil e portátil criar um arquivo ".rtf".

Se você estiver trabalhando em Java, poderá converter HTML em conteúdo docx real com o código que lancei em docx4j 2.8.0.Digo "real", porque a alternativa é criar um HTML altChunk, que depende do Word para fazer a conversão real (quando o documento é aberto pela primeira vez).

Veja os vários amostras prefixadas ConvertInXHTML.O processo de importação espera um XML bem formado, então talvez seja necessário organizá-lo primeiro.

Bem, existem muitas ferramentas de terceiros para isso.Não sei se fica mais simples do que isso.

Exemplos:

Também encontrei um vbscript, mas acho que isso requer que você tenha o Word instalado.

Presumo pela tag "C#" que você deseja conseguir isso programaticamente.

Tentar Aspose.Words para .NET.

Se for apenas HTML, tudo que você precisa fazer é alterar a extensão para .doc e o Word irá abri-lo como se fosse um documento do Word.Porém, se houver imagens para incluir ou javascript para executar, pode ficar um pouco mais complicado.

eu acredito escritório aberto pode abrir arquivos .html e criar arquivos .doc

Você pode abrir arquivos HTML com Libreoffice Escritor.Então você pode exportar como PDF no menu Arquivo.Além disso, os navegadores podem exportar HTML como um arquivo PDF.

use este link para exportar para word, mas aqui a imagem não funciona:

http://www.jqueryscript.net/other/Export-Html-To-Word-Document-With-Images-Using-jQuery-Word-Export-Plugin.html

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top