Лучший способ экспортировать HTML в Word без установки MS Word?

StackOverflow https://stackoverflow.com/questions/32151

  •  09-06-2019
  •  | 
  •  

Вопрос

Есть ли способ экспортировать простую HTML-страницу в Word (формат .doc, а не .docx) без установки Microsoft Word?

Это было полезно?

Решение

Если, как вы сказали, у вас есть только простые HTML-страницы, их можно открыть с помощью Word.

В противном случае есть библиотеки, которые могут это сделать, но у меня нет опыта работы с ними.

Моя последняя идея заключается в том, что если вы используете ASP.NET, попробуйте добавить application/msword в заголовок, и вы можете сохранить его как документ Word (это не будет настоящий документ Word, а только HTML-код, переименованный в документ, чтобы его можно было открыть).

Другие советы

Существует инструмент под названием JODConverter, который подключается к открытому офису и предоставляет преобразователи форматов файлов, есть версии, доступные в виде веб-приложения (находится в tomcat), в которое вы публикуете сообщения, и инструмент командной строки.Я запустил в него html и успешно конвертировал его в .doc и pdf. Это довольно большой проект, который еще не запущен в эксплуатацию, но я думаю, что собираюсь его использовать.http://sourceforge.net/projects/jodconverter/

Существует проект с открытым исходным кодом под названием HTMLtoWord это позволяет пользователям вставлять фрагменты правильно сформированного HTML (XHTML) в документ Word как форматированный текст.

HTMLtoWord документация

Хотя можно создать файл Microsoft Word «.doc», вероятно, было бы проще и портативнее создать файл «.rtf».

Если вы работаете на Java, вы можете конвертировать HTML в реальный контент docx с помощью кода, который я опубликовал в документ 4j 2.8.0.Я говорю «настоящий», потому что альтернативой является создание HTML-кода. altChunk, который использует Word для фактического преобразования (при первом открытии документа).

Посмотрите различные примеры с префиксом ConvertInXHTML.Процесс импорта предполагает правильно сформированный XML, поэтому вам, возможно, придется сначала его привести в порядок.

Ну, для этого есть много сторонних инструментов.Я не знаю, может ли быть что-то проще.

Примеры:

Также нашел vbscribt, но я предполагаю, что для этого необходимо, чтобы у вас было установлено слово.

Я предполагаю, что из тега «C#» вы хотите добиться этого программно.

Пытаться Aspose.Words для .NET.

Если это просто HTML, все, что вам нужно сделать, это изменить расширение на .doc, и Word откроет его, как если бы это был текстовый документ.Однако, если есть изображения для включения или JavaScript для запуска, это может стать немного сложнее.

Я считаю открытый офис может как открывать файлы .html, так и создавать файлы .doc

Вы можете открыть html-файлы с помощью Либреофис Писатель.Затем вы можете экспортировать в формате PDF из меню «Файл».Также браузеры могут экспортировать HTML в файл PDF.

используйте эту ссылку для экспорта в слово, но здесь изображение не работает:

http://www.jqueryscript.net/other/Export-Html-To-Word-Document-With-Images-Using-jQuery-Word-Export-Plugin.html

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top