Лучший способ экспортировать HTML в Word без установки MS Word?
Вопрос
Есть ли способ экспортировать простую HTML-страницу в Word (формат .doc, а не .docx) без установки Microsoft Word?
Решение
Если, как вы сказали, у вас есть только простые HTML-страницы, их можно открыть с помощью Word.
В противном случае есть библиотеки, которые могут это сделать, но у меня нет опыта работы с ними.
Моя последняя идея заключается в том, что если вы используете ASP.NET, попробуйте добавить application/msword
в заголовок, и вы можете сохранить его как документ Word (это не будет настоящий документ Word, а только HTML-код, переименованный в документ, чтобы его можно было открыть).
Другие советы
Существует инструмент под названием JODConverter, который подключается к открытому офису и предоставляет преобразователи форматов файлов, есть версии, доступные в виде веб-приложения (находится в tomcat), в которое вы публикуете сообщения, и инструмент командной строки.Я запустил в него html и успешно конвертировал его в .doc и pdf. Это довольно большой проект, который еще не запущен в эксплуатацию, но я думаю, что собираюсь его использовать.http://sourceforge.net/projects/jodconverter/
Существует проект с открытым исходным кодом под названием HTMLtoWord это позволяет пользователям вставлять фрагменты правильно сформированного HTML (XHTML) в документ Word как форматированный текст.
Хотя можно создать файл Microsoft Word «.doc», вероятно, было бы проще и портативнее создать файл «.rtf».
Если вы работаете на Java, вы можете конвертировать HTML в реальный контент docx с помощью кода, который я опубликовал в документ 4j 2.8.0.Я говорю «настоящий», потому что альтернативой является создание HTML-кода. altChunk, который использует Word для фактического преобразования (при первом открытии документа).
Посмотрите различные примеры с префиксом ConvertInXHTML.Процесс импорта предполагает правильно сформированный XML, поэтому вам, возможно, придется сначала его привести в порядок.
Ну, для этого есть много сторонних инструментов.Я не знаю, может ли быть что-то проще.
Примеры:
- http://htmltortf.com/
- http://www.brothersoft.com/windows-html-to-word-2008-56150.html
- http://www.eprintdriver.com/to_word/HTML_to_Word_Doc.html
Также нашел vbscribt, но я предполагаю, что для этого необходимо, чтобы у вас было установлено слово.
Я предполагаю, что из тега «C#» вы хотите добиться этого программно.
Пытаться Aspose.Words для .NET.
Если это просто HTML, все, что вам нужно сделать, это изменить расширение на .doc, и Word откроет его, как если бы это был текстовый документ.Однако, если есть изображения для включения или JavaScript для запуска, это может стать немного сложнее.
Я считаю открытый офис может как открывать файлы .html, так и создавать файлы .doc
Вы можете открыть html-файлы с помощью Либреофис Писатель.Затем вы можете экспортировать в формате PDF из меню «Файл».Также браузеры могут экспортировать HTML в файл PDF.
используйте эту ссылку для экспорта в слово, но здесь изображение не работает: