Вопрос

Я пытаюсь создать программу, которая читает файл .docx и публикует его содержимое в блоге/форуме для личного использования.Наконец-то я понял, как использовать libcurl (что, как я полагал), было самой сложной частью программы.Теперь мне просто нужно прочитать файл .docx, но у меня возникла проблема.Кажется, я не могу найти никакой документации о том, как это сделать.Есть идеи?

Это было полезно?

Решение

Самый простой способ сделать это — использовать Word.Имеет ограничения по лицензированию.

ТАК вопрос Создание, открытие и печать файла Word из C++ имеет несколько хороших ссылок.

Редактировать:

В соответствии с этими вопросами/ответами можно разархивировать файл Open XML и обработать файл XML напрямую:

Если вы используете .NET, есть еще вопросы (C#):

Другие советы

Если вы хотите оставаться в мире открытого исходного кода, OpenOffice 3 должен иметь возможность обрабатывать файлы .docx.Существует проект по реализации API для многих языков, я не знаю, насколько он полон и сложен.

Eсть сценарий на PHP, который может конвертировать .docx в обычный текст.Это если вас не пугает, что вся документация на русском языке).Это может быть другой вариант (запуск php-скрипта с помощью системного вызова и анализ результатов из файла)

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top