Чтение .docx на C++
Вопрос
Я пытаюсь создать программу, которая читает файл .docx и публикует его содержимое в блоге/форуме для личного использования.Наконец-то я понял, как использовать libcurl (что, как я полагал), было самой сложной частью программы.Теперь мне просто нужно прочитать файл .docx, но у меня возникла проблема.Кажется, я не могу найти никакой документации о том, как это сделать.Есть идеи?
Решение
Самый простой способ сделать это — использовать Word.Имеет ограничения по лицензированию.
ТАК вопрос Создание, открытие и печать файла Word из C++ имеет несколько хороших ссылок.
Редактировать:
В соответствии с этими вопросами/ответами можно разархивировать файл Open XML и обработать файл XML напрямую:
Если вы используете .NET, есть еще вопросы (C#):
Другие советы
Если вы хотите оставаться в мире открытого исходного кода, OpenOffice 3 должен иметь возможность обрабатывать файлы .docx.Существует проект по реализации API для многих языков, я не знаю, насколько он полон и сложен.
Eсть сценарий на PHP, который может конвертировать .docx в обычный текст.Это если вас не пугает, что вся документация на русском языке).Это может быть другой вариант (запуск php-скрипта с помощью системного вызова и анализ результатов из файла)