Используя C #, как я должен идти о извлечении титров субтитров и абзацев из документа DOCX

https://stackoverflow.com/questions/434203

10-07-2019
|

Вопрос

Как использовать C # для извлечения титров, титров и абзацев из документа docx.

Я думаю сделать это через VSTO, но знаю слово объектная модель. Я знаком только с объектной моделью Excel.

Стоит ли использовать подход unzip + linq to XML?

Используя VSTO, я мог бы создать надстройку, которую можно было бы использовать для редактирования приложения, в котором я буду конвертировать в и из docx.

есть ли у кого-то опыт такого рода вещей? любые выводы будут с благодарностью.

Решение

Лично я бы взял подход unzip + LINQ2XML. (Вы можете разархивировать, используя встроенную поддержку в рамках или, если вы используете старую версию, вы можете использовать zip-библиотеку, предоставленную icsharpcode.net

Я бы выбрал такой подход, потому что из-за чего-то такого простого я бы предпочел не зависит от ВСТО. Таким образом, конечному пользователю даже не нужно устанавливать Office. (И нет никаких других проблем с лицензией ... из которых я не знаю деталей).

Просто мое мнение.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow