извлечь текст из tex, удалить латексные теги

StackOverflow https://stackoverflow.com/questions/829408

  •  06-07-2019
  •  | 
  •  

Вопрос

У меня есть несколько файлов .tex, из которых я хочу получить простой текст без каких-либо латексных тегов, таких как \section{...} или ewpage.
Есть ли у кого-нибудь идеи о том, как этого добиться?У меня также есть файл .pdf, но когда я просто копирую оттуда код, некоторые слова объединяются, что очень плохо.
Есть ли какой-нибудь инструмент, который вы знаете?

Это было полезно?

Решение

detex (1) :

  

Посетите страницу OpenDetex GitHub для получения последней версии OpenDetex . Это более современная производная версия моего оригинального DeTeX.

     

Моя домашняя страница DeTeX доступна . a href = "https://www.cs.purdue.edu/homes/trinkle/detex/index-legacy.html" rel = "noreferrer"> здесь .

     

Если вы просто хотите наследие detex-2.8.tar источник, вы можете получить его здесь .

Другие советы

опендетекс доступен как для Windows, так и для Linux

скачать программу opendetex отсюда
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list

Использование:http://code.google.com/p/opendetex/wiki/Usage

извлеките его в любой каталог по вашему выбору.Скажем, вы извлекаете его в каталог «Загрузки».

создайте в нем еще один каталог с любым именем (необязательно.но хорошо, если ты творишь).скажем, имя каталога — «my_paper».Поместите свою статью в каталог «my_paper».скажем, название вашей статьи — project.tex

Пройти путь

cd ~/Downloads/opendetex

Запустите команду

detex -n my_paper/project.tex  > out.txt

общая форма

detex -n full_path_to_tex_file.tex > output_text_file.txt
Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top