извлечь текст из tex, удалить латексные теги
-
06-07-2019 - |
Вопрос
У меня есть несколько файлов .tex, из которых я хочу получить простой текст без каких-либо латексных тегов, таких как \section{...} или
ewpage.
Есть ли у кого-нибудь идеи о том, как этого добиться?У меня также есть файл .pdf, но когда я просто копирую оттуда код, некоторые слова объединяются, что очень плохо.
Есть ли какой-нибудь инструмент, который вы знаете?
Решение
Посетите страницу OpenDetex GitHub для получения последней версии OpenDetex . Это более современная производная версия моего оригинального DeTeX.
Моя домашняя страница DeTeX доступна . a href = "https://www.cs.purdue.edu/homes/trinkle/detex/index-legacy.html" rel = "noreferrer"> здесь .
Если вы просто хотите наследие detex-2.8.tar источник, вы можете получить его здесь . Р>
Другие советы
опендетекс доступен как для Windows, так и для Linux
скачать программу opendetex отсюда
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list
Использование:http://code.google.com/p/opendetex/wiki/Usage
извлеките его в любой каталог по вашему выбору.Скажем, вы извлекаете его в каталог «Загрузки».
создайте в нем еще один каталог с любым именем (необязательно.но хорошо, если ты творишь).скажем, имя каталога — «my_paper».Поместите свою статью в каталог «my_paper».скажем, название вашей статьи — project.tex
Пройти путь
cd ~/Downloads/opendetex
Запустите команду
detex -n my_paper/project.tex > out.txt
общая форма
detex -n full_path_to_tex_file.tex > output_text_file.txt