Domanda

Scenario:
Ho un documento che ho creato utilizzando LaTeX (il mio curriculum in questo caso), è la compilazione in pdflatex correttamente e l'output esattamente quello che mi piacerebbe. Ora ho bisogno lo stesso documento da convertire in pianura vecchio ASCII.

Esempio:
Ho visto questo fatto (almeno una volta) qui , dove l'autore ha un PDF e un versione ASCII che corrisponde alla versione PDF in quasi ogni modo, inclusi i margini, la spaziatura e punti elenco.

Mi rendo conto che questo tipo di conversione non può essere esatto a causa delle limitazioni nel formato ASCII, ma una buona approssimazione sembra possibile in base a quello che ho trovato finora. Qual è il processo per fare questo?

È stato utile?

Soluzione

CatDVI può convertire DVI in testo e tenta di conservare la formattazione.

Altri suggerimenti

Opendetex è disponibile sia per Windows e Linux (compila bene su un Mac pure). Esso può essere scaricato dal https://github.com/pkubowicz/opendetex

Utilizzo:

  

detex project

     

apre project.tex, legge tutti i file inclusi utilizzando \ include o   \ Includeonly comandi, uscite risultante testo standard output.

     

detex -n project > out.txt

     

apre project.tex, non segue \ includere o comandi \ includeonly,   uscite risultanti testo out.txt

     

detex --help

     

mostra piena help

Estrai a qualsiasi directory a scelta. Diciamo che è stato estratto nella directory di download.

Creare un altro elenco di qualsiasi nome a quello (questo è facoltativo ma consigliato). Diciamo che il nome della directory è “my_paper”. Metti la tua carta nella directory “my_paper”. Si supponga il tuo nome della carta è project.tex.

Passare al percorso

    cd ~/Downloads/opendetex

Eseguire il comando

    detex my_paper/project.tex  > out.txt

forma generica

    detex -n full_path_to_tex_file.tex > output_text_file.txt

È possibile provare alcuni dei programmi proposti qui:

TeX ad ASCII

Si può anche provare Pandoc , si può trasformare in lattice per molti altri formati. Suggerisco di leggere la sua documentazione, per ci possono essere alcuni casi difficili che è necessario passare alcuni argomenti da trattare.

Un'altra opzione è quella di utilizzare htlatex per creare una pagina web da le sorgenti LaTeX, quindi utilizzare link da convertire in testo normale. Ho usato la linea di comando

links -dump -no-numbering -no-references input.html > output.txt

in passato che ha dato un piuttosto bel risultato. Ovviamente questo piuttosto corrisponde alla vista del rendering HTML rispetto al PDF originale, quindi forse non è esattamente ciò che si desidera.

Se si utilizza pdflatex, probabilmente non si vuole pasticciare con le opzioni del pacchetto per passare alla latex per generare una DVI.

Invece, prendere il vostro file PDF e convertire che, invece. Questo ha lavorato per il mio CV / resume fatto con il pacchetto Curve:

pdftotext  -layout MyResume.pdf

Si noti la bandiera -layout.

La mia solita strategia è quella di utilizzare hyperlatex per trasformarlo in una pagina web, e quindi far fronte e pasta da un browser web. Trovo che questo dà il meglio di formattazione.

Di solito poi devono passare attraverso e correggere manualmente alcuni line-wrapping ...

Prova i passi qui: http://zanedp.livejournal.com/201222.html

Ecco una sequenza che converte il mio file LaTeX in testo semplice:

$ latex file.tex
$ catdvi -e 1 -U file.dvi | sed -re "s/\[U\+2022\]/*/g" | sed -re "s/([^^[:space:]])\s+/\1 /g" > file.txt

L'opzione -e 1 a catdvi dice di ASCII in uscita. Se si usa 0 invece di 1, il risultato sarà Unicode. Unicode includerà tutti i caratteri speciali come proiettili, trattini lunghi, e le lettere greche. Inoltre include legature per alcune combinazioni di lettere come "fi" e "fl". Non è possibile, come questo. Quindi, utilizzare -e 1 posto. Utilizzare l'opzione -U per dirgli di stampare il valore Unicode per caratteri sconosciuti in modo che si possono trovare e sostituire facilmente.

La seconda parte del comando trova la stringa [U + 2022] che viene utilizzato per designare caratteri di punto (•) e li sostituisce con un asterisco (*).

La terza parte mangia tutto lo spazio bianco in più catdvi gettato per rendere il testo completo giustificato preservando gli spazi all'inizio di linee (indentazione).

Dopo aver eseguito questi comandi, si sarebbe saggio cercare il file .txt per la stringa [U + per assicurarsi che non caratteri Unicode che non possono essere mappati a ASCII sono stati lasciati alle spalle e correggerli.

Quando ho avuto bisogno per ottenere il testo in chiaro dal mio file TEX per l'indicizzazione e la ricerca, ho trovato LaTeX2RTF per essere una buona soluzione - ha un di installazione e interfaccia grafica per le finestre , e ha prodotto un file RTF delle mie pagine tesi 50 che ho potuto aprire in Word.

La soluzione che funziona meglio per me è il seguente. Supponendo di avere il nome del documento lattice (senza estensione) memorizzato nella ${BASENAME} si applicano questi 3 passi:

htlatex ${BASENAME}.tex

iconv -f iso-8859-1 -t utf-8 ${BASENAME}.html > ${BASENAME}-utf8.html

html2markdown ${BASENAME}-utf8.html > ${BASENAME}.txt

A quanto pare, è necessario disporre di tex4ht e python-html2text installati.

Ho provato LyX e funziona piuttosto bene. L'unica sfumatura è che se si dispone di un file di TeX che viene compresi gli altri file TeX, è necessario esportare tutti separatamente, a meno che non mi manca qualcosa.

Pandoc consente di convertire i file da un formato ad un altro Utilizzare seguente comando Pandoc:

pandoc -s /path/to/foobar.tex -o foobar.txt

Se si desidera che le linee di rompere a un certo uso della colonna bandiera --column. Utilizzare --columns 10000 per la linea non-breaking.

È possibile convertire -o foobar.txt a un certo numero di altri formati come Markdown (.MD) ecc Se si don' t specificare il -o foobar.txt, Pandoc stamperà il codice html che si può rendere in qualsiasi strumento online.

Per installare Pandoc seguire questa documentazione ufficiale

è possibile importare in LyX e utilizzare l'esportazione di LyX alla funzione di testo.

tipo di sciocco, se non si usa LyX ma se già avete, molto veloce e facile soluzione. Buon risultato per me, anche se ad essere onesti i miei file sono abbastanza semplici. Non sono sicuro di come i file più elaborati vengono convertiti.

Emacs ha la iso-iso2tex comandi e iso-tex2iso che funziona molto bene, solo che non converte i comandi singoli come \OE a Œ.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top