Frage

Ich weiß, wie ein PDF aus LaTeX machen. Gibt es eine Möglichkeit, den LaTeX-Code aus einem PDF zu extrahieren ich zuvor erstellt haben? Wie wäre es, wenn jemand schickt mir eine PDF und Ich mag die Formatierung. Kann ich die LaTeX daraus extrahieren?

War es hilfreich?

Lösung

LaTeX hat keine Eins-zu-Eins-Konvertierung in PDF. In Bezug auf Ihre erste Frage, ich glaube, eine solche Umwandlung technisch möglich sein kann, aber ich glaube nicht, eine Anwendung so noch zu tun gibt. Ähnlich wie Assembler wieder in Hochsprache dekompiliert werden kann, gibt es wahrscheinlich eine Möglichkeit, es zu tun. Aber - ist ein pdf enthalten alle Materie von Arten von Daten erlaubt - AutoCAD Zeichnungen, JPEG-Grafiken, Schriftdateien, Formulare, digitale Signaturen etc. LaTeX keine Ahnung hat, was diese Dinge sind. So in der Antwort auf die zweite Frage ist nicht -. Es gibt keine Möglichkeit, gleichwertige LaTeX aus jedem PDF-Dokument zu extrahieren

Andere Tipps

Es ist ein Tool, das PDF-Dateien wie ein OCR liest und versucht, den Latex-Code zu erstellen. Es ist fast perfekt und "Infty Reader" genannt! Da Latex ziemlich dehnbar ist glaube ich nicht, es ist alles das ordentlich Formate richtig machen.

Es ist nur möglich, wenn Sie die Quelle des Dokuments in die PDF-Datei einbetten. Sehen Sie sich das AttachFile Paket, dies zu tun.

Kurzversion:. Nein

Lange Version: Es ist ein viel wie decompiling. Sie technisch können, aber es wäre viel zu raten und Heuristiken beinhaltet

Ich bin nicht vertraut mit den PDF-Innereien, aber es wird wahrscheinlich Satz Schriftarten / Größen / Position direkt, sondern ein Format zu definieren und sie zu Kopf- und solche, wie in LaTeX Anwendung.

Es ist möglich, Ihre PDF zu HTML und Ihre HTML-TEX zu konvertieren mit pdftohtml und gnuhtml2latex.

In der Tat tun Sie PDF LaTeX Umwandlung in 2 Schritten. Das Ergebnis ist immer noch wie „macht eine Kuh aus einem Hamburger“, aber in Kombination mit einigen Bereinigungs Skripten kann das Ergebnis recht gut.

Der Blog-Eintrag „ Rudimentär PDF LaTeX Umwandlung in Linux “auf GlobalBlindSpot hat ein Beispiel Bash-Skript, das eine PDF in eine .tex-Datei konvertiert und dass man zu einer PDF-Datei erneut.

Siehe meine Antwort auf ähnliche Frage (, wie eine drehen DVI-auf-tex? )

Zur Verstärkung - es gibt keine Notwendigkeit für Zeichen in Lesereihenfolge zu sein (ich habe PDFs gefunden, wo ein Teil des sdrawkcab sdaer txet (und auf den Koordinaten beruht) Das ist sehr schwer zu rekonstruieren, wie es auf Font-Metriken verlassen können. . Welche das erschreckende ASCII86-Protokoll verwenden kann.

Der beste Weg für Data-Mining von PDF-Dateien (aufgrund seines komplizierten Format) ist sie mit Adobe Illustrator zu öffnen. Dann die pdf-Datei konvertieren Datei SVG und SVG-Parser-Bibliothek verwenden, um auf sich selbst etwas heikel Code zu schreiben.

Eine effiziente svg Parser lib ist Batik

(Für Linux ist es ein ganz wenig komplex für pdf zu SVG-Umwandlung: calcmaster.net/personal_projects/pdf2svg /)

PS Ich habe da eine Menge versucht, eine Lösung zu Ihrem zweiten Teil Ihrer Frage zu finden aber ich habe in Bücher heraus solche „Daten visualisieren, Ben Fry, O'Reilly“ dass pdf besonders pdf Adobe zu komplex ist zu analysieren, so dass anstelle eines svg Parser lib verwenden.

Inkscape können PDF-Dateien importieren und dann als „LaTeX mit PSTricks Makros“ speichern, die durch die Einbettung von Postscript in die LaTeX Quelle im Wesentlichen funktioniert. Es ist mehr Mühe als sein Wert, und die resultierende hat Latex Quelle vorverarbeitet werden, bevor er ausgegeben als PDF kann wieder.

das Gegenteil von dem, was Sie wollen, was ich vermute, ich ist für -

Wie auch immer, sogar mit einigen hypothetischen PDF LaTeX-Compiler, im besten Fall würden Sie etwas, wo die Position und Größe jedes Zeichen oder Wort wird separat angegeben erhalten ein Nenner eine Hälfte einer Fraktion zu sein, anstatt eine Zahl unterhalb einer horizontalen Linie.

Es kann mit Arbeit texmacs , die einen Import von PDF-Dateien enthält.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top