Welche Technologie wird hinter A.Nnotate.com verwendet?

https://stackoverflow.com/questions/6806947

25-10-2019
|

Frage

Ich würde gerne wissen, wie Dienste wie A.Nnotate.com, Scribd, Google Docs PDF, .DOC oder ein anderes Dokument in HTML rendern und wie funktioniert das Annotationssystem?

Lösung

A.Nnotate.com führt die serverseitige Konvertierung von PDF -Seiten in PNG -Bilder auf einer bestimmten Zoomebene unter Verwendung von XPDF durch - dies werden im Browser angezeigt.

Das Hervorhebung des Textes wird durchgeführt, indem die Textpositionen aus dem PDF extrahiert und dann eine transparente Überlagerung über den Seitenbildern mit absolut positionierten HTML -Divs auf den Wörtern hinzugefügt werden. Anmerkungen verwenden dann eine AJAX -GUI, um Notizen zum hervorgehobenen Text anzuhängen.

Andere Formate (MS -Wort, PPT usw.) werden zuerst unter Verwendung von OpenOffice in PDF konvertiert, dann in Bilder und Textüberlagerungen wie für PDFs.

Ich denke, die anderen HTML -Dokument -Sites tun etwas Ähnliches, um PDFs als HTML (dh Seitenbilder + Wortüberlagerung als transparente Divs) zu rendern - ein alternativer Trick ist, die PDF -eingebetteten Schriftarten in HTML5 -CSS -Schriftarten zu konvertieren und absolut positionierte Divs für den Text (für den Text) zu verwenden (für den Text (absolut positionierte Divisionen & extrahieren und positionieren Sie auch die Bilder).

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow