a.nnotate.comの背後にはどのテクノロジーが使用されていますか？

https://stackoverflow.com/questions/6806947

25-10-2019
|

質問

a.nnotate.com、scribd、googleドキュメントのようなサービスは、pdf、.doc、またはその他のドキュメントをHTMLにどのようにレンダリングし、アノテーションシステムはどのように機能しますか？

解決

a.nnotate.comは、XPDFを使用して特定のズームレベルでPDFページをPNG画像にサーバー側に変換します - これらはブラウザに表示されるものです。

テキストの強調表示は、PDFからテキスト位置を抽出し、ページ画像の上に透明なオーバーレイを追加して、単語の上に絶対に配置されたHTML Divを追加することで行われます。注釈は、Ajax GUIを使用して、強調表示されたテキストにノートを添付します。

他の形式（MS Word、PPTなど）は、最初にOpenOfficeを使用してPDFに変換され、次にPDFSのように画像とテキストオーバーレイに変換されます。

他のHTMLドキュメントサイトは、PDFをHTMLとしてレンダリングするために同様のことを行うと思います（つまり、ページ画像 +ワードオーバーレイとして透明Divとして） - 代替トリックは、PDF埋め込みフォントをHTML5 CSSフォントに変換し、テキストに絶対に配置されたDIVを使用することです（＆画像も抽出して配置します）。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow