質問

a.nnotate.com、scribd、googleドキュメントのようなサービスは、pdf、.doc、またはその他のドキュメントをHTMLにどのようにレンダリングし、アノテーションシステムはどのように機能しますか?

役に立ちましたか?

解決

a.nnotate.comは、XPDFを使用して特定のズームレベルでPDFページをPNG画像にサーバー側に変換します - これらはブラウザに表示されるものです。

テキストの強調表示は、PDFからテキスト位置を抽出し、ページ画像の上に透明なオーバーレイを追加して、単語の上に絶対に配置されたHTML Divを追加することで行われます。注釈は、Ajax GUIを使用して、強調表示されたテキストにノートを添付します。

他の形式(MS Word、PPTなど)は、最初にOpenOfficeを使用してPDFに変換され、次にPDFSのように画像とテキストオーバーレイに変換されます。

他のHTMLドキュメントサイトは、PDFをHTMLとしてレンダリングするために同様のことを行うと思います(つまり、ページ画像 +ワードオーバーレイとして透明Divとして) - 代替トリックは、PDF埋め込みフォントをHTML5 CSSフォントに変換し、テキストに絶対に配置されたDIVを使用することです( &画像も抽出して配置します)。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top