A.nnotate.com背后使用了哪些技术？

题

我想知道诸如a.nnotate.com，scribd，Google文档渲染pdf，.doc或任何其他文档之类的服务如何在HTML中以及注释系统如何工作？

解决方案

A.nnotate.com使用XPDF在给定的缩放级别上将PDF页面的服务器端转换为PNG图像 - 这些是浏览器中显示的内容。

文本突出显示是通过从PDF中提取文本位置来完成的，然后在页面顶部添加透明覆盖层，其中绝对位置的HTML Divs在单词顶部。然后，注释使用Ajax GUI将注释附加到突出显示的文本。

其他格式（MS Word，PPT等）首先使用OpenOffice转换为PDF，然后将图像和文本叠加层（如PDF）转换为PDF。

我认为其他HTML文档网站对将PDF渲染为HTML（即page Image + Word offay as transparent Divs）的作用类似 - 替代技巧是将PDF嵌入式字体转换为HTML5 CSS字体，并使用绝对定位的Divs（用于文本（＆提取并放置图像）。

许可以下： CC-BY-SA 和归因