我想知道诸如a.nnotate.com,scribd,Google文档渲染pdf,.doc或任何其他文档之类的服务如何在HTML中以及注释系统如何工作?

有帮助吗?

解决方案

A.nnotate.com使用XPDF在给定的缩放级别上将PDF页面的服务器端转换为PNG图像 - 这些是浏览器中显示的内容。

文本突出显示是通过从PDF中提取文本位置来完成的,然后在页面顶部添加透明覆盖层,其中绝对位置的HTML Divs在单词顶部。然后,注释使用Ajax GUI将注释附加到突出显示的文本。

其他格式(MS Word,PPT等)首先使用OpenOffice转换为PDF,然后将图像和文本叠加层(如PDF)转换为PDF。

我认为其他HTML文档网站对将PDF渲染为HTML(即page Image + Word offay as transparent Divs)的作用类似 - 替代技巧是将PDF嵌入式字体转换为HTML5 CSS字体,并使用绝对定位的Divs(用于文本( &提取并放置图像)。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top