A.nnotate.com背后使用了哪些技术?
-
25-10-2019 - |
题
我想知道诸如a.nnotate.com,scribd,Google文档渲染pdf,.doc或任何其他文档之类的服务如何在HTML中以及注释系统如何工作?
解决方案
A.nnotate.com使用XPDF在给定的缩放级别上将PDF页面的服务器端转换为PNG图像 - 这些是浏览器中显示的内容。
文本突出显示是通过从PDF中提取文本位置来完成的,然后在页面顶部添加透明覆盖层,其中绝对位置的HTML Divs在单词顶部。然后,注释使用Ajax GUI将注释附加到突出显示的文本。
其他格式(MS Word,PPT等)首先使用OpenOffice转换为PDF,然后将图像和文本叠加层(如PDF)转换为PDF。
我认为其他HTML文档网站对将PDF渲染为HTML(即page Image + Word offay as transparent Divs)的作用类似 - 替代技巧是将PDF嵌入式字体转换为HTML5 CSS字体,并使用绝对定位的Divs(用于文本( &提取并放置图像)。
不隶属于 StackOverflow