Вопрос

Я хотел бы знать, как такие услуги, как A.Nnotate.com, Scribd, Google Docs рендеринг PDF, .doc или любой другой документ в HTML и как работает система аннотаций?

Это было полезно?

Решение

A.Nnotate.com делает преобразование PDF -страниц на стороне сервера в изображения PNG на заданном уровне масштабирования с использованием XPDF - это то, что отображается в браузере.

Подсветление текста выполняется путем извлечения текстовых позиций из PDF, а затем добавив прозрачное наложение в верхнюю часть изображений страницы с абсолютно позиционированными HTML DOV поверх слов. Затем аннотации используют графический интерфейс Ajax, чтобы прикрепить заметки к выделенному тексту.

Другие форматы (MS Word, PPT и т. Д.) Сначала преобразуются в PDF с использованием OpenOffice, затем в изображения и текстовые наложения, как для PDF.

Я думаю, что другие сайты документов HTML делают что -то подобное для рендеринга PDF как HTML (т.е. изображения страниц + наложение слов как прозрачные DOV) - альтернативный трюк - преобразовать встроенные PDF -шрифты в шрифты HTML5 CSS и использовать абсолютно позиционированные DOV для текста ( и извлечь и позиционировать изображения тоже).

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top