将 .doc 或 .pdf 转换为图像并在 Ruby 中显示缩略图?
有谁知道如何用 Ruby(或 C、Python...)生成文档缩略图

有帮助吗?

解决方案

将 PDF 转换为 PNG 的简单 RMagick 示例如下:

require 'RMagick'
pdf = Magick::ImageList.new("doc.pdf")
thumb = pdf.scale(300, 300)
thumb.write "doc.png"

要转换 MS Word 文档,就没那么容易了。您最好的选择可能是先将其转换为 PDF,然后再生成缩略图。您生成 PDF 的选项在很大程度上取决于您所运行的操作系统。一种可能是使用 OpenOffice 和 Python 开放文档转换器. 。您还可以尝试在线转换服务,包括 http://Zamzar.com.

其他提示

回答上面 @aisensiy 的评论的示例代码:

require 'rmagick'
pdf_path = "/path/to/interesting/file.pdf"
page_index_path = pdf_path + "[0]" # first page in PDF
pdf_page = Magick::Image.read( page_index_path ).first # first item in Magick::ImageList
pdf_page.write( "/tmp/indexed-page.png" ) # implicit conversion based on file extension

基于回答另一个问题的路径线索:

https://stackoverflow.com/a/6369524/765063

不确定任何开源库中的 .doc 支持,但 ImageMagick (和 RMagick gem)可以使用 pdf 支持进行编译(我认为默认情况下是打开的)

ImageMagick 中的 PDF 支持有点问题 - 但它是迄今为止 ruby​​ 的最佳操作系统方式。还有一个用于纯 Ruby PDF 支持的 google Summer of Code 项目。

我读过有关在没有 GUI 的情况下使用 OpenOffice 来转换 .doc 文件的内容 - 但充其量它会很复杂。

正如前 2 位发帖者所说,ImageMagick 可能是生成缩略图的最简单方法。

你可以执行类似的东西:

´convert -size 300x300 doc.pdf doc.png´

(反引号告诉 Ruby 将其去掉)。

如果您不想使用 exec 进行转换,您可以使用 RMagick gem 来为您完成转换,但它可能需要更多代码。

如果你不介意付费购买 Imgix,它 处理 PDF 也。您可以通过它获得快速 CDN 的所有优势。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top