Google图书是如何运作的?有没有开源替代品?

时间:2009-10-06 19:20:47

标签: python image-processing watermark

我被要求以类似谷歌图书的方式在线发布完整的图书?即它可以查看和打印但不能下载。

这个过程基本上是“高质量扫描”吗?是否存在任何开源解决方案,以在这些高质量图像上“大量生成”“水印”。假设您有原始图像。当用户在线查看它时,我重新创建图像添加水印和“动态”图像上方的其他一些文本是否有这样的库存在于python off课程中:))

任何提示?如果您之前已经这样做,请分享。

由于

3 个答案:

答案 0 :(得分:4)

不幸的是,谷歌使用专利技术来扫描它的书籍,所以你可能不得不坚持使用传统方法。

  谷歌创造了一些非常漂亮的东西   红外摄像技术   检测三维形状   书的角度和书页的角度   放在扫描仪中。这个   信息被传送到OCR   软件,调整为   扭曲并允许OCR   软件可以更准确地阅读文本。   没有更多的破坏绑定   低效的玻璃板。

基本上你需要使用OCR应用程序扫描书籍(tesseract很好),然后我会从扫描的文本中生成PDF /图像,最后在顶部添加水印。 Python Imaging Library似乎是最好的工具。

答案 1 :(得分:1)

对Google图书不太了解,但Python Imaging Library可以进行水印处理(ASPN recipe就是这样)。

答案 2 :(得分:0)

请参阅有关复制Google照片+激光网格技术的slashdot问题。