PDF转Word SDK效果对比
金蝶云社区-ComPDFKit
ComPDFKit
1人赞赏了该文章 94次浏览 未经作者许可,禁止转载编辑于2023年09月19日 10:47:16

当今数字化时代,文件转档功能已经成为了生活和工作中不可或缺的一部分。随着技术的不断发展,各种产品和工具竞相涌现,它们提供了各种各样的方式来将文档从一种格式转换为另一种格式。这些产品的多样性使得我们有必要深入探讨它们的特点和性能,以便选择最适合我们需求的转档工具。本文将对比不同产品的转档功能,探讨它们的优势和劣势,帮助您在众多选择中做出明智的决策。无论您是一位职业人士、学生还是普通用户,都可以从这篇文章中找到有关PDF 转Word 转档工具的有用信息,以便更好地处理和管理文档。让我们开始这次关于文档转档的探索之旅。

对比的厂商:


1. Solid:老牌的 PDF to Office 转档库,有几十年的积累。

2. Aspose: 支持非常多的文件格式互转,也包含PDF 转 word 。

3. Foxit:自主研发 PDF ,PDF to Office 也是最近刚推出的。

4. ComPDFKit: 集成了AI和OCR功能的转档SDK厂商。


话不多说,直接对比一下 PDF 转 word 的效果。


对比表:

分别挑选了一些不同特征的文档进行测试,其中包括页数多,包含表格,图文混排。涉及到论文,cad制图,金融等领域,先看一下这些文档的转档耗时。


12个文档中,foxit 有三个文档没有转换成功,其他三个 SDK 全部文档都转换成功了。Aspose  SDK 因为试用原因只能转换前4页,但是有些情况下对比其他三个转了全部页面的速度还慢。综合下来ComPDFKit的转换速度最快。接下来我们看一下具体效果。


效果文档 - 651页文档.pdf

原文档


各SDK厂商转档对比

  • ComPDFKit:基本没啥问题,但是字体和原文档有区别

上传图片




  • 福昕:可以看到会有一些小的识别错误,主要在跨行的时候,存在部分粗体识别错误的情况

上传图片




  • Solid: 基本也没啥问题,没什么错误,不过也存在字体区别。

上传图片




效果文档 - 证券文档.pdf

原文档:



各SDK厂商处理结果:


  • ComPDFKit: 整体排版正确,第二页的部分字体会出现拖影现象,部分文字会出现超出文本框的现象。



  • foxit:整体排版正确,第二页的部分字体会出现拖影现象,第一页的图表会出现超出文本框的现象。


  • Solid:整体排版正确,第一页的图表会出现超出文本框的现象,第一页的页脚图片透明度识别错误。


Aspose:整体排版正确,第二页的部分文字下有投影。


效果文档 - 论文2.pdf

原文档:


各SDK厂商处理结果:


  • ComPDFKit: 在公式部分的转换都是转换了文档中原有的字符,所以会出现乱码。


foxit:并没有区分小标题的粗体与正文的细体,且部分文本用图片代替,排版相对而言比较混乱。


Solid: 对公式部分的支持比较好,但是部分符号使用了形变后的图片代替,比较影响观感。


效果文档 - 图文混排.pdf

原文档:



各SDK厂商处理结果:


图文混排版面都保持的不错

ComPDFkit, foxit, solid 文字的字体和原文档都解决得不太好,aspose 最接近, 但是aspose 的背景图片缩放不对。ComPDFkit有几个字最上方被裁掉了。


  • ComPDFKit: 


  • foxit: 


  • Solid:


  • Aspose:


效果文档 - 图文带简单表格.pdf


  • foxit 的文字背景形状变了,变成了不规则的。

  • aspose 背景图片变小了。

  • ComPDFKit 的时间有一部分被裁掉了。

  • Solid 效果良好。



原文档:



各SDK厂商处理结果:


  • ComPDFKit:


  • foxit:


  • Solid:

  • Aspose:


总结

这几家 SDK转换PDF为Word都各有优缺点,PDF转成Word的算法侧重点有所不同。可以根据自己的项目情况和项目预算选择合适的SDK公司。


本文转载自:ComPDFKit

作者:Youna

原文链接:https://www.compdf.com/blog/compare-sdks-for-converting-pdf-to-word

赞 1