我们非常高兴地宣布,适用于 Windows、iOS、Android 和服务器的 ComPDFKit 转档SDK 1.8.0 现已发布!在该版本中,OCR 功能支持了表格识别,优化了OCR文字识别率。PDF to HTML 优化了html 文件结构,使转换后的 HTML 文件容量大幅减少。
OCR 表格识别:
Windows:
CPDFConvertWordOptions wordOptions = new CPDFConvertWordOptions();
wordOptions.IsAllowOCR = false;
Mac:
CPDFConvertWordOptions *options = [[CPDFConvertWordOptions alloc] init]
autorelease];
[options setIsAllowOCR:YES];
如果您想了解更多平台有关如何使用OCR的更多信息,请访问我们详细的OCR指南。
PDF to HTML:
Windows:
string resPath = “";
string inputFilePath = "”;
string outputFolderPath = “";
string outputFileName = "”;
CPDFConverter.Init(resPath);
CPDFConverterHTML converter = CPDFConvertFactroy.CreateConverter(CPDFConvertType.CPDFConvertTypeHtml, inputFilePath) as CPDFConverterHTML;
CPDFConvertHTMLOptions htmlOptions = new CPDFConvertHTMLOptions();
htmlOptions.PageAndNavigationPaneOpts = PageAndNavigationPaneOptions.SinglePageNavigationByBookmarks;
htmlOptions.IsAllowOCR = false;
htmlOptions.IsContainAnnotations = true;
htmlOptions.IsContainImages = true;
int pageCount = converter.GetPagesCount();
int[] pageArray = new int[pageCount];
for (int i = 0; i < pageArray.Length; i++)
{
pageArray[i] = i + 1;
}
ConvertError error = ConvertError.ERR_UNKNOWN;
converter.Convert(outputFolderPath, ref outputFileName, htmlOptions, pageArray, ref error, getPorgress);
如果您想了解更多平台有关如何使用PDF to HTML转换的更多信息,请访问我们详细的PDF to HTML指南。
问题修复:文章来源:https://www.toymoban.com/news/detail-612687.html
- 修复了 PDF 转 Word 对繁体文档进行 OCR 时可能会Crash 问题。
- 修复了 PDF 转 RTF 会多出一页空白页的问题。
- 修复了 PDF 转 RTF 的**OnProgress()**回调函数返回进度过慢的问题。
- 修复了 PDF 转 Excel 在文档没有表格的情况下,OnlyTable等于 true 时,返回转换失败的问题,现在会生成一个空白的 Excel 文件。
- 修复了 PDF 转 HTML 部分文件链接无法跳转的问题。
- 修复了 PDF 转 HTML 部分文件注释丢失的问题。
- 修复了 PDF 转 jpg 和 png,传入DPI 参数为负数时 Crash 问题。
总的来说,我们相信此次更新将把您使用 ComPDFKit 的体验提升到一个全新的水平。我们将继续优化我们的功能,为每一位用户提供更好的用户体验。欢迎您联系我们,试用 ComPDFKit 并向我们提供反馈意见。文章来源地址https://www.toymoban.com/news/detail-612687.html
到了这里,关于ComPDFKit 转档SDK OCR表格识别功能的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!