0 摘要
自动文档布局分析是认知计算和处理的关键步骤,它从文档图像中提取信息(如特定领域知识库的创建,图表和图像理解,从表格中提取结构化的数据等)。即使在过去几年中在这个领域取得了一些进展,但是挑战仍然存在:准确地将检测内容分类到语义上有意义的类别中。随着移动设备和云服务的普及,对数据使用既快速又经济的方法的需求已成为现实。在本文中,我们提出了一种基于卷积神经网络的文本,图形和表格的自动文档布局分析的方法。我们利用在文本和表格块中观察到的固有一维图案来减少从二维文档图像到一维签名的维度分析,显着提高整体性能:我们提供了更快的执行时间和更紧凑的数据使用而不会造成损失。与传统的二维CNN方法相比,总体准确度更高。 自动文档布局分析是认知计算和处理的关键步骤,它从文档图像中提取