近日,在国际计算机视觉大会召开期间,合合信息联合上海交通大学等机构主办首届VQualA视觉质量评估研讨会,并设置了文档图像质量评估竞赛,吸引了来自全球知名高校和研究机构的上百名选手参与。
本次竞赛旨在推动开发与人类判断一致的文档图像质量评估模型,为智能文档图像处理技术建立标准化评估体系。最终,参赛队伍DeQA-Doc凭借将多模态大模型应用于文档图像领域的技术方案,获得竞赛榜首。
在信息数字化的背景下,文档图像已成为信息传播的核心载体。然而,手机、相机等设备采集的文档图像常因外部环境影响,出现阴影、纸张弯曲等质量问题。智能文档图像处理技术通过去模糊、几何校正等方法提升图像质量,但如何科学评估算法优化效果仍是难点。传统评估指标难以与人眼感知效果一致,主观评估效率低,无法满足大规模算法评估需求。本次竞赛的技术方案聚焦这一难题,为优化文档处理系统提供了多种创新思路。
据相关负责人介绍,合合信息长期专注于多模态文本智能技术的研发,与上海交通大学在智能图像处理领域建立了紧密合作,采用“企业出题、高校攻关”的课题研究模式,旨在打通从学术创新到产业应用的转化路径。合合信息提出具有产业价值的研究课题并提供场景、算力等资源支持,校方组织团队开展技术研究,目前,双方已共同产出多篇前沿学术论文及多项专利成果,为智能文档图像处理技术进步提供了重要助力。
