摘要:近年来,中国经济的增长一定程度带来文档数据与信息量的增长,中国政府、企业对经济活动中产生的文档进行电子化存储、数据提取、分析挖掘具有巨大需求。2020年中国智能文字识别服务市场规模为30亿元,2023年市场规模约为89.8亿元,增长率远超全球市场总增速。
一、定义及分类
智能文字识别是指相比传统简单文字识别,智能文字识别技术融合智能图像处理、光学字符识别、深度学习、自然语言处理等技术,可在多语言、多版式、曲面、褶皱、背景干扰等复杂场景下进行文字信息的识别分析与理解,能够获得较高的识别性能并具备认知与理解能力。
智能文字识别(OCR)通常可以根据其功能和应用领域进行分类。智能文字识别按应用领域可以分为印刷体文字识别、手写文字识别、混合文字识别;按技术可以分为光学字符识别、深度学习文本识别、传统特征提取文本识别;按输出结果可以分为文本检测、文本识别;按部署环境可以分为离线文字识别、在线文字识别;按语言和脚本可以分为拉丁字母文字识别、非拉丁字母文字识别。
二、行业政策
1、主管部门及监管体制
智能文字识别行业属于软件和信息技术服务业,行业的行政主管部门主要是工信部以及各行政区划设立的通信管理局。智能文字识别行业涉及商业大数据业务,因此相关企业需受征信行业主管部门中国人民银行监管。行业的内部管理机构是中国软件行业协会,软件产品登记的业务主管部门是工信部,软件著作权登记的业务主管部门是国家版权局中国版权保护中心。
2、相关政策
智能文字识别行业属于软件和信息技术服务业,具体到AI及大数据软件领域,软件和信息技术服务业既是国家战略性新兴产业的重要组成部分,也是关系国民经济和社会发展全局的先导性产业,具有技术更新快、应用领域广、渗透能力强等突出特点,对经济社会发展发挥重要支撑和引领作用。“十三五”以来,围绕制造强国和网络强国建设目标,中国通过发布实施一系列的政策、法律法规为软件产业实现快速发展创造了良好的环境。
三、发展历程
文字识别OCR发展历程OCR技术自20世纪70年代诞生以来,经历了早期阶段、发展阶段、数字化时代三个发展阶段,行业经历了从早期的基础技术探索到现代深度学习方法的演进,从单一语言的识别到多语言多样性的支持,不断推动着OCR技术的发展和应用。
四、行业壁垒
1、技术与人才壁垒
智能文字识别行业具备技术密集的特点,智能文字识别技术涉及OCR、NLP、图像处理、深度学习等尖端技术的融合,需要底层算法构建、模型训练、测试和部署等多个技术环节的配合。
全球人工智能的技术和产品呈现日新月异的发展态势,例如如何在资源受限的移动端设备上设计兼顾性能和效率的轻量OCR模型,如何通过语义及知识的深度挖掘提升OCR性能,均是行业的研究热点与难点。同时,市场需求也在不断变化,促使智能文字识别厂商根据下游客户的不同需求,开发标准化程度不同、形态不同的产品,提升识别的准确率、速度、稳定性,才能够在激烈的市场竞争中立于不败之地。智能文字识别技术在实际应用场景上的商业化落地,需要长时间的技术积累与持续的研发投入,也需要大量的优秀研发人员进行底层算法与应用模型的研究,新进入此领域的科技公司的技术追赶难度较大,同时也难以在短期内培养出尖端的研发人才团队。
2、客户资源壁垒
智能文字识别行业按销售模式可以分为C端业务与B端业务,而智能文字识别B端服务不同细分市场的竞争格局有所差异,B端业务可分为B端基础技术服务、B端标准化服务、B端场景化解决方案三种形态,技术的附加值、服务的复杂程度依次增高。
对于B端服务细分市场,智能文字识别行业的头部企业通过多元化的B端产品线布局,在多个下游行业树立了多家标杆企业客户,其落地案例通常会形成较大行业影响,影响此行业内众多企业的供应商选择。另外,大型企业客户通常对于场景化解决方案需求更高,此类项目落地周期相对较长,更换成本较高。因此对于新厂商而言,形成较高客户资源壁垒。
对于C端APP细分市场,先行进入市场的智能文字识别APP,利用先发优势,已积累大量用户,形成了品牌效应。用户在产品内积累越来越多个人文档资产,迁移成本较高,使产品拥有较高用户粘性,这对本行业的新进企业形成了较高的用户壁垒,同时已树立的品牌效应也进一步加强用户壁垒。
3、销售能力壁垒
由于不同行业客户对于智能文字识别技术的需求与应用场景不同,智能文字识别服务提供商对于各行业场景的深度理解、研发出可在行业场景中落地的应用产品是其能否在本行业立足的关键因素之一。如为保险行业客户研发出智能核保、理赔流程的智能文字识别解决方案;为政府客户研发出智能证件审核的智能文字识别解决方案;为物流业客户研发出运单信息自动录入的智能文字识别解决方案。
因此,一家成功的智能文字识别企业不仅需要尖端研发人才,也同时需要可链接行业客户需求和内部研发团队的销售团队,销售团队对客户所在行业的真实业务场景、业务逻辑、产业链上下游等有充分的理解,以客户的痛点、需求为核心,充分调动公司内部如研发、实施、售后服务等各类资源,以实现行业解决方案的落地。而行业的深度理解需要依靠大量案例的经验积累,这对本行业的新进企业形成了较高的销售能力壁垒。
4、数据资源壁垒
融合了深度学习、NLP等人工智能技术的智能文字识别,其算法的设计和优化需要由海量的高质量场景数据驱动,需要在各行业各类大数据应用场景积累的海量数据对智能文字识别算法模型进行训练。所以相比市场新进厂商而言,进入智能文字识别领域较久、落地案例更为丰富的厂商在各类场景、各类行业数据的累积上优势明显,其智能文字识别算法模型更为成熟,识别准确率、识别速度也更为出色。这对本行业的新进企业形成了较高的数据壁垒。
五、产业链
1、行业产业链分析
智能文字识别行业的产业链上游涉及到图像采集、图像预处理、特征提取、识别算法、语言模型等多个关键技术和环节,这些技术共同构成了OCR系统的基础,为文字识别提供了坚实的技术支持。智能文字识别行业位于产业链中游,主要代表企业有百度云、腾讯云、阿里云、Google Cloud、ABBYY、合合信息等。
智能文字识别行业的产业链下游涉及到各种应用场景和产品服务,包括应用软件开发、文档管理和数字化服务、电子商务和金融服务、智能设备和物联网应用、人工智能应用开发等方面,这些应用场景和产品服务为OCR技术的商业化应用提供了广阔的空间和机遇。
2、行业领先企业分析
合合信息是一家人工智能及大数据科技企业,基于自主研发的领先的智能文字识别及商业大数据核心技术,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。2022年合合信息实现营业收入98846.18万元,实现净利润28371.77万元;2023年一季度合合信息实现营业收入26602.31万元,实现净利润7969.02万元。
合合信息智能文字识别技术融合了智能图像处理、复杂场景文字识别、NLP等AI技术,相比传统简单文字识别,具备更多认知与理解能力,可适应多语言、多版式、多样式等复杂场景,并可应用到多个商业化场景中并形成落地的产品或服务,例如票据分类、证照票据结构化、合同关键信息抽取、智能审核等。合合信息智能文字识别业务包含扫描全能王、名片全能王C端APP收入以及B端服务收入。企业招股书数据显示,2022年合合信息智能文字识别服务业务收入为72489.24万元,其中:B端服务收入为7120.43万元,C端APP(扫描全能王和名片全能王)服务收入为65368.81万元。
六、行业现状
相比传统简单文字识别,智能文字识别技术融合图像处理、OCR、深度学习、NLP等AI技术,具备更多认知与理解能力,可适应多语言、多版式、多样式等复杂场景,识别准确率大大提升,同时可基于理解能力进一步开发文档解析、分类、对比、审核等功能,是个人文档资产管理与企业数字化转型的关键。
从下游行业应用来看,金融、物流运输的市场规模是占比最高的两个细分行业,且增速也最快,主要由于金融、物流运输企业在业务流程方面的基础信息化建设程度、投入意愿相对其他行业来说相对较高,在证照、单据、表格等文档的智能录入、分类、比对、审核方面进行降本增效具有较大需求,为智能文字识别技术的商业化快速落地带来基础。据统计,2020年全球智能文字识别服务市场规模达75亿美元,2023年全球智能文字识别服务市场规模约为123.2亿美元。
近年来,中国经济的高速增长一定程度带来文档数据与信息量的增长,中国政府、企业对经济活动中产生的文档进行电子化存储、数据提取、分析挖掘具有巨大需求。2020年中国智能文字识别服务市场规模为30亿元,2023年市场规模接约为89.8亿元,增长率远超全球市场总增速。
七、发展因素
1、有利因素
(1)人工智能列入中国“新基建”范围,政策利好加速产业新生态的构建
人工智能对社会与经济的影响日益凸显,各国政府先后出台人工智能发展相关政策,推动产业发展,将其上升到国家战略高度。中国中央及各地政府近年来先后发布了多条人工智能利好政策。智能文字识别作为人工智能应用中商业推广落地较快的领域,正成为人工智能新基建落地应用的“领头雁”,已成为人工智能新基建对外提供的重要智能化服务能力之一。人工智能融入实体经济的过程,也将为智能文字识别产业生态引入丰富的人才、技术、场景等要素。
(2)深度学习、NLP赋能下,智能文字识别技术不断提升
当前深度学习技术不断发展,加速了智能文字识别技术性能提升,为复杂场景的文字识别应用提供先决条件。文字识别应用范围从简单的印刷体数字、字母符号识别,逐步演进到自然场景下多形态文本检测与识别、手写体文本检测与识别等复杂情形。同时,深度学习的出现,使NLP技术在阅读理解、机器翻译、问答系统等领域取得了一定成功,大幅提升智能文字识别的技术水平。
(3)企业及政府的数字化转型需求不断提升
在第四次工业革命背景下,人工智能、大数据与云计算、5G等新一代信息技术的快速发展与融合,使得数字化基础设施和产业生态已经成为了社会的“新基建”,其中人工智能是推动数字化转型与创新的原动力,将成为引领第四次工业革命的核心驱动力。企业及政府数字化转型意在实现运营自动化、管理网络化、决策智能化,有利于加快业务流程重组,有效地降本增效。中国企业信息化与IT投入近些年不断提升,且相比发达国家仍有较大上升空间。智能文字识别技术可帮助企业与政府实现文档存量数字化、增量电子化,随着企业与政府数字化、信息化与智能化需求的不断提高,预计将持续推动智能文字识别服务行业发展。
(4)个人用户对文档资产管理愈发受到重视
互联网、智能手机的高速发展,使消费者习惯于利用智能终端进行数据处理。同时,在互联网时代下信息爆炸式的增长,且通常个人数据资产都较为珍贵,如合同、名片、发票、笔记等,使得消费者对个人资产管理数字化意识和需求不断增强。由于纸质文档不易保存,难以对信息进行快速的查询、分类、分享,因此用户更倾向于将个人文档通过扫描、拍照等方式数字化,在本地或者云端进行有效的存储、分类等,以便随时随地在手机、电脑等多终端进行同步、查询、管理及分享,满足个人的办公、求职、学习等不同场景的需求。个人用户对文档资产管理持续存在的需求将不断推动智能文字识别服务行业发展。
2、不利因素
智能文字识别凭借着较高的实际应用价值,一直以来都是人工智能领域的研究热点,2014年以来,随着深度学习技术在智能文字识别的广泛应用,中国智能文字识别技术取得了飞跃性发展。同时,中国智能文字识别行业在发展过程中面临着不同行业及不同规模客户差异化需求、技术挑战、数据质量和数量问题、数据隐私和安全问题、市场竞争和行业标准、人才短缺和技术壁垒、应用场景限制等多个方面的不利因素,需要克服这些困难,才能实现行业的持续健康发展。
八、竞争格局
近年来,物联网、云计算、大数据的快速发展推动数据量爆发式增长,智能文字识别作为文档数据管理的关键技术,拥有较大发展前景。目前中国已经将人工智能上升到国家战略层面,政府明确提出要加快发展人工智能产业,推动数字经济高质量发展。与此同时,人工智能在全球也遍地开发,技术和产品日新月异,促使智能文字识别厂商根据下游客户的不同需求,开发标准化程度不同、形态不同的产品,提升识别的准确率、速度、稳定性,才能够在激烈的市场竞争中立于不败之地。目前,智能文字识别领域的主要竞争企业有百度云、腾讯云、阿里云、Google Cloud、ABBYY、合合信息等。
九、发展趋势
智能文字识别(OCR)作为计算机视觉领域的重要分支,OCR典型应用是通过图像文字识别实现信息录入。同时,由于文字和符号包含丰富的语义信息,基于OCR提取文字信息继而进行分析,能够帮助机器更好地理解图像。
借助人工智能技术,近年来智能文字识别(OCR)性能的不断提升为产业数字化催生出更复杂的OCR应用场景提供了坚实支撑。同时,覆盖手机、电子产品以及云服务在内的更加多样化的服务载体,进一步加快了OCR的普及,持续向社会生产生活的更多领域渗透。未来,智能文字识别(OCR)技术发展将会更加智能化、高效化和个性化。随着技术的不断进步和应用领域的不断拓展,文字识别技术将会在更多的领域得到应用,并且将会更好地满足用户的需求和偏好,市场前景一片光明。
版权提示:智研咨询倡导尊重与保护知识产权,对有明确来源的内容注明出处。如发现本站文章存在版权、稿酬或其它问题,烦请联系我们,我们将及时与您沟通处理。联系方式:gaojian@chyxx.com、010-60343812。
版权提示:智研咨询倡导尊重与保护知识产权,对有明确来源的内容注明出处。如发现本站文章存在版权、稿酬或其它问题,烦请联系我们,我们将及时与您沟通处理。联系方式:gaojian@chyxx.com、010-60343812。