随着集团各项业务的不断发展,智能手机、移动设备的普及应用,越来越多的图片和文字识别需求被提出。OCR(光学字符识别)作为实用化的人工智能技术之一,已在集团风控(识别商户虚假宣传敏感词)、财务(自动识别税票信息)、金融(检测和提取企业和个人证件信息)等领域大显身手,在诸多业务场景中赋能智慧零售生态圈建设。
OCR技术的神奇之处在于:节省人力,提高效率
目前集团开放平台上有数万家商户,累计已有数十亿计的商品图片。如何在海量图片中识别和监测到商户的违规宣传内容,规避运营风险?在没有使用OCR之前,依靠投入大量运营人力进行页面问题排查,不能有效杜绝问题的产生。使用OCR后,通过OCR图像识别技术和敏感词过滤,排查商品图片信息中的敏感词,对含有违规宣传的商品图片及时反馈给商户进行处理,禁止上架或及时下架。目前平均日检测图片1000万张左右,峰值可处理3000万张,日均检出有问题图片约10万张,此举有效杜绝了职业打假人的索赔发生,让之前每月百单的索赔量不再出现。
无独有偶,在财务领域,OCR也发挥了神奇的作用。改变以往人工处理票据、凭证等业务流程的传统数据采集方式,而是采用基于深度学习的OCR高速扫描识别技术,同样单位时间内的产能更高,各项业务流程流转速度更快。
此外,OCR也运用在个人和企业的资料识别和提取方面,快速满足了金融集团对公司&个人征信审核和零售集团对新增签约商户资料获取和审核方面的需要,帮助人们从繁重、繁琐的数据整理、统计和应用中解脱出来,既优化了用户体验,节省了人力,也极大的提高了工作效率。
不断迭代、智能化的图像识别技术离不开其他团队的配合和支持
OCR深度学习图像识别技术能对复杂的单张多类型图片进行版面自动分析和版面分割,对版面分割后不同类型图片进行专有模型的自动分类识别和训练。以财务单据为例,目前可支持火车票、增值税专用发票、增值税普通发票(平铺)、增值税电子普通发票、销货清单等票据类型的识别,其中,对增值税发票、火车票、销售清单三种常见票据类型进行了专项优化,按字段返回识别结果。目前火车票单字识别准确率达到95%以上,增值税发票关键字达到85%以上。后续将在多种专有模型基础上进行聚类、合并,形成通用模型的建立。
同时,智能化的信息录入可提供全天候文字识别服务,提升用户体验。
能够取得如此丰富的研发成果,离不开各个需求研发部门同事的配合和支持。在样本收集、准备和标注的过程中,共享产品研发中心流程实施产品部、供应商及商户平台研发中心运营管理平台研发中心平台招商产品部、网站产品运营中心商户产品部、消费者平台研发中心客服研发中心综合业务客服产品部、金服集团大数据中心征信产品设计部等部门的同事都给予了大力配合和全力支持,有效保障了算法训练和迭代升级的基石。
专业、敬业的研发团队紧跟前沿技术,不断创新
图像研究实验室近两年快速发展,由多位名校博士、资深算法研发工程师、软件开发工程师、前端工程师、产品经理组成了一个强大的研发队伍。这支队伍深入钻研,苦练内功,不但能够紧跟技术前沿,不断创新,而且能够结合实际需求,开发出具备良好性能的产品及服务,在研究和开发领域都具备很强的战斗力。与此同时,在样本数据爬取、数据存储、标注及管理方面也有极大的优势,成为了团队前进不可或缺的力量。
图像研究实验室OCR团队合影
展望未来,图像研究实验室团队一方面继续从自身抓起,不断增加知识储备、提升相关技能,与人工智能领域一日千里的发展速度同步前行;另一方面从应用需求出发,进一步提升已有算法成果的性能,为公司智慧零售提供更为精确的导引,并积极面对挑战,主动创新,与公司其他团队精诚合作,研发出更多有广泛前景的智能服务及产品,持续赋能智慧零售生态圈建设!