基于图像识别的财务数据分析方法及系统与流程

专利2025-06-18  23


本发明属于图像识别,具体涉及基于图像识别的财务数据分析方法及系统。


背景技术:

1、在当今数字化快速发展的商业环境中,企业面临着日益增长的财务数据处理和管理挑战。传统的手工处理财务票据,如发票、收据和账单,不仅耗时费力,还容易出现数据输入错误,影响财务数据的准确性和实时性。因此,越来越多的企业开始关注并投入研究智能识别财务票据信息的技术应用。

2、智能识别技术以其高效、准确和自动化的特点,吸引了企业的广泛关注。通过使用ocr和机器学习算法,智能识别系统能够快速而精确地识别和提取财务票据中的关键信息,如金额、日期、供应商信息等。该技术不仅能大幅减少人工录入的时间和成本,还能有效降低人为错误的风险,提升数据处理的效率和质量。

3、目前,对于财务票据图像数据的提取一直以来都是ocr技术的难点,常规ocr技术对图像中的文字信息进行提取,并不能有效提取和识别表格的文字信息原来的格式,后续还需要利用人工来将文字信息填写到对应的位置,大大降低了工作效率。另外,现有通过常规ocr识别算法提取财务报表数据还经常会出现行列错位的情况。

4、针对现有技术的不足,亟需设计一种基于图像识别的财务数据分析方法及系统以解决上述技术问题。


技术实现思路

1、为解决上述现有技术的中的不足,本发明的目的在于克服现有不足,提供一种基于图像识别的财务数据分析方法,其特征在于,包括如下步骤:

2、采集企业财务票据图像数据信息,对所述图像数据信息进行纸张边缘检测,获取到规则的包含企业财务票据的第一处理图像,传输所述第一处理图像至源数据库;

3、获取所述源数据库存储的任一的第一处理图像,对所述第一处理图像进行图像识别,得到用于描述任一用户的企业财务票据数据,对所述企业财务票据数据进行识别阈值检测:

4、若所述企业财务票据数据的识别度不低于票据识别阈值,传输所述企业财务票据数据和对应的第一处理图像至第一识别数据库;

5、若所述企业财务票据数据的识别度低于票据识别阈值,传输对应的第一处理图像至第二识别数据库;

6、获取所述第一识别数据库的任一的企业财务票据数据,对所述企业财务票据数据进行用户数据库匹配,将匹配成功的所述企业财务票据数据新增录入所述用户数据库。

7、作为上述方案的进一步优化,对所述第一处理图像进行图像识别具体包括如下:

8、基于图像识别获取用于描述任一用户的企业财务票据图像;

9、对所述企业财务票据图像进行框选识别,将图像进行二值化处理;

10、获取存储于所述源数据库的企业财务票据模板,基于二值化图像,将所述企业财务票据模板与所述二值化图像对比:

11、若基于所述二值化图像与所述企业财务票据模板定位单元格范围内灰度差绝对值不大于检测阈值,标记所述单元格为不合格数据;

12、若基于所述二值化图像与所述企业财务票据模板定位单元格范围内灰度差绝对值大于检测阈值,标记所述单元格为合格数据;

13、获取所述二值化图像与所述企业财务票据模板的所有单元格范围内灰度差绝对值,若存在任一的灰度差绝对值不大于检测阈值,传输所述二值化图像对应第一处理图像至第二识别数据库;否则传输至第一识别数据库。

14、作为上述方案的进一步优化,对所述企业财务票据数据进行识别阈值检测还包括如下:

15、设置一识别阈值t=0.4a+0.2b+0.2c+0.2d;

16、检测所述企业财务票据数据的影响因子a、b、c和d,记任意存在的影响因子为1,否则为0,计算第一处理图像的识别值s,识别阈值t=0.6,则:

17、若s≥t,传输所述企业财务票据数据和对应的第一处理图像至第一识别数据库;

18、若s<t,传输对应的第一处理图像至第二识别数据库;

19、上式中,a为票据种类,b为买方名称,c为买方识别号,d为买方账户信息。

20、作为上述方案的进一步优化,对所述企业财务票据数据进行用户数据库匹配具体包括如下:

21、获取所述第一识别数据库的任一的企业财务票据数据,所述企业财务票据数据用于记录和描述所述企业财务票据信息;

22、遍历所述企业财务票据数据的所有影响因子,检索任一企业财务票据数据的影响因子b和c;

23、若检索到任一企业财务票据数据包含影响因子b,遍历所述用户数据库,匹配与影响因子b关联的所有用户已登记数据;基于遍历到的所有用户已登记数据,将任一企业财务票据数据的影响因子匹配录入;

24、若检索到任一企业财务票据数据包含影响因子c,遍历所述用户数据库,匹配与影响因子c关联的所有用户已登记数据;基于遍历到的所有用户已登记数据,将任一企业财务票据数据的影响因子匹配录入;

25、若检索到任一企业财务票据数据包含影响因子b和c,遍历所述用户数据库,匹配同时包含影响因子b和c的任一所有用户已登记数据;基于遍历到的所有用户已登记数据,将任一企业财务票据数据的影响因子匹配录入。

26、作为上述方案的进一步优化,对所述企业财务票据数据进行用户数据库匹配还包括如下:

27、设置任一的所述企业财务票据数据包括影响因子、联动因子和待选因子;

28、在遍历所述用户数据库匹配到与任一影响因子关联的所有用户已登记数据后,基于所述影响因子新增录入除当前影响因子外所有影响因子至待处理行;

29、基于图像识别获取任一的所述企业财务票据数据影响因子匹配成功所在行的对应联动因子,将基于图像识别的所述联动因子与所述用户数据库匹配:

30、若所述联动因子与所述用户数据库匹配值不小于匹配阈值,复制传输所述用户数据库对应的联动因子新增录入到用户数据库待处理行;

31、若所述联动因子与所述用户数据库匹配值小于匹配阈值,将所述基于图像识别的联动因子对应新增录入到用户数据库待处理行;

32、基于图像识别获取任一的所述企业财务票据数据的待选因子,将所述基于图像识别的待选因子对应新增录入到用户数据库待处理行。

33、作为上述方案的进一步优化,所述任一存在的影响因子还包括与其对应的影响因子属性。

34、作为上述方案的进一步优化,对所述企业财务票据数据遍历检索影响因子a:

35、若未遍历检索到所述企业财务票据数据存在影响因子a,传输所述企业财务票据数据对应第一处理图像至第二识别数据库;

36、若遍历检索到所述企业财务票据数据存在影响因子a,将所述影响因子a与所述源数据库存储的企业财务票据模板匹配,将匹配成功的所述企业财务票据模板复制传输至所述第一识别数据库。

37、本发明还公开了一种基于图像识别的财务数据分析系统,所述系统包括如下:

38、第一图像处理模块,用于采集企业财务票据图像数据信息,对所述图像数据信息进行纸张边缘检测,获取到规则的包含企业财务票据的第一处理图像,传输所述第一处理图像至源数据库;

39、图像识别模块,用于获取所述源数据库存储的任一的第一处理图像,对所述第一处理图像进行图像识别,得到用于描述任一用户的企业财务票据数据,对所述企业财务票据数据进行识别阈值检测:

40、若所述企业财务票据数据的识别度不低于票据识别阈值,传输所述企业财务票据数据和对应的第一处理图像至第一识别数据库;

41、若所述企业财务票据数据的识别度低于票据识别阈值,传输对应的第一处理图像至第二识别数据库;

42、数据匹配模块,用于获取所述第一识别数据库的任一的企业财务票据数据,对所述企业财务票据数据进行用户数据库匹配,将匹配成功的所述企业财务票据数据新增录入所述用户数据库。

43、作为上述方案的进一步优化,所述第一图像处理模块具体包括如下:

44、图像获取单元,用于基于图像识别获取用于描述任一用户的企业财务票据图像;

45、图像处理单元,用于对所述企业财务票据图像进行框选识别,将图像进行二值化处理;

46、图像判断单元,用于获取存储于所述源数据库的企业财务票据模板,基于二值化图像,将所述企业财务票据模板与所述二值化图像对比:

47、若基于所述二值化图像与所述企业财务票据模板定位单元格范围内灰度差绝对值不大于检测阈值,标记所述单元格为不合格数据;

48、若基于所述二值化图像与所述企业财务票据模板定位单元格范围内灰度差绝对值大于检测阈值,标记所述单元格为合格数据;

49、图像存储单元,用于获取所述二值化图像与所述企业财务票据模板的所有单元格范围内灰度差绝对值,若存在任一的灰度差绝对值不大于检测阈值,传输所述二值化图像对应第一处理图像至第二识别数据库;否则传输至第一识别数据库。

50、作为上述方案的进一步优化,所述任一存在的影响因子还包括与其对应的影响因子属性。

51、本发明采用上述的技术方案,与现有技术相比,具有如下有益效果:

52、1.本发明通过提出一种基于图像识别的财务数据分析方法,具体表现为对企业财务票据图像数据进行ocr处理,快速实现对电子票据和扫描票据的隔离处理,且根据ocr识别结果快速提取关键字,进行对应的文字信息匹配,基于完备的企业用户数据库,进一步提升企业财务票据图像数据识别准确度问题,将票据图像的系统录入操作工作量降至最低,大幅度提升工作人员的效率和数据准确度。

53、2.本发明在第一处理图像的处理过程中,通过计算二值化图像与对应的企业财务票据模板的所有单元格范围灰度差绝对值,从而快速判断出对应的单元格是否存在数据信息或是否清晰,且针对不同识别结果分别传输至第一或第二识别数据库,以便于高效率处理高质量票据信息、高准确度处理低质量票据信息,效果良好。

54、3.本发明还针对企业财务票据数据设置有影响因子,即影响因子为能够快速判断和确认票据信息的特征值,通过识别和检测影响因子,进一步提升待处理发票质量,将低于识别阈值的图像传输至第二识别数据库进行人工处理。同时将识别的影响因子存储至第一识别数据库,便于后续的信息处理。

55、4.本发明精准将财务票据信息按数据特性分组,根据对应的特性进行匹配,影响因子为直接录入项;进一步针对联动因子分析,当通过ocr技术识别出联动因子对应的参数信息,与用户数据库已存储的信息值匹配,则直接复制用户数据库已存储的信息值,该选择作为完全准确度保存录入;否则,将基于图像识别的联动因子对应新增录入到用户数据库待处理行,可能存在识别误差。本发明技术将有效降低工作人员对于财务票据信息的审核力度,提升其工作效率和准确率,具有良好的积极效果。


技术特征:

1.一种基于图像识别的财务数据分析方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述第一处理图像进行图像识别具体包括如下:

3.根据权利要求2所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行识别阈值检测还包括如下:

4.根据权利要求3所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行用户数据库匹配具体包括如下:

5.根据权利要求4所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行用户数据库匹配还包括如下:

6.根据权利要求5所述的一种基于图像识别的财务数据分析方法,其特征在于,所述任一存在的影响因子还包括与其对应的影响因子属性。

7.根据权利要求6所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据遍历检索影响因子a:

8.一种基于图像识别的财务数据分析系统,其特征在于,所述系统包括如下:

9.根据权利要求8所述的一种基于图像识别的财务数据分析系统,其特征在于,所述第一图像处理模块具体包括如下:

10.根据权利要求9所述的一种基于图像识别的财务数据分析系统,其特征在于,所述任一存在的影响因子还包括与其对应的影响因子属性。


技术总结
本发明公开了一种基于图像识别的财务数据分析方法,采集企业财务票据图像数据信息,对所述图像数据信息进行纸张边缘检测,获取到规则的包含企业财务票据的第一处理图像,传输所述第一处理图像至源数据库;获取所述源数据库存储的任一的第一处理图像,对所述第一处理图像进行图像识别,得到用于描述任一用户的企业财务票据数据,对所述企业财务票据数据进行识别阈值检测:获取所述第一识别数据库的任一的企业财务票据数据,对所述企业财务票据数据进行用户数据库匹配,将匹配成功的所述企业财务票据数据新增录入所述用户数据库。本发明技术将有效降低工作人员对于财务票据信息的审核力度,提升其工作效率和准确率,具有良好的积极效果。

技术研发人员:杨志华,郝源,刘杰,杨晴晴,崔春艳,刘雪丽,年福成,张功营,黄侠,王涛,宋小莉,李翔,王潇潇,陈智,杜超,刘静,汪宇宇
受保护的技术使用者:国网安徽省电力有限公司宿州供电公司
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-15134.html

最新回复(0)