1.本发明属于数据挖掘领域,具体涉及一种自动化全域媒体数据考评系统及方法。
背景技术:2.融媒体是集广播、电视、网络及新媒体等多种业务为一体的新型媒体形式。随着融媒体的发展,其数据来源维度越来越低,传统媒体的考评模式已经无法适用于具有多数据来源的融媒体考评的需求。为推动媒体深度融合发展各项任务落到实处,每个融媒体中心都建立各自的考核办法,包含了报纸、广播、电视、微信、抖音、客户端、视频号,以及通联外宣等。目前,根据媒体市场调研发现,索贝等公司有电视文稿考评系统,方正公司有报业考评系统,但没有一个能涵盖全域媒体的考评系统。融媒体中心的调研情况表明,目前大部分融媒体中心的考评基本都是人工统计为主,且缺乏有效数字支撑。媒体和考核办法千差万别。每一种媒体都有各自不同特点,如报纸有版面、广播电视考核有新闻串联单、新媒体有传播数据。即使同一种媒体,在不同单位考核办法也不一样,很难按照一种标准进行统一。
3.传统媒体数据来自于索贝、大洋、新奥特等生产平台,通过标准化接口定义,实现数据的存储,新媒体数据统计,局限于外部生产平台,没有文稿库,因此数据统计困难,传统手工统计的方式费时费力且不易保存。
4.为解决上述问题,打破不同制作域之间的壁垒,解决素材孤立、不完整、无关联的问题,亟需设计了一种自动化全域媒体数据考评系统及方法。
技术实现要素:5.本发明的目的在于解决县域技术中融媒体考评数据无法有效整合,自动化程度低的问题,并提供一种自动化全域媒体数据考评系统及方法。
6.本发明所采用的具体技术方案如下:
7.一种自动化全域媒体数据考评系统,其包括:
8.账号管理模块,用于管理参与考评的渠道账号,同时为参与考评人员分配人员账号,并对渠道账号和人员账号与所属的部门、业务矩阵和媒体渠道进行多层级的关联;
9.授权模块,用于分别针对新媒体渠道和传统媒体渠道获取访问媒体渠道数据的用户授权,并对每一种渠道账号的用户授权有效性进行监测,定期通过消息机制通知用户再次授权;
10.自动入库模块,用于针对所有纳入考评的媒体渠道基于用户授权进行媒体数据的全域采集,并通过去重处理后按照数据类型进行分类存储于全域数据库中;所采集的媒体数据包括已通过媒体渠道发布的媒体稿件和已发布媒体稿件的量化数据;再从所述全域数据库中的每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分,并将所提取到的考评指标评分记录至对应的媒体稿件中;
11.计算模块,用于根据每一个媒体稿件中所有考评指标的评分,按照针对该媒体稿件预设的评分算法计算得到该媒体稿件的评价结果,再将该媒体稿件的评价结果关联至对
应关联人员的人员账号中;
12.综合评价模块,用于将所述计算模块得到的评价结果发送至供专家评议的人工考评端,并根据人工考评端的二次考评结果对所述计算模块得到的评价结果进行修正,输出针对媒体稿件或者人员的最终评价结果。
13.作为优选,所述账号管理模块中设置三层架构对账号进行管理,其中第一层用于支持不同部门的新增、删除和修改,第二层用于支持部门中不同业务矩阵的新增、删除和修改,第三层用于支持业务矩阵中不同渠道账号的新增、修改、绑定、解除绑定和删除;同一个账号允许关联不同的层级以及同一层级中的不同节点。
14.作为优选,所述授权模块包括新媒体渠道授权模块和传统媒体渠道授权模块;所述新媒体渠道授权模块通过扫码授权,而传统媒体渠道数据利用token和站点信息进行统一账号授权;新媒体渠道授权模块和传统媒体渠道授权模块在首次获得渠道账号的用户授权后,自动将对应的渠道账号加入监测队列进行授权有效性检测,在用户授权失效前利用预警消息通知用户再次授权,以延续用户授权有效期。
15.作为优选,所述自动入库模块中,当新媒体渠道授权模块和传统媒体渠道授权模块首次获得渠道账号的用户授权后,需读取对应的渠道账号中的所述媒体数据并初始化入库至全域数据库中,并在用户授权有效期内持续检测所述媒体数据的更新并定期入库;当新媒体渠道授权模块和传统媒体渠道授权模块再次获得渠道账号的用户授权后,需对渠道账号中最新的所述媒体数据与全域数据库中已有数据进行数据比对,同步差额数据实现增量入库。
16.作为优选,所述自动入库模块中,从每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分的具体方法为:
17.首先,对当前媒体数据中的媒体稿件进行类别识别,媒体稿件类别包含视频形式的媒体稿件、文本形式的媒体稿件、音频形式的媒体稿件;
18.然后,根据当前媒体数据中媒体稿件的所属类别进行信息提取并根据预设考评指标给出各指标的评分,其中:
19.若当前媒体数据为视频形式的媒体稿件,则通过视频内容识别技术对视频中的正面信息和负面信息进行识别,并根据预设的分类信息评分标准对该视频给出相关考评指标的评分,同时通过人脸识别技术从该视频中识别到对应的主持人以及其他对该视频做出贡献的关联人员;
20.若当前媒体数据为文本形式的媒体稿件,则通过文本内容识别技术对文本中的正面信息和负面信息进行识别,并根据预设的分类信息评分标准对该文本给出相关考评指标的评分,同时通过人名识别技术从该文本中识别到对应的记者、编辑、摄影以及其他对该文本做出贡献的关联人员;
21.若当前媒体数据为音频形式的媒体稿件,则通过音频转译技术将音频转译为文本,再按照与上述文本形式的媒体稿件相同的做法进行信息提取和评分;若音频无法被转译为文本,则通过音频识别技术从该音频中识别正面信息和负面信息,并根据预设的分类信息评分标准对该音频给出相关考评指标的评分,同时识别音频中的主播名字以及其他对该音频做出贡献的关联人员;
22.再后,根据当前媒体数据中的量化数据,按照预设的量化数据评分标准对当前媒
体数据给出相关考评指标的评分;
23.最后,对当前媒体数据中基于媒体稿件得到的评分以及基于量化数据得到的评分进行汇总合并,生成当前媒体数据的考评指标评分。
24.作为优选,所述自动入库模块中,若当前媒体数据为视频形式的媒体稿件,且该视频为包含多个子节目的电视节目视频,则需通过视频关键帧识别技术从视频中抽取关键帧画面,并通过识别关键帧画面的变化对整个电视节目视频按照子节目进行分段,再获取该电视节目视频的节目串联单以及全时长范围内的实时收视率,按照每一个子节目所处的时间段从节目串联单中抽取子节目的主持人以及其他对该视频做出贡献的关联人员,从全时长范围内的实时收视率中提取子节目所处的时间段的收视率数据并加入该子节目的量化数据中。
25.作为优选,所述自动入库模块中还设有素材认领模块,用于供未被自动识别到的人员对媒体数据中的媒体稿件进行认领,并在收到认领指令后向人工审核端发送审核请求,收到审核通过的指令后将发起认领操作的人员与相应的媒体稿件进行关联。
26.作为优选,所述计算模块中包含考核模式选择模块、anfis模型评价模块、划档定分评价模块和评价结果输出模块;
27.所述考核模式选择模块,用于供参与考评媒体稿件所在部门从所有考评指标集合中选择针对参与考评媒体稿件启用的考评指标,同时指定anfis模型评价模块和划档定分评价模块中的一种作为实际启用评价模块;
28.所述anfis模型评价模块,用于根据每一个参与考评媒体稿件启用的考评指标,将所有启用考评指标对应的考评指标评分输入预先经过训练的自适应神经模糊系统anfis模型中,由anfis模型输出最终评分,作为该媒体稿件的评价结果;
29.所述划档定分评价模块,用于根据每一个参与考评媒体稿件启用的考评指标,将每一个启用考评指标对应的考评指标评分按照该指标自身的预设分档赋分规则输出最终评分,以所有启用考评指标对应的最终评分作为该媒体稿件的评价结果;
30.所述评价结果输出模块,用于根据所述考核模式选择模块对每个参与考评媒体稿件指定的实际启用评价模块,将实际启用评价模块对该媒体稿件输出的评价结果关联至该媒体稿件所对应的所有关联人员的人员账号中,形成所述计算模块的最终输出。
31.作为优选,所述考核模式选择模块中,针对所有考评指标集合中的每一个考评指标均设有0-1标识位,一个考评指标被启用时其标识位为1,未启用时其标识位为0,在所述anfis模型评价模块和所述划档定分评价模块进行评分过程中,仅将标识位为1的考评指标纳入评价。
32.另一方面本发明提供了一种利用上述考评系统的自动化全域媒体数据考评方法,其包括:
33.s1、通过所述账号管理模块,对每个参与考评的媒体稿件以及人员分配账号,并将其关联至对应的部门、业务矩阵和媒体渠道中;
34.s2、通过所述授权模块,针对新媒体渠道和传统媒体渠道获取访问媒体渠道数据的用户授权,并通过用户授权有效性监测维持对不同媒体渠道的可访问性;
35.s3、通过所述自动入库模块,在一个考评周期内持续对所有纳入考评的媒体渠道基于用户授权进行媒体数据的全域采集,并通过去重处理后按照数据类型进行分类存储于
全域数据库中;在一个考评周期结束时,从所述全域数据库中的每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分,并将所提取到的考评指标评分记录至对应的媒体稿件中;同时,根据素材认领模块中由未被自动识别到的人员发起的媒体稿件认领请求,通过人工审核对发起认领操作的人员与相应的媒体稿件进行关联,补全每个人员账号在该考评周期内应纳入个人考评的所有媒体稿件;
36.s4、通过所述计算模块,根据每个部门事先针对参与考评媒体稿件启用的考评指标以及指定的实际启用评价模块,基于每一个媒体稿件中所有启用考评指标的评分,利用指定的实际启用评价模块按照评价模块中内置的评分算法计算得到该媒体稿件的评价结果,再将该媒体稿件的评价结果关联至该媒体稿件对应的所有关联人员的人员账号中作为个人考评的依据;
37.s5、通过所述综合评价模块,将所述计算模块得到的评价结果发送至供专家评议的人工考评端,并根据人工考评端的二次考评结果对所述计算模块得到的评价结果进行修正,输出最终的评价结果。
38.本发明相对于现有技术而言,具有以下有益效果:
39.本发明设计了一种自动化全域媒体数据考评系统及方法,该方法跨渠道账号矩阵协同为基准,形成以考核部门为主体的全域渠道矩阵管理,进行账号授权维护、数据自动入库、算法模型计算、综合评价体系。本发明可通过综合评价体系,使用自动化工作流引擎,创建审核流、获取当前指标任务、创建考评实例、结果展示,实现自动化的生产客观指数,工作流式动态考评,提升了融合传播岗位的考评效率和自动化水平。
附图说明
40.图1为一种自动化全域媒体数据考评系统的模块组成示意图。
具体实施方式
41.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。本发明各个实施例中的技术特征在没有相互冲突的前提下,均可进行相应组合。
42.在本发明的一个较佳实施例中,提供了一种自动化全域媒体数据考评系统,通过构建账号管理、授权维护、自动入库服务、计算模型、综合评价等模块,实现全域媒体考评方法的账号集中管理、数据统一入库、智能算法分析展示、数据综合评价。如图1所示,该自动化全域媒体数据考评系统中,包含账号管理模块、授权模块、自动入库模块、计算模块和综合评价模块。下面对该自动化全域媒体数据考评系统的具体模块功能和原理进行展开描述。
43.(1)账号管理模块,用于管理参与考评的渠道账号,同时为参与考评人员分配人员账号,并对渠道账号和人员账号与所属的部门、业务矩阵和媒体渠道进行多层级的关联。
44.作为本发明实施例的一种优选方式,上述账号管理模块中设置三层架构对账号进行管理,其中第一层用于支持不同部门的新增、删除和修改,第二层用于支持部门中不同业
务矩阵的新增、删除和修改,第三层用于支持业务矩阵中不同渠道账号的新增、修改、绑定、解除绑定和删除;同一个账号允许关联不同的层级以及同一层级中的不同节点。
45.上述账号管理模块中的三层架构是一种dbc三层架构管理模式,其以跨渠道账号矩阵协同为基准,形成以考核部门为主体的全域渠道矩阵管理,解决了实际新闻融合生产过程中出现的不同渠道归属同一个业务,不同业务归属同一个部门,数据孤岛、管理难、考核难的问题。在该dbc三层架构管理模式中,d层代表部门层级,b层代表业务矩阵层级,c层代表渠道账号层级。在媒体行业中,部门可代表相应的电视台,业务矩阵可代表电视台中的不同栏目,渠道账号可代表栏目的不同传播渠道,例如分为广播、电视、新媒体三类渠道,具体的新媒体渠道类型又可分为微博渠道、抖音渠道、头条渠道等等。该架构支持按照实际部门的生产业务的实际渠道,可进行灵活的纵向下钻和横向扩展,支持多层级多节点绑定和解绑定,实现了跨业务矩阵跨渠道的部门考核,解决了数据、考核统一抓手的问题。参与考评的渠道账号和人员账号都可以关联至不同的层级以及同一层级中的不同部门/业务矩阵/渠道账号节点。在dbc架构视图下,可按照任意流的方式,进行下一节点的选择,生成自定义账号目录树。此外,该架构支持目录树修改以及目录树结构下的账号数据、考核数据的关系转化。
46.(2)授权模块,用于分别针对新媒体渠道和传统媒体渠道获取访问媒体渠道数据的用户授权,并对每一种渠道账号的用户授权有效性进行监测,定期通过消息机制通知用户再次授权。
47.作为本发明实施例的一种优选方式,上述授权模块包括新媒体渠道授权模块和传统媒体渠道授权模块;所述新媒体渠道授权模块通过扫码授权,而传统媒体渠道数据利用token和站点信息进行统一账号授权;新媒体渠道授权模块和传统媒体渠道授权模块在首次获得渠道账号的用户授权后,自动将对应的渠道账号加入监测队列进行授权有效性检测,在用户授权失效前利用预警消息通知用户再次授权,以延续用户授权有效期。
48.进一步的,在本发明的部分实施例中,新媒体渠道授权模块中,新媒体渠道数据可通过对应渠道账号的管理人员通过各渠道对应的app扫码授权本系统访问其数据;而传统媒体渠道授权模块中传统媒体渠道数据则可以基于传统媒体的实际业务平台利用token和站点信息进行统一账号授权。新媒体及传统媒体渠道在授权后,系统会自动将账号加入监测队列实行有效性检测,同时初始化入库实现文本、视频和阅读数、点赞数等量化数据。其中,在新媒体授权有效性监测队列,通过监测队列构建的账号守护服务探测账号有效期,利用定时服务刷新账号 token,默认初始化用户监测周期为30天,默认账号守护有效期为180天,在达到系统设置的周期软性阈值时利用预警消息通知用户再次授权,用户可通过点击授权链接实现再次授权,系统会自动进入下一个账号守护周期,并利用数据比对技术同步差额数据实现增量入库。而传统媒体授权有效性监测队列中,以48小时作为循环周期利用sitecode(例如云平台上的租户代码)和账号定时加密刷新授权token,该token主要利用用户账号、sitecode和时间戳等信息进行aes加密,该加密token还需要通过接口将其注册至业务生产系统。当然,新媒体渠道授权模块和传统媒体渠道授权模块中的具体授权维护机制,可以根据实际的情况进行调整。本发明通过一套完整的授权有效性检测机制,实现了授权状态激活,避免了授权过期,系统数据断档的问题。
49.(3)自动入库模块,用于针对所有纳入考评的媒体渠道基于用户授权进行媒体数
据的全域采集,并通过去重处理后按照数据类型进行分类存储于全域数据库中;所采集的媒体数据包括已通过媒体渠道发布的媒体稿件和已发布媒体稿件的量化数据;再从所述全域数据库中的每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分,并将所提取到的考评指标评分记录至对应的媒体稿件中。
50.作为本发明实施例的一种优选方式,上述自动入库模块中,当新媒体渠道授权模块和传统媒体渠道授权模块首次获得渠道账号的用户授权后,需读取对应的渠道账号中的所述媒体数据并初始化入库至全域数据库中,并在用户授权有效期内持续检测所述媒体数据的更新并定期入库;当新媒体渠道授权模块和传统媒体渠道授权模块再次获得渠道账号的用户授权后,需对渠道账号中最新的所述媒体数据与全域数据库中已有数据进行数据比对,若存在未被读取数据的缺失时段且存在增量数据时,则同步差额数据实现增量入库。
51.作为本发明实施例的一种优选方式,上述自动入库模块中,从每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分的具体方法为:
52.首先,对当前媒体数据中的媒体稿件进行类别识别,媒体稿件类别包含视频形式的媒体稿件、文本形式的媒体稿件、音频形式的媒体稿件;
53.然后,根据当前媒体数据中媒体稿件的所属类别进行信息提取并根据预设考评指标给出各指标的评分,其中:
54.若当前媒体数据为视频形式的媒体稿件,则通过视频内容识别技术对视频中的正面信息和负面信息进行识别,并根据预设的分类信息评分标准对该视频给出相关考评指标的评分,同时通过人脸识别技术从该视频中识别到对应的主持人以及其他对该视频做出贡献的关联人员;
55.若当前媒体数据为文本形式的媒体稿件,则通过文本内容识别技术对文本中的正面信息和负面信息进行识别,并根据预设的分类信息评分标准对该文本给出相关考评指标的评分,同时通过人名识别技术从该文本中识别到对应的记者、编辑、摄影以及其他对该文本做出贡献的关联人员;
56.若当前媒体数据为音频形式的媒体稿件,则通过音频转译技术将音频转译为文本,再按照与上述文本形式的媒体稿件相同的做法进行信息提取和评分;若音频无法被转译为文本,则通过音频识别技术从该音频中识别正面信息和负面信息,并根据预设的分类信息评分标准对该音频给出相关考评指标的评分,同时识别音频中的主播名字以及其他对该音频做出贡献的关联人员;
57.再后,根据当前媒体数据中的量化数据,按照预设的量化数据评分标准对当前媒体数据给出相关考评指标的评分;
58.最后,对当前媒体数据中基于媒体稿件得到的评分以及基于量化数据得到的评分进行汇总合并,生成当前媒体数据的考评指标评分。
59.需要说明的是,本发明中对于一份媒体稿件,对其做出贡献的关联人员可根据考评规则进行设定。例如,对于文本类稿件,撰写稿件的记者、相应的编辑、提供配图的摄影人员,均可作为对其做出贡献的关联人员。
60.另外,在上述自动入库模块中,不同类别媒体稿件中自动提取信息的方式都不同,文本、音频、视频中的内容提取均具有成熟的现有技术,亦可借用商业的智能化审校平台来实现。每一类媒体稿件中具体需要提取的正面信息和负面信息需要根据实际的考评指标进
行确定。在本发明的部分实施例中,可以将媒体稿件按照视频、文本、音频进行原始数据分类存储,实现稿件标签化处理,获得正面标签和负面标签并纳入考核评价。例如,音频库通过底层语音识别后分成两大类:可转译和不可转译,不可转译的音频通过识别音频中的敏感环境音,进行涉黄、噪声等标签化处理;可转译的音频则将识别出来的文字,进行文本智能化审校,实现敏感词判断,按照涉政、涉恐、涉黄等风险等级标签化处理,存入考评指数库。文本库,调用智能审校能力进行敏感信息标签化处理,同时,调用相似度算法模型,进行数据去重;再通过文本识别技术,提取成品稿件库中的记者、编辑、摄影、摄像等角色,形成稿件人员考核指数。视频库调用系统构建的,进行场景识别、人脸识别、色情、暴恐涉政、广告内容等识别,对存在敏感风险图像的稿件,打上风险等级标签;通过人脸识别,提取成品稿件库中的主持人,实现稿件主持人考核指数。
61.在进行人员识别时,可以通过nlp的实体识别技术识别词性标注为人名的词,根据人名前置的角色名词,将人名分别归入记者、编辑、摄影、摄像等角色中,实现媒体稿件的创作人员角色自动提取。
62.另外,需要说明的是,具体的正面信息和负面信息的标签,是可以根据实际情况进行调整和优化的。在本发明的部分实施例中,可以对自动入库模块录入的信息设置敏感信息安全化审核模板,并行进行人脸、场景、涉黄内容、暴恐涉政内容、广告内容识别,汇聚识别结果,经过加工处理后纳入考核指数,以进行稿件正面、负面评分。按照上述识别类型,对稿件进行不同的风险等级划分打标签。
63.另外,需要说明的是,本发明中针对媒体数据所采集的量化数据,需要根据具体的考评指标来设计。媒体稿件的传播率、影响力、获奖信息、领导批示等均可以作为量化数据中的指标。不同的量化数据需要对接相应的数据源接口,对此不再展示描述。
64.由此,在一较佳实施例中,本发明所构建的所有考评指标集合中,可以分为三类不同的指标指数,若当前指标为涉黄、涉暴、涉恐等敏感指标,则纳入负向指数库,若当前指标为原创、外宣、获奖(大数据局对接数据集,金潮奖、金帆奖、王选奖等数据接口对接)等,则纳入正向指数库;对自动获取的阅读数、点赞数等量化数据,则纳入一般指数库。在另一实施例中,可以通过前述的数据去重、广播语音识别、电视视频关键帧抽取、图片识别、文本识别、原创性判断等技术,实现渠道、栏目、作者、稿件、串联单、视频、音频、实时收视收听、历史收视收听、报纸版面、错字率、涉黄涉暴、政治敏感、静帧率等纳入考评指标集合。
65.进一步的,作为本发明实施例的一种优选方式,上述自动入库模块中,若当前媒体数据为视频形式的媒体稿件,且该视频为包含多个子节目的电视节目视频,则需通过视频关键帧识别技术从视频中抽取关键帧画面,并通过识别关键帧画面的变化对整个电视节目视频按照子节目进行分段,再获取该电视节目视频的节目串联单以及全时长范围内的实时收视率,按照每一个子节目所处的时间段从节目串联单中抽取子节目的主持人以及其他对该视频做出贡献的关联人员,从全时长范围内的实时收视率中提取子节目所处的时间段的收视率数据并加入该子节目的量化数据中。通过这种做法,可以将包含众多子节目的电视节目视频,按照子节目分别进行考评,以便于细化不同人员的贡献。
66.作为本发明实施例的一种优选方式,上述自动入库模块中还设有素材认领模块,用于供未被自动识别到的人员对媒体数据中的媒体稿件进行认领,并在收到认领指令后向人工审核端发送审核请求,收到审核通过的指令后将发起认领操作的人员与相应的媒体稿
件进行关联。
67.(4)计算模块,用于根据每一个媒体稿件中所有考评指标的评分,按照针对该媒体稿件预设的评分算法计算得到该媒体稿件的评价结果,再将该媒体稿件的评价结果关联至对应关联人员的人员账号中。
68.作为本发明实施例的一种优选方式,上述计算模块中包含考核模式选择模块、 anfis模型评价模块、划档定分评价模块和评价结果输出模块;
69.所述考核模式选择模块,用于供参与考评媒体稿件所在部门从所有考评指标集合中选择针对参与考评媒体稿件启用的考评指标,同时指定anfis模型评价模块和划档定分评价模块中的一种作为实际启用评价模块;
70.所述anfis模型评价模块,用于根据每一个参与考评媒体稿件启用的考评指标,将所有启用考评指标对应的考评指标评分输入预先经过训练的自适应神经模糊系统anfis模型中,由anfis模型输出最终评分,作为该媒体稿件的评价结果;
71.所述划档定分评价模块,用于根据每一个参与考评媒体稿件启用的考评指标,将每一个启用考评指标对应的考评指标评分按照该指标自身的预设分档赋分规则输出最终评分,以所有启用考评指标对应的最终评分作为该媒体稿件的评价结果;
72.所述评价结果输出模块,用于根据所述考核模式选择模块对每个参与考评媒体稿件指定的实际启用评价模块,将实际启用评价模块对该媒体稿件输出的评价结果关联至该媒体稿件所对应的所有关联人员的人员账号中,形成所述计算模块的最终输出。
73.需要说明的是,自适应神经模糊系统中的anfis算法属于现有技术,下面简单介绍anfis算法模型训练的过程:
74.s1:确认输入节点数量,每个节点对应一个考评指标。
75.s2:选择钟型隶属度函数对ui(i=1,
…
,14)进行模糊化处理,公式如下:其中,ai和bi为前向参数,ci为后向参数。
76.s3:归一化处理考核指标对应的各项权重:
[0077][0078][0079]
s4:提取训练样本100条,根据样本训练anfis模型,得出仿真数据,反复进行参数调整,直到误差在合理范围内,确定最终参数,模型确定。
[0080]
s5:根据模型,确定实际数据的最终得分结果y,验证评分体系的合理性。验证合理后,模型训练完毕,即可投入应用。
[0081]
需要说明的是,上述划档定分评价模块中,每一个考评指标所划定的计分档次可根据实际进行调整。例如,某一指标达到1000,即可记入基础分为50,在 1000基础上进一步提高,可在基础分基础上增加分值。每个考评指标均可自定义划档定分模型,如选择阅读数作为考核指标,选择原创率作为考核指标,均可各自设置档数和基础分。
[0082]
需要说明的是,在本发明的自动入库模块中,其所需设置的考核指标应当尽量齐全,每个部门的个性化考核指标可从中通过标识位进行选定。在本发明的一个较佳实施例中,可按照工作量、新闻质量、新闻传播影响力、新闻外宣4个维度,设置发布量、原创率、错字率、甲级率、合格率、不良图片率、不良视频率、不良文字率、不良语音率、收视率、收听率、
点击量、转载量、央媒转载率、领导表扬率、政府表扬率共16个指标建立考评指标集合,可作为考核项,支持多选、单选和全选此16项考核指标。
[0083]
作为本发明实施例的一种优选方式,上述考核模式选择模块中,针对所有考评指标集合中的每一个考评指标均设有0-1标识位,一个考评指标被启用时其标识位为1,未启用时其标识位为0,在所述anfis模型评价模块和所述划档定分评价模块进行评分过程中,仅将标识位为1的考评指标纳入评价。
[0084]
(5)综合评价模块,用于将所述计算模块得到的评价结果发送至供专家评议的人工考评端,并根据人工考评端的二次考评结果对所述计算模块得到的评价结果进行修正,输出针对媒体稿件或者人员的最终评价结果。
[0085]
需要说明的是,上述人工考评端可以是一个单独的模块,由相关的专家或者对评分具有调整权的人员进行登录使用。
[0086]
上述自动化全域媒体数据考评系统中的账号管理模块、授权模块、自动入库模块、计算模块和综合评价模块,可以通过使用自动化工作流引擎来自动实现动态考评。使用工作流一共包括四个部分,分别是创建审核流、获取当前指标任务、创建考评实例、结果展示。
[0087]
创建审核流:对文稿并行调用来源判断服务、语音识别、文本智能审校、视频敏感风险审校等审核流,进行风险等级标签化处理。
[0088]
获取当前指标任务:对智能审核标签化结果进行分类纳入指标库,若当前指标为涉黄、涉暴、涉恐等敏感指标,则纳入负向指数库,若当前指标为原创、外宣、获奖(大数据局对接数据集,金潮奖、金帆奖、王选奖等数据接口对接)等,则纳入正向指数库;对自动获取的阅读数、点赞数等量化指标,则纳入一般指数库。
[0089]
创建考评实例:区分三个库中的指标标识位,按照不同标识位,去动态选择正向、负向、一般指数库中的指数,并计算考评结果。
[0090]
根据考评实例结果:对考评结果进行专家评议,提出修改意见,完善数据评价结果,并以报表形式展示,至此,综合评价工作引擎结束。
[0091]
由此可见,本发明不仅可以通过自动的处理模块输出考评结果,也可以通过综合评价模块对考评结果进行数据碰撞,从全局角度对稿件和作者进行评价,支持专家评议后进行评价校准,根据实际情况,对原创稿件、领导嘉奖、宣传任务等类型稿件进行人工二次考评,可避免唯数据论导致的考核偏差。
[0092]
另外,本发明中还基于上述考评系统,提供了一种自动化全域媒体数据考评方法,其步骤如下:
[0093]
s1、通过所述账号管理模块,对每个参与考评的媒体稿件以及人员分配账号,并将其关联至对应的部门、业务矩阵和媒体渠道中;
[0094]
s2、通过所述授权模块,针对新媒体渠道和传统媒体渠道获取访问媒体渠道数据的用户授权,并通过用户授权有效性监测维持对不同媒体渠道的可访问性;
[0095]
s3、通过所述自动入库模块,在一个考评周期内持续对所有纳入考评的媒体渠道基于用户授权进行媒体数据的全域采集,并通过去重处理后按照数据类型进行分类存储于全域数据库中;在一个考评周期结束时,从所述全域数据库中的每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分,并将所提取到的考评指标评分记录至对应的媒体稿件中;同时,根据素材认领模块中由未被自动识别到的人员发起的媒体稿件认
领请求,通过人工审核对发起认领操作的人员与相应的媒体稿件进行关联,补全每个人员账号在该考评周期内应纳入个人考评的所有媒体稿件;
[0096]
s4、通过所述计算模块,根据每个部门事先针对参与考评媒体稿件启用的考评指标以及指定的实际启用评价模块,基于每一个媒体稿件中所有启用考评指标的评分,利用指定的实际启用评价模块按照评价模块中内置的评分算法计算得到该媒体稿件的评价结果,再将该媒体稿件的评价结果关联至该媒体稿件对应的所有关联人员的人员账号中作为个人考评的依据;
[0097]
s5、通过所述综合评价模块,将所述计算模块得到的评价结果发送至供专家评议的人工考评端,并根据人工考评端的二次考评结果对所述计算模块得到的评价结果进行修正,输出最终的评价结果。最终的评价结果可以报表形式输出。
[0098]
需要注意的是,本发明的上述考评过程中,考评的对象注意是媒体稿件,而对应人员的考评则可以以媒体稿件的考评为基础进行一步根据人员考评规则进行。具体的人员考评规则属于可根据实际调整的规则,以各部门的内部规章制度为准,对此不作限定。
[0099]
综上,本发明设计了一种自动化全域媒体数据考评系统及方法,通过授权,构建以多源多态海量数据为核心的大数据中心,通过数据去重、广播语音识别、电视视频关键帧抽取、图片识别、文本识别、原创性判断等技术,提取渠道、栏目、作者、稿件、串联单、视频、音频、实时收视收听、历史收视收听、报纸版面、错字率、涉黄涉暴、政治敏感、静帧率等数据,选择上述字段进行考核指标设定,通过anfis算法或者分段计分的方式,结合专家评议,进行综合考评。
[0100]
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
技术特征:1.一种自动化全域媒体数据考评系统,其特征在于,包括:账号管理模块,用于管理参与考评的渠道账号,同时为参与考评人员分配人员账号,并对渠道账号和人员账号与所属的部门、业务矩阵和媒体渠道进行多层级的关联;授权模块,用于分别针对新媒体和传统媒体获取访问媒体渠道数据的用户授权,并对每一种渠道账号的用户授权有效性进行监测,定期通过消息机制通知用户再次授权;自动入库模块,用于针对所有纳入考评的媒体渠道基于用户授权进行媒体数据的全域采集,并通过去重处理后按照数据类型进行分类存储于全域数据库中;所采集的媒体数据包括已通过媒体渠道发布的媒体稿件和已发布媒体稿件的量化数据;再从所述全域数据库中的每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分,并将所提取到的考评指标评分记录至对应的媒体稿件中;计算模块,用于根据每一个媒体稿件中所有考评指标的评分,按照针对该媒体稿件预设的评分算法计算得到该媒体稿件的评价结果,再将该媒体稿件的评价结果关联至对应关联人员的账号中;综合评价模块,用于将所述计算模块得到的评价结果发送至供专家评议的人工考评端,并根据人工考评端的二次考评结果对所述计算模块得到的评价结果进行修正,输出针对媒体稿件或者人员的最终评价结果。2.如权利要求1所述的自动化全域媒体数据考评系统,其特征在于,所述账号管理模块中设置三层架构对账号进行管理,其中第一层用于支持不同部门的新增、删除和修改,第二层用于支持部门中不同业务矩阵的新增、删除和修改,第三层用于支持业务矩阵中不同渠道账号的新增、修改、绑定、解除绑定和删除;同一个账号允许关联不同的层级以及同一层级中的不同节点。3.如权利要求1所述的自动化全域媒体数据考评系统,其特征在于,所述授权模块包括新媒体渠道授权模块和传统媒体渠道授权模块;所述新媒体渠道授权模块通过扫码授权,而传统媒体渠道数据利用token和站点信息进行统一账号授权;新媒体渠道授权模块和传统媒体渠道授权模块在首次获得渠道账号的用户授权后,自动将对应的渠道账号加入监测队列进行授权有效性检测,在用户授权失效前利用预警消息通知用户再次授权,以延续用户授权有效期。4.如权利要求1所述的自动化全域媒体数据考评系统,其特征在于,所述自动入库模块中,当新媒体渠道授权模块和传统媒体渠道授权模块首次获得渠道账号的用户授权后,需读取对应的渠道账号中的所述媒体数据并初始化入库至全域数据库中,并在用户授权有效期内持续检测所述媒体数据的更新并定期入库;当新媒体渠道授权模块和传统媒体渠道授权模块再次获得渠道账号的用户授权后,需对渠道账号中最新的所述媒体数据与全域数据库中已有数据进行数据比对,同步差额数据实现增量入库。5.如权利要求1所述的自动化全域媒体数据考评系统,其特征在于,所述自动入库模块中,从每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分的具体方法为:首先,对当前媒体数据中的媒体稿件进行类别识别,媒体稿件类别包含视频形式的媒体稿件、文本形式的媒体稿件、音频形式的媒体稿件;然后,根据当前媒体数据中媒体稿件的所属类别进行信息提取并根据预设考评指标给
出各指标的评分,其中:若当前媒体数据为视频形式的媒体稿件,则通过视频内容识别技术对视频中的正面信息和负面信息进行识别,并根据预设的分类信息评分标准对该视频给出相关考评指标的评分,同时通过人脸识别技术从该视频中识别到对应的主持人以及其他对该视频做出贡献的关联人员;若当前媒体数据为文本形式的媒体稿件,则通过文本内容识别技术对文本中的正面信息和负面信息进行识别,并根据预设的分类信息评分标准对该文本给出相关考评指标的评分,同时通过人名识别技术从该文本中识别到对应的记者、编辑、摄影以及其他对该文本做出贡献的关联人员;若当前媒体数据为音频形式的媒体稿件,则通过音频转译技术将音频转译为文本,再按照与上述文本形式的媒体稿件相同的做法进行信息提取和评分;若音频无法被转译为文本,则通过音频识别技术从该音频中识别正面信息和负面信息,并根据预设的分类信息评分标准对该音频给出相关考评指标的评分,同时识别音频中的主播名字以及其他对该音频做出贡献的关联人员;再后,根据当前媒体数据中的量化数据,按照预设的量化数据评分标准对当前媒体数据给出相关考评指标的评分;最后,对当前媒体数据中基于媒体稿件得到的评分以及基于量化数据得到的评分进行汇总合并,生成当前媒体数据的考评指标评分。6.如权利要求5所述的自动化全域媒体数据考评系统,其特征在于,所述自动入库模块中,若当前媒体数据为视频形式的媒体稿件,且该视频为包含多个子节目的电视节目视频,则需通过视频关键帧识别技术从视频中抽取关键帧画面,并通过识别关键帧画面的变化对整个电视节目视频按照子节目进行分段,再获取该电视节目视频的节目串联单以及全时长范围内的实时收视率,按照每一个子节目所处的时间段从节目串联单中抽取子节目的主持人以及其他对该视频做出贡献的关联人员,从全时长范围内的实时收视率中提取子节目所处的时间段的收视率数据并加入该子节目的量化数据中。7.如权利要求1所述的自动化全域媒体数据考评系统,其特征在于,所述自动入库模块中还设有素材认领模块,用于供未被自动识别到的人员对媒体数据中的媒体稿件进行认领,并在收到认领指令后向人工审核端发送审核请求,收到审核通过的指令后将发起认领操作的人员与相应的媒体稿件进行关联。8.如权利要求1所述的自动化全域媒体数据考评系统,其特征在于,所述计算模块中包含考核模式选择模块、anfis模型评价模块、划档定分评价模块和评价结果输出模块;所述考核模式选择模块,用于供参与考评媒体稿件所在部门从所有考评指标集合中选择针对参与考评媒体稿件启用的考评指标,同时指定anfis模型评价模块和划档定分评价模块中的一种作为实际启用评价模块;所述anfis模型评价模块,用于根据每一个参与考评媒体稿件启用的考评指标,将所有启用考评指标对应的考评指标评分输入预先经过训练的自适应神经模糊系统anfis模型中,由anfis模型输出最终评分,作为该媒体稿件的评价结果;所述划档定分评价模块,用于根据每一个参与考评媒体稿件启用的考评指标,将每一个启用考评指标对应的考评指标评分按照该指标自身的预设分档赋分规则输出最终评分,
以所有启用考评指标对应的最终评分作为该媒体稿件的评价结果;所述评价结果输出模块,用于根据所述考核模式选择模块对每个参与考评媒体稿件指定的实际启用评价模块,将实际启用评价模块对该媒体稿件输出的评价结果关联至该媒体稿件所对应的所有关联人员的人员账号中,形成所述计算模块的最终输出。9.如权利要求8所述的自动化全域媒体数据考评系统,其特征在于,所述考核模式选择模块中,针对所有考评指标集合中的每一个考评指标均设有0-1标识位,一个考评指标被启用时其标识位为1,未启用时其标识位为0,在所述anfis模型评价模块和所述划档定分评价模块进行评分过程中,仅将标识位为1的考评指标纳入评价。10.一种利用如权利要求1~8任一所述的考评系统的自动化全域媒体数据考评方法,其特征在于,包括:s1、通过所述账号管理模块,对每个参与考评的媒体稿件以及人员分配账号,并将其关联至对应的部门、业务矩阵和媒体渠道中;s2、通过所述授权模块,针对新媒体渠道和传统媒体渠道获取访问媒体渠道数据的用户授权,并通过用户授权有效性监测维持对不同媒体渠道的可访问性;s3、通过所述自动入库模块,在一个考评周期内持续对所有纳入考评的媒体渠道基于用户授权进行媒体数据的全域采集,并通过去重处理后按照数据类型进行分类存储于全域数据库中;在一个考评周期结束时,从所述全域数据库中的每一条媒体数据中提取对其做出贡献的关联人员以及预设考评指标的评分,并将所提取到的考评指标评分记录至对应的媒体稿件中;同时,根据素材认领模块中由未被自动识别到的人员发起的媒体稿件认领请求,通过人工审核对发起认领操作的人员与相应的媒体稿件进行关联,补全每个人员账号在该考评周期内应纳入个人考评的所有媒体稿件;s4、通过所述计算模块,根据每个部门事先针对参与考评媒体稿件启用的考评指标以及指定的实际启用评价模块,基于每一个媒体稿件中所有启用考评指标的评分,利用指定的实际启用评价模块按照评价模块中内置的评分算法计算得到该媒体稿件的评价结果,再将该媒体稿件的评价结果关联至该媒体稿件对应的所有关联人员的人员账号中作为个人考评的依据;s5、通过所述综合评价模块,将所述计算模块得到的评价结果发送至供专家评议的人工考评端,并根据人工考评端的二次考评结果对所述计算模块得到的评价结果进行修正,输出最终的评价结果。
技术总结本发明公开了一种全域媒体数据自动化考评系统及方法,属于数据挖掘领域。本发明设计了一种自动化全域媒体数据考评系统及方法,该方法跨渠道账号矩阵协同为基准,形成以考核部门为主体的全域渠道矩阵管理,进行账号授权维护、数据自动入库、算法模型计算、综合评价体系。本发明可通过综合评价体系,使用自动化工作流引擎,创建审核流、获取当前指标任务、创建考评实例、结果展示,实现自动化的生产客观指数,工作流式动态考评,提升了融合传播岗位的考评效率和自动化水平。考评效率和自动化水平。考评效率和自动化水平。
技术研发人员:叶灵 郑烊 汤振华 励森源 李洪振 张胜龙 林豪帆 潘宁宁 刘贇 韩明初 鲜沁雨 蒋逸铭
受保护的技术使用者:浙江广播电视集团
技术研发日:2022.06.02
技术公布日:2022/11/1