本发明涉及ai领域,具体涉及一种基于ai技术的防止办公信息误发送办法。
背景技术:
1、随着人工智能技术的快速发展,办公自动化系统在现代企业中扮演着越来越重要的角色。电子邮件、即时通讯、企业社交平台等通讯工具已成为员工日常沟通的主要方式。然而,信息误发送问题一直是一个普遍存在的困扰。根据2019年一项由tessian公司进行的调查显示,平均每个员工每个月会误发送至少一次信息。这种失误可能导致敏感信息泄露、商业机密外泄、客户信任度下降、法律风险增加等严重后果。因此,开发基于ai技术的防止办公信息误发送方法具有重要的现实意义和应用价值。
2、ai技术在防止办公信息误发送方面具有巨大潜力。通过应用自然语言处理、机器学习、深度学习等技术,可以有效识别和预防信息误发送问题。
技术实现思路
1、为解决上述技术问题,本发明提出了一种基于ai技术的防止办公信息误发送办法,在技术能够理解语言的复杂性和上下文关系,从而更准确地判断信息的意图和适用对象,减少人为失误,确保这些信息不会意外发送给不合适的收件人,从而保护企业的数据安全。
2、为实现上述目的,本发明采取的技术方案是:
3、一种基于ai技术的防止办公信息误发送办法,包括以下步骤:
4、步骤1:用户在群个性设置中,对仅接收群信息选项进行选择;
5、步骤2:用户对信息发送前ai检查选项进行选择;
6、步骤3,转入信息发送前ai敏感词过滤检测机制,识别文字信息,与敏感词库进行比对;
7、步骤4,符合敏感词库,弹出预警确认发送对话框,不符合敏感词库,直接转入发送。
8、进一步,步骤1中户在群个性设置的过程表示为:
9、步骤1.1,用户选择仅接收群信息,用户只能接收该群的信息,不能发送任何信息,此时信息发送前ai检查选项灰色;
10、步骤1.2,用户不选仅接收群信息,用户可接收也可发送群信息。
11、进一步,步骤3中ai敏感词过滤检测机制的过程表示如下:
12、ai检查前需要对用户信息进行分词,通过统计方法模型建立分词模型,分词模型如下所示:
13、步骤3.1.1,准备语料库,将分好词的中文建立语料库,从中统计词频和词之间的邻接关系;
14、步骤3.1.2,对语料库进行预处理,包括去除标点符号、统一字符编码、转换为小写等;
15、步骤3.1.3,遍历预处理后的语料库,统计每个词的出现频次,以及每对词的邻接频次;
16、步骤3.1.4,对于每个词,计算其在语料库中出现的概率:
17、
18、式中,wi表示第i个词;
19、步骤3.1.5,对于每对词(wi,wj),计算其在语料库中出现的概率:
20、
21、步骤3.1.6,使用步骤3.1.4和步骤3.1.5中计算的概率,构建bigram语言模型,这个模型用来评估一个词序列的概率;
22、步骤3.1.7,给定一个未分词的句子s=c1,c2,...,cn,其中ci是句子中的第i个字符,设定分词算法目标:
23、
24、式中,w*表示最优的词序列,即分词结果;w表示所有可能的词序列的集合;p(w)表示词序列w的概率;表示寻找使p(w)最大的w;π表示连乘符号,用于计算多个概率的乘积;p(wi|wi-1)表示在已知前一个词wi-1的条件下,当前词wi出现的条件概率;m表示词序列w中词的个数;i表示迭代变量,用于遍历词序列w中的每一个词;
25、步骤3.1.8,结合步骤3.1.7的分词算法目标,使用动态规划算法:维特比算法,计算最优分词路径,获得用户信息进行分词结果。
26、进一步,步骤3中ai敏感词过滤检测机制的过程表示如下:
27、用户信息进行分词结束后,对每个分词进行编码和解码操作:
28、编码和解码器由词元嵌入层、位置编码、注意力层、位置感知前馈层、残差连接层和归一化层组成;
29、位置编码可能够提示模型单词之间的相对位置关系,表达式如下:
30、
31、式中,pe表示词元的位置编码,pos表示词所在的位置,2i和2i+1表示位置编码向量中的对应维度,d则对应位置编码的总维度;
32、自注意力网络用于提升模型对数据内部复杂关系的理解能力,其表达式如下:
33、
34、式中,a表示注意力权重,sofmax()为softmax函数,q为池化层的输出,k为键,v为值,dk为键的秩;
35、位置感知前馈层接受自注意力子层的输出作为输入,其表达式如下:
36、ffn(a)=relu(aw3+b1)w4+b2
37、式中,w3、w4、b1、b2是位置感知前馈层的参数;
38、归一化层可加速网络训练过程,防止梯度消失或爆炸,采用ln归一化;
39、残差连接层允许梯度直接传播到网络的更深层,有助于训练深层网络,其表达式如下:
40、y=w2σ1(w1u)+wsu
41、式中,y为残差连接层的输出,u是残差连接层的输入,w1和w2是权重矩阵,σ1()是激活函数relu,ws是维度匹配的权重矩阵;
42、前馈网络可对特征进行非线性变换,增强模型的表达能力;
43、o=σ2(∑woy+b)
44、式中,o是前馈网络层输出,y是前馈网络层输入,σ2()是激活函数sigmoid,wo是前馈网络权重,b是前馈网络层偏置;
45、根据编码和解码的输出分类结果来判定用户输入信息是否存在敏感词汇。
46、本发明基于ai技术的防止办公信息误发送办法,有益效果:本发明的技术效果在于:
47、1.本发明传统的信息审查需要人工参与,而本发明技术可以自动执行这一过程,减轻员工负担,提高工作效率。;
48、2.本发明以通过机器学习不断优化模型,适应不同用户的沟通风格和企业的特定需求,提高识别的准确性;
49、3.本发明对于需要遵守特定行业规范和法律标准的企业,可以帮助确保所有发出的信息都符合这些要求,降低违规风险;
50、4.本发明可以轻松集成到现有的it基础设施中,并且可以根据企业的发展需求进行扩展和升级。
1.一种基于ai技术的防止办公信息误发送办法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于ai技术的防止办公信息误发送办法,其特征在于:步骤1中户在群个性设置的过程表示为:
3.根据权利要求1所述的一种基于ai技术的防止办公信息误发送办法,其特征在于:步骤3中ai敏感词过滤检测机制的过程表示如下:
4.根据权利要求1所述的一种基于ai技术的防止办公信息误发送办法,其特征在于:步骤3中ai敏感词过滤检测机制的过程表示如下:
