1.本技术涉及互联网技术领域,并且更具体地,涉及一种信息推荐方法、装置、电子设备和存储介质。
背景技术:2.随着互联网技术的快速发展,人们获取信息的途径越来越便捷,每天都会接收到海量的信息,然而,这些信息往往缺乏针对性,无法满足人们的个性化需求。
技术实现要素:3.根据本技术的实施例,提供了一种信息推荐方法、装置、电子设备和存储介质。
4.在本技术的第一方面,提供了一种信息推荐方法。该方法包括:。
5.步骤s100:获取用户第一预设时间内的浏览过的文章的文章信息;步骤s200:根据所述文章信息,确定对应每篇文章关键词信息;步骤s300:根据所述关键词信息和预设的确认规则确定每篇文章所属的文章类型以及每种文章类型中的文章数量;步骤s400:根据所述文章类型、每种文章类型中的文章数量和预设的推荐规则确定文章推荐策略。
6.可选的,所述推荐规则包括:根据所述文章类型和每种文章类型中的文章数量,确定每种文章类型在所有文章类型中的参考比重;据所述文章类型和每种文章类型的所述参考比重,向用户推荐属于所述文章类型的文章,且推荐的每一文章类型中的文章数量在推荐的所有文章数量中的所占的推荐比重与所述参考比重一致。
7.可选的,,所述推荐规则还包括:在向用户推荐文章之前,根据每种文章类型的参考比重,滤除参考比重低于预设比重值的文章类型。
8.可选的,在步骤s400之后,还包括:步骤s500:获取用户第一预设时间内的总浏览量,并根据所述浏览量和第一预设时间确定用户单位时间内的浏览量;步骤s600:依据预设时间调整梯度,缩短所述第一预设时间;步骤s700:依据预设比重调整梯度,提升所述预设比重值;步骤s800:循环执行步骤s100-步骤s700,直至所述用户单位时间内的浏览量出现下降趋势。
9.可选的,在执行步骤s800之后,还包括:每间隔第二预设时间,依据所述文章推荐策略,向用户推荐文章;在执行所述步骤s100-步骤s700的过程中,所述第二预设时间等于所述第一预设
时间;在所述用户单位时间内的浏览量出现下降趋势时,延长所述第二预设时间。
10.可选的,所述步骤s200包括:匹配所述文章信息和预设关键词库,确定备选词和每个备选词的数量;根据每个备选词的数量对备选词降序排列;依据排列顺序,筛选前预设个数的备选词为关键词。
11.可选的,所述确认规则包括:基于k近邻算法,根据每篇文章的关键词信息确定每篇文章所属的文章类型;统计得到每种文章类型中的文章数量。
12.本技术公开的一种信息推荐方法,能够获取用户的历史浏览过的文章的文章信息,并提取文章信息中的关键词信息,再通过k近邻算法确定用户浏览过的文章的文章类型,并进一步计算得到每种文章类型中的文章数量,依据上述信息,可以推算用户喜好的文章类型,并根据用户喜好向用户推荐文章,以此方式,可以是推荐的文章更符合用户喜好,进而提高文章的点击量和用户黏性。
13.在本技术的第二方面,提供了一种信息推送装置。该装置包括:获取模块,用于获取用户第一预设时间内的浏览过的文章的文章信息;查找模块,用于根据所述文章信息,确定对应每篇文章关键词信息;确定模块,用于根据所述关键词信息和预设的确认规则确定每篇文章所属的文章类型以及每种文章类型中的文章数量;处理模块,用于根据所述文章类型、每种文章类型中的文章数量和预设的推荐规则确定文章推荐策略。
14.在本技术的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
15.在本技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本技术的第一方面的方法。
16.应当理解,发明内容部分中所描述的内容并非旨在限定本技术的实施例的关键或重要特征,亦非用于限制本技术的范围。本技术的其它特征将通过以下的描述变得容易理解。
附图说明
17.结合附图并参考以下详细说明,本技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了根据本技术的实施例1的一种信息推荐方法的流程图;图2示出了根据本技术的实施例2的浏览量曲线。
18.图3示出了根据本技术的实施例一种信息推荐装置的方框图;图4示出了适于用来实现本技术实施例的终端设备或服务器的结构示意图。
具体实施方式
19.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例
中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本技术保护的范围。
20.随着互联网技术的快速发展,人们获取信息的途径越来越便捷,每天都会接收到海量的信息,然而,平台在向用户推送信息时,往往因为无法定位用户的喜好,推送的信息与用户喜好不匹配,导致用户点击量低、黏性低等问题,因此,如何精准定位用户喜好成为亟待解决的问题。
21.本技术中,获取用户在第一预设时间内浏览过的文章的文章信息,并且根据文章信息确定文章类型、以及每种文章类型中的文章数量,以此来判断用户喜好的文章类型,并且在向用户推送文章时,依据上述的文章类型和每种文章类型中的文章数量,制定文章推荐策略,并根据文章推荐策略来向用户推荐文章,以此来提高推荐的文章与用户喜好的契合度,进而提高文章的点击量和用户黏性。
22.图1示出了根据本技术实施例的一种信息推荐方法的流程图。方法可以由电子设备执行。
23.实施例1:步骤s100:获取用户第一预设时间内的浏览过的文章的文章信息。
24.在用户登录个人账号后,获取用户在第一预设时间浏览过的所有文章的文章信息,文章信息可以包括文章标题、文章摘要以及文章内容中的一种或几种。第一预设时间可以是一个月、15天、10天或7天等。在获取用户浏览过的文章时,以获取的时间点终止点,并向前推第一预设时间,确定起始点,获取起始点与终止点之间用户浏览过的文章。
25.步骤s200:根据所述文章信息,确定对应每篇文章关键词信息。
26.在本技术实施例中,获取文章关键词的方式可以是,预设关键词库,关键词库内存储有能够体现领域内关键技术的关键词,在获取任一篇文章的关键词时,可以是将文章信息与预设关键词库匹配,将匹配成功的词语做为该篇文章的备选词,备选词可以有多个,并且在同一篇文章中,同一备选词也可能多次出现。为了更精确的确定文章的关键词,可以是确定文章的全部备选词和每个备选词的数量,再根据关键词数量对备选词降序排列,依据排列顺序,选取排名靠前的预设个数的备选词为关键词,此处的预设个数的最佳数量为1-5个,当然,也可以是其他数量,在此不做限定。
27.在将文章信息与预设关键词库匹配时,文章信息可以仅选用文章标题,这样可以减少运算量,提高运算效率,当然,为了提高文章与关键词的匹配度,还可以是将文章标题和文章摘要同于与预设关键词库匹配,再进一步的,可以同时将文章标题、文中摘要和文章内容与关键词库匹配。
28.步骤s300:根据所述关键词信息和预设的确认规则确定每篇文章所属的文章类型以及每种文章类型中的文章数量。
29.确认规则可以是基于k近邻算法,根据每篇文章的关键词信息确定每篇文章所述的文章类型,然后,在统计得到每种文章类型中的文章数量。
30.其中,k近邻算法在本技术中的应用方式可以是预设有文章样本库,文章样本库中存储有大量的文章样本,文章样本包括文章的关键词信息和文章所属的文章类型。
31.在应用时,以确认一篇文章的文章类型为例,将该篇文章作为输入例输入到k近邻
算法中,k近邻算法依据输入例的关键词信息,筛选与输入例相近的多篇文章样本,根据每篇文章样本所述的文章类型,对多篇文章样本归类,确定包括最多文章样本的文章类型,为输入例的文章类型。由于k近邻算法为本领域常用技术手段,在此不做赘述。
32.将用户在第一预设时间内浏览过的文章全部输入到k近邻算法中,便可以得到全部文章的文章类型,然后计算得到每种文章类型中的文章数量。
33.步骤s400:根据所述文章类型、每种文章类型中的文章数量和预设的推荐规则确定文章推荐策略。
34.在本技术实施例中,推荐规则可以是:根据文章类型和每种文章类型中的文章数量,确定每种文章类型在所有文章类型中的参考比重;根据文章类型和每种文章类型的参考比重,向用户推荐属于该文章类型的文章,且推荐的每一文章类型中的文章数量在推荐的所有文章数量中所占的推荐比重与上述参考比重一致。
35.其中,确定参考比重的方式可以是,将每种文章类型中的文章数量与用户流浪的文章总量做除法运算,确认推荐比重的方式可以是将推荐的每一文章类型中的文章数量与推荐的所有文章数量做除法运算。
36.在一种较佳的示例中,用户浏览过的文章类型通常较多,其中不乏用户点击后发现不感兴趣的文章,因此,推荐规则还可以包括:在向用户推荐文章之前,根据每种文章类型的参考比重,滤除参考比重低于预设比重值的文章类型。
37.其中,预设比重值可以是技术人员依据经验确定的,可以是0.01、0.1或0.2,当然也可以是其他数值。
38.本技术实施例公开的一种信息推荐方法,能够获取用户的历史浏览过的文章的文章信息,并提取文章信息中的关键词信息,再通过k近邻算法确定用户浏览过的文章的文章类型,并进一步计算得到每种文章类型中的文章数量,依据上述信息,可以推算用户喜好的文章类型,并根据用户喜好向用户推荐文章,以此方式,可以是推荐的文章更符合用户喜好,进而提高文章的点击量和用户黏性。
39.实施例2:本技术实施例与实施例1的区别在于,在步骤s400之后,还包括:步骤s500:获取用户第一预设时间内的总浏览量,并根据所述浏览量和第一预设时间确定用户单位时间内的浏览量。
40.步骤s600:依据预设时间调整梯度,缩短所述第一预设时间。
41.步骤s700:依据预设比重调整梯度,提升所述预设比重值。
42.步骤s800:循环执行步骤s100-步骤s700,直至所述用户单位时间内的浏览量出现下降趋势。
43.为了在向用户推荐文章后,可以根据用户反馈及时调整推荐策略,本技术实施例可以在向用户推荐文章,在第一预设时间后,获取用户在第一预设时间内的总流浪量,并计算得到用户单位时间内的浏览量,以此来体现用户文章推荐策略的效果。其中,单位时间可以1天或1小时。
44.在本技术实施例中,为了快速锁定用户喜好的文章类型,可以是逐渐缩短第一预
设时间,并提升预设比重值。其中,缩短第一预设时间的目的是,在向用户推荐文章后,可以根据用户的反馈及时调整推荐策略,并且随着推荐的文章类型的逐渐集中,越是近期浏览的文章信息,越能够体现文章推荐策略的效果。提升预设比重值的目的则是可以随着文章推荐策略的调整,逐渐将用户喜爱的文章类型集中化,以精确定位用户喜好。
45.在本技术实施例中,预设时间调整梯度可以是2天,也可以是1天,预设比重调整梯度可以是0.05,也可以是0.1,可视具体情况而定。
46.在每次获取用户单位时间内的浏览量后,可以生成浏览量曲线,用户单位时间内浏览量出现下降趋势时,停止上述的循环,确定最后一次生成的文章推荐策略为最终的文章推荐策略。
47.在本技术实施例中,可以是每间隔第二预设时间,根据文章推荐策略,更新一次向用户推荐的文章,在执行步骤s100-步骤s700的过程中,第二预设时间等于所述第一预设时间;在用户单位时间内的浏览量出现下降趋势时,由于文章推荐策略已经确定,可以延长所述第二预设时间。
48.在一个具体的示例中,起始的第一预设时间为7天,首先获取用户历史7天内流浪过的文章信息,确定每篇文章的文章类型和每种文章类型中的文章数量,确定每种文章类型的参考比重,滤除低于参考比重低于0.01的文章类型,将剩余文章类型的参考比重作为推荐比重,进而确定文章推荐策略,向用户推荐文章。
49.7天后,获取用户在7天内的总浏览量,以总浏览量为70篇、单位时间为1天为例,则用户在历史7天内单位时间内的浏览量为10篇。然后将第一预设预设时间调整为5天,将预设比重值调整为0.1,在根据历史5天内浏览的文章信息,确定文章推荐策略,向用户推荐文章。
50.5天后,获取用户在历史5天内单位时间内的浏览量为20篇。在调整第一预设时间为3天,预设比重值为0.2,再根据历史3天内的浏览过的文章,确定文章推荐策略,向用户推荐文章。
51.3天后,获取用户在历史3天内单位时间内的浏览量为30篇。在调整第一预设时间为1天,预设比重值为0.5,再根据历史1天内的浏览过的文章,确定文章推荐策略,向用户推荐文章。
52.1天后,获取获取用户在历史1天内单位时间内的浏览量为20篇,则用户单位时间内的浏览量下降。
53.参照图2,将以上的用户单位时间内的浏览量生成浏览量曲线,可知,在第一预设时间为3天,预设比重值为0.2时,浏览量曲线出现下降趋势,则以第一预设时间为3天、预设比重值为0.2时做出的文章推荐策略为最终的文章推荐策略。
54.本技术实施例公开的一种信息推荐方法,在指定用户推荐策略的过程中,根据用户反馈的单位时间内的浏览量,逐步调整参考文章的时间范围和文章类型的比重范围,在逐渐缩短第一预设时间、提高预设比重值的过程中,找到用户单位时间内浏览量的峰值,并确定用户推荐策略,以此方式,可以提高用户喜好的文章类型的精确度,并且文章推荐策略的更新具有及时性,更有利于提高用户黏性。
55.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为
依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本技术所必须的。
56.以上是关于方法实施例的介绍,以下通过装置实施例,对本技术所述方案进行进一步说明。
57.图3示出了根据本技术的实施例的信息推荐装置的方框图。如图3所示,装置包括:获取模块201,用于获取用户第一预设时间内的浏览过的文章的文章信息;查找模块202,用于根据所述文章信息,确定对应每篇文章关键词信息;确定模块203,用于根据所述关键词信息和预设的确认规则确定每篇文章所属的文章类型以及每种文章类型中的文章数量;处理模块204,用于根据所述文章类型、每种文章类型中的文章数量和预设的推荐规则确定文章推荐策略。
58.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
59.图4示出了适于用来实现本技术实施例的电子设备的结构示意图。
60.如图4所示,电子设备包括中央处理单元(cpu)301,其可以根据存储在只读存储器(rom)302中的程序或者从存储部分308加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram 303中,还存储有系统300操作所需的各种程序和数据。cpu 301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
61.以下部件连接至i/o接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至i/o接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。
62.特别地,根据本技术的实施例,上文参考流程图图1描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在机器可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。在该计算机程序被中央处理单元(cpu)301执行时,执行本技术的系统中限定的上述功能。
63.需要说明的是,本技术所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程
序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
64.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
65.描述于本技术实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、查找模块、确定模块和处理模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,获取模块还可以被描述为“用于获取用户第一预设时间内的浏览过的文章的文章信息的模块”。
66.作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或者多个程序,当上述前述程序被一个或者一个以上的处理器用来执行描述于本技术的一种信息推荐方法。
67.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的申请范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中申请的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
技术特征:1.一种信息推送方法,其特征在于,包括:步骤s100:获取用户第一预设时间内的浏览过的文章的文章信息;步骤s200:根据所述文章信息,确定对应每篇文章关键词信息;步骤s300:根据所述关键词信息和预设的确认规则确定每篇文章所属的文章类型以及每种文章类型中的文章数量;步骤s400:根据所述文章类型、每种文章类型中的文章数量和预设的推荐规则确定文章推荐策略。2.根据权利要求1所述的一种信息推送方法,其特征在于,所述推荐规则包括:根据所述文章类型和每种文章类型中的文章数量,确定每种文章类型在所有文章类型中的参考比重;据所述文章类型和每种文章类型的所述参考比重,向用户推荐属于所述文章类型的文章,且推荐的每一文章类型中的文章数量在推荐的所有文章数量中的所占的推荐比重与所述参考比重一致。3.根据权利要求2所述的一种信息推送方法,其特征在于,所述推荐规则还包括:在向用户推荐文章之前,根据每种文章类型的参考比重,滤除参考比重低于预设比重值的文章类型。4.根据权利要求3所述的一种信息推送方法,其特征在于,在步骤s400之后,还包括:步骤s500:获取用户第一预设时间内的总浏览量,并根据所述浏览量和第一预设时间确定用户单位时间内的浏览量;步骤s600:依据预设时间调整梯度,缩短所述第一预设时间;步骤s700:依据预设比重调整梯度,提升所述预设比重值;步骤s800:循环执行步骤s100-步骤s700,直至所述用户单位时间内的浏览量出现下降趋势。5.根据权利要求4所述的一种信息推送方法,其特征在于,在执行步骤s800之后,还包括:每间隔第二预设时间,依据所述文章推荐策略,向用户推荐文章;在执行所述步骤s100-步骤s700的过程中,所述第二预设时间等于所述第一预设时间;在所述用户单位时间内的浏览量出现下降趋势时,延长所述第二预设时间。6.根据权利要求1所述的一种信息推送方法,其特征在于,所述步骤s200包括:匹配所述文章信息和预设关键词库,确定备选词和每个备选词的数量;根据每个备选词的数量对备选词降序排列;依据排列顺序,筛选前预设个数的备选词为关键词。7.根据权利要求1所述的一种信息推送方法,其特征在于,所述确认规则包括:基于k近邻算法,根据每篇文章的关键词信息确定每篇文章所属的文章类型;统计得到每种文章类型中的文章数量。8.一种信息推送装置,其特征在于,包括:获取模块(201),用于获取用户第一预设时间内的浏览过的文章的文章信息;查找模块(202),用于根据所述文章信息,确定对应每篇文章关键词信息;确定模块(203),用于根据所述关键词信息和预设的确认规则确定每篇文章所属的文
章类型以及每种文章类型中的文章数量;处理模块(204),用于根据所述文章类型、每种文章类型中的文章数量和预设的推荐规则确定文章推荐策略。9.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~7中任一项所述的方法。10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~7中任一项所述的方法。
技术总结本申请提供了一种信息推荐方法、装置、电子设备和存储介质。所述方法包括步骤S100:获取用户第一预设时间内的浏览过的文章的文章信息;步骤S200:根据所述文章信息,确定对应每篇文章关键词信息;步骤S300:根据所述关键词信息和预设的确认规则确定每篇文章所属的文章类型以及每种文章类型中的文章数量;步骤S400:根据所述文章类型、每种文章类型中的文章数量和预设的推荐规则确定文章推荐策略。以此方式,可以推算用户喜好的文章类型,并根据用户喜好向用户推荐文章,以此方式,可以是推荐的文章更符合用户喜好,进而提高文章的点击量和用户黏性。量和用户黏性。量和用户黏性。
技术研发人员:丁聪霜 吴中华 吴国华
受保护的技术使用者:丁聪霜
技术研发日:2022.06.16
技术公布日:2022/11/1