本发明涉及金融数据分析、处理,尤其是一种将金融数据收集、数据处理、数据分析融为为一体的基于多层次编码器-解码器架构的股票市场异常预警方法。
背景技术:
1、随着信息技术和数据分析方法的不断发展,当前股票市场的投资者对于异常预警的需求与日俱增。然而,传统的股票预测方法存在着一系列局限,主要表现在对多元化因素的不足考虑以及对市场动态的较低适应性。当前主流的股票市场预测方法主要依赖于单一模型,如lstm等深度学习模型,这些模型往往只关注历史股票价格数据,无法充分考虑外部因素对市场的影响。同时,传统模型在处理非结构化信息(如舆情数据)方面存在困难,难以实现全面的市场异常分析。因此,提高预测的准确性和全面性成为当前股票市场预测技术发展的研究难点之一。
2、在当前股票市场投资领域,时间序列预测是一项至关重要的任务。主流的时间序列预测模型包括传统统计模型如arima(自回归综合移动平均模型)、以及深度学习模型如lstm(长短时记忆网络)等。这些模型在一定程度上提高了对历史股票价格的预测准确性,但仍然存在一些问题。传统统计模型在处理非线性、非平稳数据时表现不佳,而深度学习模型往往对数据需求较大,且缺乏对模型预测过程的可解释性。同时,在市场异常评判方面,常见的方法主要包括逻辑回归、岭回归等机器学习方法,以及构建市场健康度指标的尝试。逻辑回归和岭回归等算法通过建立模型对异常进行预测,但它们在处理大量非结构化数据时存在一定的局限性。市场健康度指标的构建则旨在通过融合多方面的市场信息来评估市场整体的状态,但这些指标的建立缺乏统一标准,存在主观性和不确定性。
3、综上所述,尽管现有技术已经取得了一些进展,但市场异常预测和评估仍然是一个复杂的问题,需要更全面、深入的方法。
技术实现思路
1、本发明的目的是针对现有技术的不足而提供的一种基于多层次编码器-解码器架构的股票市场异常预警方法,采用多层次encoder-decoder架构及informer模型等主流时间序列预测方法,利用构建的精准异常评估模型和股票市场异常评估模型,通过逻辑回归、岭回归等算法对异常进行预测,并通过构建可信度与预测序列长度的关系模型,以及波动性和抛售额构建的特定股票异常评估模型。该方法综合考虑了多个因素,从预测准确度的先验知识角度保障最终异常分析准确性,在处理历史股票价格数据时兼顾了线性和非线性、平稳和非平稳的情况,以提高预测的全面性和准确性。同时,通过引入全局注意力机制,对多源信息的影响进行了加权处理,增强了模型对市场动态的感知能力,方法简便,综合预测和分析了金融背景、舆情以及股票趋势因素,较好地解决了单一模型如lstm对股票预测效果差的问题,具有良好的运用前景和商业开发价值。
2、实现本发明目的的具体技术方案是:一种基于多层次编码器-解码器架构的股票市场异常预警方法,其特点是该方法结合多种模型优势,将绝大多数股市影响因素纳入模型内分析,具体包括如下步骤:
3、步骤a:构建多尺度股票信息预测模型;
4、步骤b:构建股票评估模型;
5、步骤c:构建市场评估模型;
6、步骤d:将结构化数据输入多吃度预测模型进行预测,利用股票评估模型对预测结果进行评估,利用市场评估模型对市场进行评估。
7、该方法涉及一种新模型,该模型可分为多个层次,这些子层级用于处理包括舆情、cpi等经济指标、公司基本面情况、投资者情绪信息。
8、所述步骤a构建多尺度股票信息预测模型包括以下子步骤:
9、a1:整理股票历史数据,将数据划分为训练集和测试集,对数据进行清洗。
10、a2:使用informer模型,设置参数,包括数据名称、预测类型、数据重采样、输入、先验和预测序列长度,多头注意力机制头数、早停策略以及使用gpu加速训练。损失函数采用平均绝对误差(mae)。采用前向传播方式计算输出值,利用梯度下降算法优化informer模型的参数。
11、a3:整理金融指标数据,将数据划分为训练集和测试集。使用最大-最小缩放算法归一化数据集。使用主成分分析方法(pca)降维数据。调用整合移动平均自回归模型(arima模型)预测金融指标数据。
12、a4:收集股票相关的舆情,利用大语言模型整理舆情数据,通过文本情感分析技术对舆情量化,评估其对特定股票的影响。
13、a5:利用全局注意力机制,处理舆情和多种金融指标数据,量化对股票价格、交易量的影响。
14、所述步骤a1所需的数据使用金融系统内、外部的合适指标,所述数据包括但可以不限于历史股票价格数据、新闻文本数据、相关企业财务报表、gdp、cpi、pmi、ppi等经济数据,可以对数据进行初步的处理,包括但不限于:处理缺失值、去除异常值和标准化数据。
15、所述步骤b中构建股票评估模型包括以下子步骤:
16、b1:将金融数据输入多尺度股票信息预测模型,预测未来股票市场数据、宏观经济指标、以及微观经济指标.
17、b2:构建逻辑回归算法的损失函数,通过l2正则化处理预测模块产生的预测指标数据;
18、b3:利用岭回归算法训练并拟合某支股票的评估模型,调整正则化强度,使用测试集测试并评估模型。
19、所述步骤c中建立市场评估模型,包括以下子步骤:
20、c1:构建可信度与预测序列长度(单位:天)的关系模型,通过线性回归的机器学习算法拟合模型,调整其中的权重参数。
21、c2:通过波动性和抛售额构建出某支股票的评估模型,简化分析参数,仅从交易量、下跌市场趋势、波动性三个角度量化了未来市场危险程度。
22、c3:通过预测可信度和股票评估模型构建市场评估模型。
23、本发明与现有技术相比具有以下有益的技术效果和显著的技术进步:
24、1)量化了股票市场异常,创建了针对某支股票和市场的异常预警体系;
25、2)综合预测和分析了金融背景、舆情以及股票趋势因素,解决了单一模型如lstm对股票预测效果差的问题。
26、3)提出了可信度分析,从预测准确度的先验知识角度保障最终异常分析准确性。
27、4)方法简便,具有良好的运用前景和商业开发价值。
1.一种基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,该方法具体包括如下步骤:
2.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤a1包括:大加载股票数据,确保每列的数据类型正确,并进行包括删除节假日时间段的数据、填充缺失值、删除重复行、检查数据逻辑性和添加收盘价的变化率和移动平均线的异常值处理。
3.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤b1通过预测数据计算市场平均市盈率、广义货币m2同比增长率、股票市场交易总量、市场成交总量变化率、个股涨跌幅、个股交易量变化率、个股转手率变化率、涨停次数和跌停次数。
4.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤c1包括构建预测可信度模型,并根据获得的真实数据,使用实际值和偏差值的比值表示的可信度,通过机器学习算法训练并拟合预测可信度模型,调整股票加权危险度和宏观经济数据的权重。
5.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤c2包括:计算开盘价和收盘价的均值以近似抛售时候的股票价格,计算未来t日至n日的日均收益率及波动性,构建股票危险度模型并进行线性回归拟合。
6.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤c3包括:利用先验的预测准确度模型,设置可信危险度模型,通过线性回归算法调整模型权重参数,划分异常等级,判定股市未来的异常情况。
7.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤a4定义标准利好集p和标准利空集n,以及单词w在p和n上的利好极性polar(w)由下述(a)式计算:
8.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤b2由下述(d)式计算预测指标数据:
9.根据权利要求1所述的基于多层次编码器-解码器架构的股票市场异常预警方法,其特征在于,所述步骤c2的危险度由下述(g)式计算: