Python Parser 因子计算性能简单测试

一直以来,Python 都在量化金融领域扮演着至关重要的角色。得益于 Python 强大的库和工具,用户在处理金融数据、进行数学建模和机器学习时变得更加便捷。但作为一种解释性语言,相对较慢的执行速度也限制了 Python 在一些需要即时响应的场景中的应用。

同时,由于 GIL(Global Interpreter Lock)的存在,在应对多线程和 CPU 密集型任务时,Python 始终无法充分发挥出硬件性能和并行执行任务的优势。

历时2年,DolphinDB 开发了可以识别 Python 语言的全新脚本引擎 Python Parser,它让用户可以用自己最熟悉的 Python 语法实现计算逻辑,并在 DolphinDB 的计算框架上高效运行,享受到 DolphinDB 高性能和分布式的计算能力。想要体验“高性能+分布式 python ”的朋友,欢迎扫描下方二维码试用。

在这里,我们挑选了6个具有代表性的因子,用 Python Parser 进行了实现,并对比DolphinDB Script 和 Python 的实现进行了简单性能测试,为大家提供一些参考。 

测试环境 

测试数据 

  • 2023 年单个交易所某日的 level-2 全天数据

    • 快照数据:24,313,086 行 × 62 列 [约 20.6 GB]

    • 逐笔成交:108,307,125 行 × 19 列 [约 11.0 GB]

    • 逐笔委托:141,182,534 行 × 16 列 [约 11.6 GB]

 性能测试结果

以下为各因子计算逻辑描述,点击链接可获取详细脚本。 

双均线因子

双均线是根据两条周期不一样的均线的相对位置来跟踪趋势的一种方法,本测试中我们使用双均线交叉的方式来判断买卖方向:

  • 短周期均线从下向上突破长周期均线时,意味着当前时间段具有上涨趋势,突破点就是常说的金叉,是股票的买入信号,在代码里,使用前一短均值小于前一长均值且当前短均值大于当前长均值的方式来判断金叉,赋予信号值为 1;

  • 短周期均线从上向下跌破长周期均线时,意味着当前时间段具有下跌趋势,跌破点就是常说的死叉,是股票的卖出信号,在代码里,使用前一短均值大于前一长均值且当前短均值小于当前长均值的方式来判断金叉,赋予信号值为 -1。

在这里我们使用简单移动平均(Simple Moving Average),其中 n 为窗口大小:

图片

因子计算示例代码请点击链接获取!

十档净委买增额

十档净委买增额因子指的是在有效十档范围内买方资金总体增加量,即所有买价变化量的总和,计算公式如下:

图片

其中 level10_Difft 表示 t 时刻的十档净委买增额;bidi,t 表示 t 时刻的第 i 档买方报价;bidQtyi,t 表示 t 时刻的第 i 档买方挂单数量;指示函数 I 表示报价是否在有效释放范围内。

有效十档范围内表示不考虑已不在十档范围内的档位,即表示只考虑以下区间的档位:

图片

最后,对过去 n 时间窗口内的十档净委买增额求和。

价格变动与一档量差的回归系数 

回归模型:

图片

其中,

  • ΔPt 表示 t 时刻的价格变动;lastPricet 表示 t 时刻的最新价格;

  • NVOLt 表示 t 时刻的买卖一档量差;bidQty1,t 表示 t 时刻的买方一档挂单笔数;askQty1,t 表示 t 时刻的卖方一档挂单笔数;

  • α 表示截距;λ 表示斜率;εt 表示 t 时刻的残差。

其中回归系数 λ 为目标因子值。

主动成交量占比

主动成交占比即主动成交量占总成交量的比例,其计算公式如下:

图片

其中 tradeQtyi 表示 i 时刻的成交量;actVolumet 表示 t 时刻起的前 lag 笔订单的主动成交量之和;totalVolumet 表示 t 时刻起的前 lag 笔订单的总成交量;指示函数 I 含义如下:

图片

早盘买卖单大小比 

早盘买卖单大小比即早盘时间段买入订单平均委托量占卖出订单平均委托量的比例的对数,其计算公式如下:

图片

其中 openBidVol 表示早盘时间段买入订单平均委托量;openAskVol 表示早盘时间段卖出订单平均委托量;orderQtyt 表示 t 时刻的委托量;

Ibid 是指示函数,当订单为买方委托单时值为 1,否则为 0;Iask 是指示函数,当订单为卖方委托单时值为 1,否则为 0。

委托量加权平均委托价格

委托量加权平均委托价格是将多笔委托单的委托价格按各自的委托量加权而算出的平均价格,其计算公式如下:

图片

其中 vwapt 表示 t 时刻起的前 lag 笔委托单的委托量加权平均委托价格;orderQtyi 表示 i 时刻委托单的委托量;orderPricei 表示 i 时刻委托单的委托价格。

获取以上6个因子及性能测试的详细脚本,请点击链接查看详情。

想要试用 Python Parser 的朋友,欢迎扫描下方二维码抢先体验。

图片


http://www.niftyadmin.cn/n/5074484.html

相关文章

机械臂抓取的产业落地进展与思考

工业机械臂是一种能够模拟人类手臂动作的机械装置,具有高精度、高速度和高灵活性的特点。近年来,随着人工智能和机器人技术的快速发展,机械臂在工业生产、物流仓储、医疗护理等领域得到了广泛应用。机械臂抓取技术作为机械臂的核心功能之一&a…

边坡安全监测系统的功能优势

随着科技的进步,边坡安全监测系统在各种工程项目中发挥着越来越重要的作用。这款系统通过实时监测垂直、水平位移数据,以折线图的方式显示在监控平台中,为工程人员提供了直观、便捷的监控工具,从而能够及时掌握边坡稳定状况&#…

python每日一练(3)

🌈write in front🌈 🧸大家好,我是Aileen🧸.希望你看完之后,能对你有所帮助,不足请指正!共同学习交流. 🆔本文由Aileen_0v0🧸 原创 CSDN首发🐒 如…

常见算法-洗扑克牌(乱数排列)

常见算法-洗扑克牌(乱数排列) 1、说明 洗扑克牌的原理其实与乱数排列是相同的,都是将一组数字(例如1∼N)打乱重新排列,只不过洗扑克牌多了一个花色判断的动作而已。 初学者通常会直接想到,随…

抖音手机实景无人直播间怎么搭建?

手机无人直播已成为用户直播和商家直播带货的一项热门技术趋势,为消费者提供了全新的观看体验。无人直播,顾名思义,即通过无人直播软件或数字人来进行无人直播。这一技术的广泛应用,不仅为短视频渠道带来了更丰富的玩法&#xff0…

点云从入门到精通技术详解100篇-基于 LSTM 的点云降采样

目录 前言 国内外研究现状 非学习的点云降采样方法的国内外现状

菜单子节点的写法

菜单子节点的写法 1.测试数据2.实现代码3.获取父ID层级 1.测试数据 1.表结构SQL CREATE TABLE test (id int DEFAULT NULL,u_id int DEFAULT NULL,p_u_id int DEFAULT NULL ) ENGINEInnoDB DEFAULT CHARSETutf8mb4 COLLATEutf8mb4_general_ci;2.数据SQL INSERT INTO test (i…

windows 2003、2008远程直接关闭远程后设置自动注销会话

1、2003系统: 按开始—运行—输入“tscc.msc”,打开“终端服务配置”。 单击左边窗口的“连接”项,右边窗口中右击“RDP-TCP”,选择“属性”。 单击“会话”项,勾选“替代用户设置”,在“结束已断开的会话”…