大数据近年来已深入人心,大模型也开始受到广泛关注。量化投资向来与数据和技术密切相关。当大数据遇见大模型,量化投资应该何去何从,将呈现哪些新特征,对数据因子、投资策略、数据和技术有哪些新要求,诸如此类的问题成为行业焦点话题。
2023年11月3日,通联数据在北京举办以“当大数据遇见大模型:量化投资的现状与展望”为主题的论坛活动,全面深入探讨新形势下量化投资的发展趋势,分享数据因子和投资策略的应用情况,探索大数据和大模型在金融服务中的创新路径。与会嘉宾在交流中碰撞智慧,在互动中达成合作,共同促进行业高质量发展。
量化研究如何有效赋能权益投资,已成为业内备受关注的话题。对此,开源证券金融工程高级分析师苏俊豪发表演讲。他表示,“大数据+大模型”是投资研究的重要发展趋势,在赋能主动权益投资方面有着巨大的发展空间。开源证券致力于在大数据、大模型和主动权益投资之间架起沟通的桥梁。在实践中,量化运用新数据、新技术,可以实现对投资持仓配置情况的实时监测,精度高、误差低。他进一步强调了另类数据在投资研究中的重要价值,并以具体案例和详实数据展示了另类数据在高频股东户数与筹码博弈中的应用。他提出,金股组合是超额收益挖掘的体现,优选金股组合收益表现显著优于基准指数。
当前,投资已步入大数据时代,走向大模型时代。通联数据创新数据产品负责人白晶围绕金融大数据的演变和新趋势发表演讲。白晶提出,金融数据发展史可以说是计算机与现代投资组合理论的发展史。投资策略随着计算机能力的提升而持续升级,从基础数据到另类数据,投资者追求更高的超额收益,对高收益策略工具一直偏爱有加。大数据和大模型为挖掘超额收益提供了更多的数据和工具,是未来投资研究的重要趋势。白晶认为,在大数据和大模型时代,金融大数据呈现三大趋势:新技术唤醒沉睡数据,新理念激发场景应用,新融通构建数据生态。
通联数据目前能够提供覆盖宏观、中观和微观的基础数据服务(包括“20+”模块、“1000+”业务表、“1000+”API,总量达到PB级),打造了一批特色数据。在另类数据方面,通联数据拥有“AI+HI”体系下独特的数据源和自有AI算法能力,形成强业务应用驱动的产品研发体系,提供另类基础数据和另类衍生数据,助力投资者获取更多超额收益。
随着另类数据异军突起,各种新数据层出不穷,为量化投资实现超额收益带来新机遇。通联数据量化研究专家高凌峻围绕“NLP的量化应用:主题大数据中的另类Alpha”发表演讲,以主题大数据为例,说明了如何应用另类数据、NLP(自然语言处理)、大模型等助力挖掘超额收益。高凌峻介绍说,主题大数据是通联数据推出的一款另类数据产品,除上千个主题概念外,还包含丰富的主题衍生数据,具体包括主题热度、热门主题、主题关联个股、主题指数、主题关联新闻、主题情感等。他表示,通联数据运用NLP大语言模型,进行关联性的定性和定量分析,为投资者挖掘超额收益提供高价值参考。主题大数据应用场景广泛,可用于主题热度选股、主题轮动策略、主题指数增强、主题风格因子、主题风格归因、主题风险控制、主题监控跟踪等。相关数据显示,以NLP等工具运用主题大数据挖掘超额收益效果显著。
通联数据深耕人工智能,以AI赋能投资为使命,成立以来致力于推广人工智能在资产管理和财富管理领域的应用。目前,公司在数据、算法、场景方面经过多年的沉淀,形成了强大的研究和应用能力,以深刻的见解、深厚的积累、深层次的洞察高质量满足客户需求。
在随着量化投资行业的发展过程中,投研与交易所需要的基础设施越来越重要。DolphinDB联合创始人、首席运营官初阳春围绕搭建高性能量化投研与实时计算系统发表演讲。初阳春认为,典型的量化策略流程包括数据存储、策略研发和实时计算。库内计算可大幅提高海量数据分析的效率,流批一体可显著减少实时交易系统的开发成本。
当前,各行业数字化、智能化向纵深发展,交易领域也不例外。就数智交易的趋势与未来,卡方科技产品负责人林贤燕发表演讲。林贤燕指出,随着技术迭代升级,算法交易持续发展,逐步降低市场交易的摩擦成本,提升交易效率,有效支持高效率价格发现和流动性提升,平滑交易波动,防止市场发生对敲或短时间拉涨停等。将软件服务能力与算法交易能力融合,是精益化效能提升的必然选择,正在被越来越多行业客户接受和认可。她表示,在经历传统人工交易、被动机械算法、主动机械算法和智能AI算法后,行业已经进入大模型算法时代。
在大数据和大模型叠加的时代,机遇和挑战并存。量化投资处于继往开来的阶段,将迎来全新的发展。在圆桌论坛环节,中信证券自营股票量化投资经理王策、通联数据创新数据产品负责人白晶、通联数据量化研究专家高凌峻从不同角度探讨了量化投资在大数据和大模型时代实现超额收益的机遇和挑战,并就未来的发展路径给出建议。
来源:中国金融