AStockArena首期实盘竞技:GPT-5与Claude科创板交易领先,DeepSeek展稳健风控
AStockArena首期实盘竞技:GPT-5与Claude领跑科创板,DeepSeek展现卓越风控实力
核心亮点速览:
- GPT-5系列模型表现突出,Alpha收益突破12%
- DeepSeek在暴跌行情中展现资深风控韧性
- AStockArena:国内首个采用真实T+1规则的科创板智能体竞技平台
竞技战报:国际巨头领先,国产模型稳健坚守

AStockArena平台首期赛季(2026年1月12日至2月13日)的实盘交易数据正式公布。这场被业界视为金融交易领域“图灵测试”的较量,清晰揭示了大语言模型在实战交易中的能力差异。
一、顶尖对决:GPT与Claude确立领先优势
在代表最高推理水平的Pro Version竞技场中,GPT-5.2(图表浅蓝线)与Claude Opus 4.5(图表紫线)展现出强大的市场统治力。两者在科创板的高波动环境中逆势而上,累计收益率超过4%。
GPT-5.2的资金曲线平滑,回撤控制表现出色,其操作风格堪比经验丰富的基金经理。而在Lite赛道中,GPT-5.1更是取得了超过12%的Alpha收益,显示出明显的技术代际优势。
二、中坚力量:DeepSeek的稳健风控之道
当Qwen3-Max与等权ETF跌幅超过6%的市场低迷期,DeepSeek Reasoner(图表橙线)完美诠释了“稳如磐石”的交易哲学。
该模型在剧烈下跌行情中始终保持良好的回撤控制,避免盲目跟随市场波动。其表现显著优于Gemini与Qwen系列模型,证明了国产大模型在复杂交易环境中的强大适应能力和生存智慧。
综合来看,虽然GPT与Claude目前处于领先位置,但以DeepSeek为代表的国产模型依然保持着核心竞争优势,在国际强手的挑战中稳守阵地。
三、平台揭秘:AStockArena——量化交易进入智能体时代
这场精彩博弈并非简单的历史回测,而是在香港科技大学PEIlab最新开源发布的AStockArena平台上进行的真实交易。
随着大语言模型从“对话工具”向“行动主体”演进,行业需要一个高噪声、强博弈的真实环境来检验其能力边界。AStockArena应运而生,成为国内首个专门为A股科创板设计的多智能体自动交易竞技平台。
三大核心特性,打造专业级测试环境
1. 成熟决策架构:ReAct全闭环系统
平台采用先进的ReAct架构,使智能体的决策过程更贴近人类交易员的思维逻辑:
市场观察(Observe):智能体需要主动调用API接口,获取经过语义去重处理的高价值新闻摘要,同时实时获取动量震荡、趋势跟踪等技术指标数据,实现对专业交易员市场感知能力的模拟。
逻辑推理(Reason):平台内置丰富的技术分析工具和新闻因子函数。模型在调用这些工具进行分析时,必须生成结构化的思维链记录。这使得每一次交易决策都基于多源信息的严谨推演,实现了从“概率预测”到“可解释、可审计的逻辑决策”的跨越。
2. 真实测试场景:科创板高强度试炼场
平台摒弃波动平缓的蓝筹股,直接挑战高Beta值的科创板股票(如寒武纪、中芯国际等):
- 真实交易规则:严格执行T+1交易制度、100股整数倍买卖限制、真实的佣金和印花税计算
- 流动性限制:引入涨跌停板的概率性成交限制,迫使AI模型寻找跨日Alpha收益,而非简单的日内套利机会
3. 专业技术支持:工业级数据基础设施
- 数据来源:获得深圳天软科技的底层数据支持,确保行情资讯的实时性和准确性
- 公平竞技环境:独创SharedPrefetch共享快照技术,消除网络延迟差异,确保比拼聚焦于模型智能本身
- 双轨运行模式:提供Lite版(低成本调优)与Pro版(生产级推理)并行架构,满足不同研究需求
超越回测:生成可视化的“AI能力体检报告”
AStockArena内置强大的可视化分析工具,可自动生成11类专业分析图表。研究者能够清晰分析:
- 浮动盈利与实际盈利:准确识别模型是“账面富贵”还是“真实获利”
- 交易风格画像:通过持仓关注度时序分析,精准判断模型属于“高频交易型”还是“价值投资型”
平台愿景
发布AStockArena的初衷,是为行业提供一个高拟真度、标准化、可量化的评估框架。通过封装成熟的工具链和真实的市场规则,我们推动AI智能体走出“聊天对话框”的舒适区,真正面对金融市场的复杂性与残酷性,加速智能交易技术的实用化进程。
想获取更多AI最新资讯与智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台 与 AI学习社区
本文来源:机器之心
原文链接:https://www.jiqizhixin.com/articles/f5ac63ab-038b-4f4c-bf45-3abac583a038