"量化交易"(Quantitative Trading)一词涵盖从亚毫秒做市到年化调仓的长期因子所有用数学模型指导决策的资金流。不同流派看似都是"代码 + 数据",但在四个维度上彼此差别极大——把这四个维度想清楚,再去看单个流派,就不会被"量化"这个笼统词汇迷惑。
从微秒(HFT)、分钟-小时(StatArb)、天-周(事件 / 日内因子)、月-季(CTA / 宏观)、到年(Factor / Risk Premia)。周期不同,收益来源、容量、数据 / 硬件需求全变。
本质上只有四类:流动性提供(Market Making)、定价偏差(Arbitrage)、风险承担(Risk Premia)、预测 alpha(Forecasting)。每个流派组合不同、占比不同。
HFT ≤ $10B、StatArb ~$50-100B、CTA 单策略 ~$20B、Factor 可以 $1T+。越低频的策略容量越大,这是高频策略为什么只在自营、低频策略才做大资管的底层原因。
从一台笔记本(Factor)到跨洲微波网 + FPGA(HFT)的连续谱。HFT 的技术门槛像造火箭,Factor 的门槛像写一本书。搞错这个会把小团队逼上一条根本打不起的赛道。
"做量化"是一个太大的词,像"搞互联网"。一个两人小团队 + $1M 资金,想去抢 Citadel 的做市份额是不可能的(硬件差 5 个数量级);但去做 CTA 趋势跟踪或多因子策略完全可行。把自己的流派选对,是量化进入门最关键的第一步。
HFT(High-Frequency Trading)和 Market Making(做市)在学术上严格可分,但实践中头部机构同时做两件事——挂单赚点差 + 抢别人挂单套利。这是量化世界最"硬"的一派:硬在硬件,硬在人,硬在利润。
市场挂在 Bid 和 Ask 之间的差(Spread)天然存在——有人想立即买、有人想立即卖。做市商挂双边报价提供即时流动性,收取这个差作为"服务费"。每笔几美分 × 每天数亿笔 = 稳定现金流。
HFT 的延伸玩法:Latency Arb(延迟套利)——同一只股票在 NYSE 和 Nasdaq 价格出现毫秒级不一致,更快的机器先吃掉慢的那边;Order Book Pred(订单簿预测)——通过挂撤单微结构预判下 100 毫秒价格走向。
| 指标 | 数字 |
|---|---|
| 美股 HFT 成交占比(成交量口径) | 50-60% |
| 欧股 HFT 占比 | ~40% |
| Citadel Securities 美股订单流占比 | ~40% |
| Virtu 2024 年净交易收入 | ~$2.5B |
| 头部 HFT 每张合约利润(股指 / 国债) | $0.05-$0.50 |
| 典型持仓时长 | 微秒-秒 |
做市商一个常见统计:Sharpe 比率 8-12(年化收益 / 年化波动),几乎每天都赚钱,"亏损日"每月可能只有 1-2 天。但capacity 极度有限——资金加到某个规模后收益率立刻塌。这是 HFT 留在自营不做资管的核心原因。
零售交易者自学 Python + 买个 VPS 不等于 HFT。真正的 HFT 要求:微波/激光物理专线、PCIe 直连交易所网卡、FPGA 定制硬件、汇编级代码优化、co-location 机柜、交易所会员资格——任何一环差一个数量级,就被专业机构秒杀。散户不应尝试 HFT。
Statistical Arbitrage(StatArb / 统计套利)是量化最"古典"的流派。核心思想:用统计模型找出价格之间的暂时偏差,赌它会回归。从 1980 年代 Morgan Stanley APT 小组、Nunzio Tartaglia 起源,到 Renaissance / DE Shaw / Two Sigma 做到千亿级别。
最早期的版本叫 Pairs Trading(配对交易):两只相关股票(如可口可乐 / 百事)价格偏离历史均值时,做多便宜的、做空贵的,赌它收敛。后来扩展为多股票多因子模型:把股票分解为几十上百个因子暴露,对每一个因子维度都用历史均值+波动做套利。
现代 StatArb 的典型持仓周期:几分钟到几天。Medallion 据传主要在日内;DE Shaw / Two Sigma 覆盖分钟到周度;一些 mid-freq 基金则是日到周。
| 指标 | 数字 |
|---|---|
| 全球对冲基金 AUM | ~$5T |
| 其中"量化 / 系统化"份额 | ~30-35% |
| StatArb + ML 类占量化份额 | ~40% |
| Medallion 1988-2020 净年化(税后) | ~39% |
| 头部 StatArb Sharpe | 2-4 |
| 典型日换手率 | 30-300% |
StatArb 的标准图景:市场中性 + 超高分散(几百到几千只股票)。每单胜率可能只有 51-53%,但次数极多,中心极限定理把总体 Sharpe 拉到 3+。
麻烦在"模式崩溃"——2007-08 "Quant Quake",同类 StatArb 拥挤在相似因子上,大家同时去杠杆,互相踩踏 → Goldman GEO 一周跌 30%。这是 StatArb 的拥挤风险宿命。
CTA(Commodity Trading Advisor)在美国 CFTC 监管下注册,是最古老的系统化策略。"Turtle Traders"、Bill Dunn、John Henry 从 1970-80 年代开始就在跑这类策略。核心思想简单到可以写在一张纸上:价格趋势一旦形成会持续,顺势而为 + 严格止损。
把全球 50-150 种期货(股指、利率、外汇、能源、金属、农产品)放进一个篮子,对每一个用移动平均、突破、动量等规则决定持仓方向和大小。趋势成立时满仓,反向信号出现就反手或平仓。
本质是凸性策略(Convex)——小损失频繁,大收益稀疏。大部分年份微正或微负,危机年大赚(2008 年 AHL + 40%、2022 年 CTA 指数 +21%)。
| 指标 | 数字 |
|---|---|
| 全球 CTA / Managed Futures AUM | ~$350B |
| 占全球对冲基金比例 | ~7% |
| SG Trend Index 长期年化 | ~5-7% |
| SG Trend Index Sharpe | 0.4-0.7 |
| 2008 CTA 指数回报 | +18%(SPX -38%) |
| 2022 CTA 指数回报 | +20%(SPX -19%) |
| 典型持仓周期 | 1-12 个月 |
CTA 的特征是Positive Skew(正偏)——胜率只有 35-45%,但单笔盈利的平均值远大于亏损(3-5:1)。"让利润奔跑,把亏损砍掉"这句老派格言就是 CTA 的写照。
最大的风险是长期回撤:2013-2019 CTA 整体近 6 年跑不过债券,这段"趋势荒"让很多机构关门。2020-2022 复活,但仍是 "等风来"的策略,需要客户有长线耐心。
系统化宏观(Systematic Macro)介于 CTA 和 StatArb 之间——基于经济因果的宏观变量做慢交易,但用代码自动执行而不是基金经理手工决策。代表是 Bridgewater Pure Alpha 的量化部分、AQR Macro、Graham Global。
Factor Investing(因子投资)是学术和实践结合最紧的流派。Fama-French 三因子、五因子模型提出后,Value / Momentum / Size / Quality / Low-Vol 等因子被工业化,做成基金产品、ETF、Smart Beta——这是唯一一个"量化"流派真正下沉到普通投资者口袋里的。
按"某个基本面 / 价格特征"把股票(或其他资产)排序,做多高分、做空低分(多空组合)或者只做多(Long-only Smart Beta)。长期看这些因子都有"风险溢价"——即以承担某类风险为代价获得超额回报。
最经典的六大因子:
• Value(价值):低 P/B 做多,高 P/B 做空
• Momentum(动量):过去 12 个月上涨的多,下跌的空
• Quality(质量):高 ROE、低财务杠杆、稳定盈利
• Size(规模):小市值 > 大市值(历史溢价,2010s 失效)
• Low-Vol(低波):波动低的股票长期收益不比高波差
• Carry:利率差 / 远期基差套利(跨资产)
| 指标 | 数字 |
|---|---|
| 全球 Factor / Smart Beta AUM | ~$1.5T |
| AQR AUM | ~$140B |
| DFA AUM | ~$775B |
| 典型 Long-only Smart Beta 超额 | 年化 1-3% |
| Value 因子 2010-2020 表现 | 严重跑输(-30%) |
| Momentum 长期年化溢价 | ~8% |
| 典型持仓周期 | 月-年 |
容量极大 + 费率极低。Smart Beta ETF 费率 0.15-0.30%,对比对冲基金 2/20 收费天差地别。这是因子策略能"下沉到散户"的唯一原因。
但长期跑输是常态——Value 2010-2020 跑输成长 30%,投资人几乎要背叛学术信仰。2021-2023 又强势回归。Factor 投资是"耐心的税"。
ML 量化严格说不是独立流派——它是横切工具,任何流派都可能用。但"以 ML / 深度学习为核心方法"的基金独立成一派有独立数据集、独立基础设施、独立人才画像。2010 年代后期开始爆发,2020 后是所有新量化基金的标配。
传统因子模型假设线性关系(y = a + bx + ε)。ML 允许非线性 + 高维交互——Gradient Boosting、XGBoost、Random Forest、LSTM、Transformer 都在量化上被试过。
典型应用:
• 把 1000+ 特征(财报、情绪、另类数据、价量)扔进 boosting 模型
• 用 NLP(BERT/LLM)把新闻 / Earnings Call / Reddit 帖子变成特征
• 用 CV 识别卫星图里的 Walmart 停车场车数、油罐影子
• 强化学习(RL)做最优执行(TWAP/VWAP 优化、清盘)
不像宣传说的那么神奇。真实情况:
• 特征工程 > 算法选择——XGBoost 和 LSTM 在实际生产差异 < 1%
• 样本量是瓶颈——股票日度数据 30 年 × 5000 股票 = 不到 4000 万样本,对深度学习是小数据
• 回测漂白(Overfitting)严重——每个"神经网络 Sharpe 3"的回测,实盘 0.5 的故事都听过
• 解释性差——风控部门无法解释"为什么此刻做多茅台",在合规和风控上都是麻烦
| 要素 | 规模 |
|---|---|
| GPU 集群 | 100-1,000+ 张 H100 |
| 数据科学家 / ML 工程师 | 50-500 人 |
| 另类数据(Alt Data)年开支 | $10-100M |
| 数据存储 / 管道 | PB 级 |
从学术研究到生产部署的 gap 极大。回测报告的 Sharpe 3.0 实盘 70% 概率变 -0.5——原因包括 look-ahead bias、生存偏差、交易成本被低估、样本外失效。任何不能提供 3 年以上实盘业绩的"AI 量化产品",默认视为无业绩。
事件驱动量化是介于 StatArb 和基本面量化之间的流派。核心逻辑:找到清晰的 catalyst(财报、并购、指数调入、分析师评级变化),在事件前后的几天 / 几周内系统化下注。
Millennium(多策略中若干 pod)、Point72(Cubist 量化分部)、Balyasny、Schonfeld 等 "pod shop" 都重度使用事件驱动量化。独立的纯事件量化基金相对少,多在多策略平台内部。
加密量化是过去 10 年唯一一个"全新诞生"的市场。2017-2021 是野蛮生长期,跨交易所套利能轻松 Sharpe 5+;2022 后随着 Jump、Jane Street、DRW 等传统 HFT 入场,已经和传统市场一样"干净"——但仍保留一些结构性 alpha。
| 指标 | 数字 |
|---|---|
| 加密量化基金全球 AUM | ~$30-50B |
| 头部做市商日成交(Wintermute) | $5-10B |
| MEV 2024 年度提取 | ~$700M |
| 主要玩家 | Jump · DRW · Jane · Wintermute · GSR · Cumberland · B2C2 · Galaxy · Flow |
2022 年 FTX / Three Arrows / Alameda 倒闭让大量对冲基金 / 量化团队一夜清零。你的"托管风险"(custody risk)、交易所破产风险、稳定币脱锚风险都远超市场本身的 beta 风险。加密量化的头号技能是资金调度 + 对手方管理,不是 alpha。
下面这张表是所有做量化创业 / 就业前必看的——你要做的流派,决定了最小启动资源。错配流派和资源是初学者最常见的致命错误。
| 流派 | 硬件 / 延迟 | 数据开支(年) | 人员(核心) | 最小可行规模 |
|---|---|---|---|---|
HFT / 做市 CAPEX重 | FPGA · Co-lo · 微波网 · 亚微秒 | $20-100M(直连 + 微结构) | 100-500 人 ⅓ C++/硬件、⅓ 量化、⅓ 运维 | $50M+ 启动,多数小团队无法进入 |
StatArb | CPU/GPU 集群 · 毫秒-秒 | $5-50M(L2 数据 + 另类) | 30-300 人(研究:工程 ≈ 1:1) | $10-50M 研究投入启动 |
CTA / 趋势 | 标准服务器 · 秒-分钟 | $0.1-2M(期货 EOD + 分钟数据) | 5-50 人 | $1-5M 可做 |
系统化宏观 | 标准服务器 · 日-周 | $1-10M(宏观数据库 Bloomberg 等) | 20-100 人 | $5-20M 启动 |
Factor / 风险溢价 | 一台笔记本 ± 托管服务器 · 月 | $50K-1M(Compustat / CRSP) | 2-20 人 | $500K 可做(公募 / SMA) |
ML / 深度学习 | GPU 集群(100-1000+ H100) | $10-100M(另类 + 标注) | 50-500 人(ML 工程师占一半) | $20M+ GPU + 人力 |
事件驱动量化 | 标准服务器 + 低延迟新闻 | $1-10M(路透 / Ravenpack / 另类) | 10-50 人 | $5-10M 启动 |
加密量化 | 云 GPU + 多交易所 API · 毫秒 | $100K-5M(链上 + CEX) | 3-30 人 | $1-5M 可做 · 但托管风险高 |
可选:Factor ETF(MTUM / VLUE / QUAL / USMV)+ 低成本趋势跟踪 ETF(KMLM / DBMF)。自己写代码可以尝试简单的动量 + 均值回归组合,但不要指望 Sharpe > 1。把避免犯大错作为首要目标。
可选:CTA 趋势跟踪 + 事件驱动 + 加密量化。避开 HFT 和 ML 深度学习。研究 1-2 年积累数据和回测基础设施,再考虑上实盘。
基础数学(概率 / 统计 / 线代)+ 编程(C++ / Python)+ 某一门深入(随机过程 / 计量 / ML)。Jane Street / Citadel / Two Sigma 的 SWE/Quant 岗年薪起步 $300-500K,但竞争激烈。
直接采购 AQR / DFA 等成熟因子产品 + 少量 CTA 分散。自建量化团队在规模 < $500M 之前性价比极低——人力 + 数据成本 > 预期超额。
选一个小而深的流派(比如 crypto 资金费率、某品类趋势、因子中的 Quality tilt),做出 3 年实盘业绩,再考虑横向扩展。最大的陷阱是什么都想做 → 什么都做不好。
分散到 3-4 个流派 + 不同机构。CTA 20% + StatArb 30% + 多策略 platform 30% + Factor 20% 是常见配置。重点在"机构筛选"而非"策略选择"——量化的 alpha 主要来自人,不来自派。
Medallion 看起来是最聪明的人赢了,本质上是最早(1988)、最小(仅内部)、最深(30 年复利) 的那批人占了位置。今天想复制它的路径几乎不可能——但在每一个尺度上都有合适的流派。选对自己所在尺度的玩法,比追求"Renaissance 级 Sharpe"重要十倍。