30 KiB
个人投资者量化交易实操指南
从 Demo 到实盘的完整路径
定位:本文档基于对整个 Demo 系列的代码审计和策略评估,为个人投资者回答三个核心问题——做什么策略、怎么做策略、用什么平台做。
前置阅读:建议已通读完 7 篇 Demo 后阅读本文。
目标读者:有 Python 基础的量化入门者,关注 A 股实操。
附注:文末附录 B 对比了市面上典型量化入门书(如《DeepSeek+Python 量化交易》)与本 Demo 系列的差异,帮读者理解"为什么有些书看起来厚但学不到东西"。
目录
- 代码库总览与知识体系
- ETF 轮动 Demo 深度评估
- 个人投资者的现实策略频谱
- 中低频策略的核心范式
- 情绪因子与突发事件量化
- 从 Demo 到实盘:平台与工具链
- 6.3 真实数据接入
- 6.4 风控层详解:Demo 系列最大的盲区
- 推荐学习与实践路径 附录 A:关键术语速查 附录 B:市面入门书 vs 本 Demo 系列
1. 代码库总览与知识体系
1.1 项目定位
这是一个A 股量化交易教学 Demo 项目,定位为零基础入门到中级的渐进式学习系列。项目以纯 Python + numpy/pandas/scipy/matplotlib 构建,通过合成模拟数据演示完整的量化投研工作流。
1.2 七篇递进式模块
| 序号 | 文件 | 主题 | 核心技能 |
|---|---|---|---|
| 1 | quant_data_pipeline_demo.py (920行) |
数据管道 | 价格复权、收益计算、缺失值处理、异常值检测(MAD/Z-score/Winsorize)、涨跌停标记、交易日历对齐、DataPipeline 类 |
| 2 | quant_strategy_backtest_demo.py (912行) |
策略回测 | SMA/EMA/RSI/MACD/Bollinger Band 技术指标、双均线策略、RSI 均值回归、向量化回测引擎、绩效指标(Sharpe/Sortino/Calmar/Win Rate/Profit Factor)、滚动前向验证 |
| 3 | quant_event_driven_backtest_demo.py (1532行) |
事件驱动回测 | 事件队列架构(Market/Signal/Order/Fill 四事件)、五大组件解耦(DataHandler/Strategy/Portfolio/SimulatedBroker/BacktestEngine)、滑点+佣金+最低佣金模型、与向量化回测的精确对比 |
| 4 | quant_alpha_factor_demo.py (1023行) |
Alpha 因子研究 | 隐藏因子生成模型、5 因子构建(MOM/REV/LVOL/BAB/ILLIQ)、三段预处理(去极值→Z-score→市值中性化)、IC/ICIR 分析、五分位分层回测、等权与 IC 加权因子合成、多空组合 |
| 5 | quant_portfolio_optimization_demo.py (950行) |
组合优化 | Ledoit-Wolf 收缩协方差、有效前沿、5 策略对比(等权/MinVar/MaxSharpe/RiskParity/Black-Litterman)、带行业约束+换手率约束的优化、滚动回测 |
| 6 | doc_06_astock_practice_guide.md |
A 股实盘指南 | Demo 到实盘的差距清单、A 股特殊规则(涨跌停/T+1/融券限制/印花税)、回测七大陷阱(前视偏差/幸存者偏差/过拟合等)、风险管理、工具推荐 |
| 7 | quant_etf_rotation_demo.py (849行) |
ETF 轮动 | 相对动量轮动、双动量策略(含国债 ETF 避险)、A 股交易成本模型、持仓热力图、换手率分析 |
1.3 架构特点
- 合成数据驱动:全部使用几何布朗运动/因子模型生成模拟价格,无需外部数据源即可运行
- 纯数值计算栈:依赖仅 numpy/pandas/scipy/matplotlib/sklearn,无量化框架依赖
- 双语教学:代码注释中英文对照,函数 docstring 包含公式推导和直观解释
- 可视化输出:每个脚本生成对应的 PNG 图表,共 6 张(约 3MB)
- 教学级代码:结构清晰但非生产级——缺少错误处理、性能优化、模块间复用
2. ETF 轮动 Demo 深度评估
2.1 代码审计结论
quant_etf_rotation_demo.py 是系列第 7 篇,定位为"入门者可快速用于 A 股实战的策略模板"。以下是分维度评估:
做得好的方面
-
策略设计务实。 选择 ETF 轮动而非个股选股——ETF 规避了个股黑天鹅(财务造假、退市等),对个人投资者远比 Alpha 选股更可行。双动量策略在熊市自动切换至国债 ETF 避险,契合 A 股"牛短熊长"的特征。
-
成本模型贴近 A 股实情。
AShareCostModel区分了买入成本(佣金+滑点)和卖出成本(佣金+滑点+印花税),双边合计约 0.22%,年化约 2.6% 的成本拖拽是实盘中不可忽视的数字。 -
多窗口动量合成减少过拟合。 使用 12-1、6-1、3-1 三个月度动量窗口的等权合成,比固定单一窗口更稳健。
-
持仓热力图信息密度高。 一眼就能看出策略何时从行业 ETF 切换到国债 ETF(避险阶段),以及哪些行业被频繁选中。
-
代码结构清晰。 数据生成、因子计算、回测引擎、绩效评估四个模块分离干净,通过 strategy 参数切换三种策略避免了代码重复。
需要改进的方面
| 问题 | 严重程度 | 说明 |
|---|---|---|
| 合成数据过于理想化 | 高 | A 股行业 ETF 普遍成立于 2019 年后,历史不足 6 年。Demo 设定的收益/波动参数与真实情况可能存在大幅偏差。合成数据的回测结果数字不可直接采信 |
| 动量崩溃风险未量化 | 中 | 文档提到了动量崩溃,但代码中无专门分析场景。趋势反转当月是最危险的时刻 |
| top_k=3 缺乏敏感性分析 | 中 | 选 2 只和选 4 只的结果可能差异巨大,未展示参数稳健性 |
| 再平衡日期未考虑日历效应 | 低 | A 股月末/季末存在基金调仓压力,与月中微观结构不同 |
| 双动量绝对阈值=0 是最简设定 | 低 | 阈值设为无风险利率或滚动均线可能更优 |
| 无统计显著性检验 | 低 | 未判断双动量是否显著优于等权基准 |
2.2 总体评价
这是一篇质量不错的 ETF 轮动教学 Demo——策略逻辑清晰、成本模型务实、图表信息量大。适合作为入门者理解"动量轮动"概念的起点。但它仍然是教学级而非生产级代码。
如果要在 A 股实盘使用这个策略,第一步是用 AKShare/Tushare 拉取真实 ETF 日线数据替换合成数据,重新跑一遍——合成数据给的回测结果,一个字都不要信。
3. 个人投资者的现实策略频谱
3.1 按交易频率分层的可行性
| 频率 | 持仓周期 | 个人可行性 | 瓶颈 |
|---|---|---|---|
| 高频 (HFT) | 毫秒~秒 | 不可行 | 需要 colocation、FPGA、专线,年成本百万级 |
| 日内短线 | 分钟~小时 | 很难 | 需要极低延迟、全职盯盘、A 股 T+1 限制做空 |
| 中频 | 天~周 | 可行 | 数据可得,决策时间充裕,成本可控 |
| 低频 | 月~季度 | 最可行 | 成本极低,逻辑清晰,适合业余管理 |
结论:周频或月频换仓的策略是个人投资者的甜点区——交易成本可控,不需要盯盘,决策可以批量处理。
3.2 不同资金量级的推荐策略
| 资金量 | 推荐策略 | 标的 | 换仓频率 |
|---|---|---|---|
| < 10万 | ETF 轮动(动量+估值) | 行业 ETF + 国债 ETF | 月度 |
| 10-50万 | ETF 轮动 + 股债配置 | 行业 ETF + 宽基 ETF + 国债 ETF + 可转债 ETF | 月度/季度 |
| > 50万 | 多因子选股 + 资产配置 + 风控层 | 个股(50-100只池) + ETF + 固收 | 周度/月度 |
4. 中低频策略的核心范式
中低频策略可以归纳为三类,本项目的 Demo 已经覆盖了其中两类。
4.1 因子选股 / ETF 轮动(截面策略)
每月/每周对候选池排序,买入排名最高的 N 只,卖出跌出排名的。信号来源包括:
| 因子类型 | 代表性因子 | A 股有效性证据 |
|---|---|---|
| 动量 (Momentum) | 过去 12-1 个月收益 | ⭐⭐⭐ 中等,行业层面比个股层面更有效 |
| 价值 (Value) | PE/PB 分位数 | ⭐⭐⭐⭐ 强,A 股中低 PE 策略长期有效 |
| 质量 (Quality) | ROE、毛利率稳定性 | ⭐⭐⭐ 中等偏强 |
| 低波动 (Low Vol) | 60/120 日已实现波动率 | ⭐⭐⭐ 中等,A 股低波异象存在但有争议 |
| 流动性 (Liquidity) | Amihud 非流动性指标 | ⭐⭐ 较弱,小市值拥挤 |
实际运行流程:每月最后一个交易日收盘后 → 计算因子排名 → 生成调仓信号 → 次日开盘执行 → 持有到下次调仓。
4.2 资产配置 / 风险平价(时序策略)
不是选哪只股票,而是决定股票 vs 债券 vs 商品各配多少。常见做法是每季度再平衡一次,回归目标权重。代表模型:
- 风险平价 (Risk Parity):桥水全天候策略的理论基础
- Black-Litterman:贝叶斯框架混合市场均衡 + 主观观点
4.3 宏观择时(时序策略)
根据宏观指标决定整体仓位。几组实用指标:
- 利率趋势(10 年期国债收益率方向)→ 利率下行利好股票
- 信贷脉冲(社融增速变化)→ 信贷扩张期股票表现好
- CPI 方向 → 高通胀环境利好商品/价值股
这类策略一个月看一次数据即可,和日常生活节奏完全兼容。
5. 情绪因子与突发事件量化
5.1 情绪因子:可以量化,而且是重要的 Alpha 来源
Demo 中用的价格/成交量/波动率都是"硬数据",但"软数据"在很多场景下提供了独立于价格的预测信息。
| 数据源 | 因子示例 | 数据获取 |
|---|---|---|
| 北向资金流向 | 每日净买入额及其滚动均值 | 沪深港通公开数据,AKShare 直接获取 |
| 融资融券余额 | 融资余额变化率(反映散户杠杆情绪) | 交易所每日发布,AKShare 直接获取 |
| 涨停/跌停家数 | 市场宽度指标(涨跌比) | 全市场统计,可自行计算 |
| 成交量比率 | 放量/缩量程度,量价背离 | 价格数据可算 |
| 50ETF 期权隐含波动率 | 中国版 VIX 恐慌指标 | 期权数据 API |
| 龙虎榜数据 | 机构 vs 游资买卖方向 | 交易所盘后披露 |
| 股指期货升贴水 | 基差率反映市场多空情绪 | CFFEX 数据 |
| 新闻文本情绪(进阶) | NLP 对财经新闻标题做情感打分 | 大模型 API / 本地模型 |
务实建议:个人投资者从北向资金流向和融资余额变化率两个情绪因子起步——数据免费、逻辑直观、A 股文献支持多。NLP 新闻分析属于锦上添花,初期不必碰。
5.2 突发事件的量化处理
突发事件(政策发布会、国际冲突、突发新闻)很难用传统量价因子捕捉,但有三种处理思路:
-
事后过滤而非事前预测(最务实):不试图预测事件发生,而是在事件发生后检测异常波动并自动暂停策略。本项目
quant_data_pipeline_demo.py中的涨跌停标记就是一种"flag and skip"模式——标的触发涨跌停 → 标记 → 策略层跳过该标的。 -
波动率缩放:当已实现波动率突然放大(说明有事件冲击),自动降低仓位。实现简单、效果扎实:
目标仓位 = 基础仓位 × (目标波动率 / 近期已实现波动率) -
文本情绪监控:用大模型对财经新闻标题做情感分析,构建日频情绪指数。当前有大模型后门槛大幅降低——可以用本地模型批量打分。属于"另类数据因子"的范畴,初期可选。
5.3 LLM 辅助量化分析:两个务实场景
现有 Demo 系列完全没有触及 LLM(大语言模型)在量化中的应用。这不是让你用 ChatGPT 预测股价——那是玄学。以下两个场景是 LLM 在量化中真正有实用价值的方向,也是市面 AI 量化书籍(如《DeepSeek+Python 量化交易》)中为数不多的值得关注的内容。
场景一:非结构化信息 → 结构化情绪因子
传统量价因子(动量、波动率、流动性)是 Demo 4 的核心,但市场情绪信息大多藏在文本里——财经新闻、公告、研报、社交媒体。LLM 让个人投资者也能批量处理这类非结构化数据:
工作流:
每日收盘后
→ 用 AKShare/Tushare 获取当日财经新闻标题列表
→ 批量送 LLM
prompt: "以下是一条财经新闻,请判断它对A股市场
的情绪影响:看多/中性/看空。只回复一个词。"
→ 汇总当日 "看多率 − 看空率" 作为情绪因子原始值
→ 做滚动标准化(Z-score),得到日频情绪因子
注意事项:
- 用本地模型(Ollama + Qwen/Llama 等 7B 级模型)可以零成本跑,速度足够覆盖日频
- 情感分类只用标题即可(延迟低、成本低),全文分析留到需要深度解读的场景
- 情绪因子的 IC 通常较低(0.02-0.04),但与传统量价因子相关性低,合成后能提升 ICIR
- 需要小心 Look-Ahead:如果你用 LLM 解读盘后新闻,信号只能在次日使用
场景二:回测报告的自动解读
你跑完回测得到一串绩效数字(Sharpe 1.2, MaxDD -18%, Calmar 0.8...),这些数字真正意味着什么?LLM 可以做有价值的"翻译":
Prompt 示例:
"以下是一个ETF轮动策略的回测绩效:
- 夏普比率:1.15
- 最大回撤:-22.3%,发生在 2022年3月
- 月度胜率:58%
- 年化收益率:13.2%
- 换手率:月均 35%
请分析:
1. 这些指标的整体评价
2. 最大回撤发生在什么市场环境下(提示:2022年3月 A股处于什么阶段)
3. 这个策略最可能在什么市场环境下失效
4. 实盘中需要额外关注的风险点"
这比你自己盯着一串数字琢磨半小时有效得多。关键是——LLM 不是替你决策,而是帮你更全面地理解你的策略在历史上的行为特征。
LLM 在量化中的定位边界
| 能用 LLM 做的 | 不该用 LLM 做的 |
|---|---|
| 文本情感 → 因子值 | "帮我写一个稳赚的策略" |
| 回测报告解读 | 直接预测股价涨跌方向 |
| 代码辅助与调试 | 替代回测(LLM 不知道数据里的陷阱) |
| 参数优化建议(需结合回测验证) | 直接给调仓决策(你才是最终负责人) |
一句话:LLM 是研究助理,不是交易员。它可以帮你从文本中提取信号、帮你理解回测结果、帮你写代码——但最终的策略逻辑、风险控制和执行纪律,必须是你自己理解并负责的。
6. 从 Demo 到实盘:平台与工具链
6.1 三条实现路径
Demo 代码在本地跑跑看图表是"研究阶段"。实盘涉及三个层次:
┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ 研究平台 │ ──▶ │ 执行平台 │ ──▶ │ 券商终端 │
│ 因子→回测 │ │ 信号→订单 │ │ 成交回报 │
└──────────────┘ └──────────────┘ └──────────────┘
路径一:Python 开源框架 + 券商 API(最主流,推荐)
| 框架 | 定位 | 特点 |
|---|---|---|
| vnpy | 全栈交易框架 | 对接国内券商 CTP/XTP 接口,支持 A 股/期货/期权实盘,社区活跃 |
| Backtrader | 回测为主 | 灵活的事件驱动架构,实盘对接需自行开发 |
| Qlib (微软) | 因子研究 | AI 驱动的因子挖掘和模型训练,适合因子研究阶段 |
| Zipline-Reloaded | 回测引擎 | 事件驱动架构完善,但 A 股生态较弱 |
典型工作流:
- 在 Qlib 或自定义代码中做因子研究 ← 你现在的阶段
- 用 Backtrader 做精细回测(含滑点/冲击成本模型)
- 用 vnpy + 券商仿真环境做模拟交易(纸交易,至少跑 1-2 个月)
- 确认策略行为正常后,接入小资金实盘(不是全仓!)
- 策略稳定运行 3-6 个月后,逐步增加资金
路径二:在线量化平台(低门槛)
| 平台 | 特点 |
|---|---|
| 聚宽 (JoinQuant) | 网页端写 Python 策略,内置回测 + 模拟交易,社区教程丰富 |
| 米筐 (RiceQuant) | 类似聚宽,数据质量和覆盖更优但偏机构 |
| 掘金 (MyQuant) | 支持本地化部署 + 实盘,灵活度更高 |
| BigQuant | AI 导向,可视化拖拽搭建,适合不想写代码的投资者 |
优点:数据现成、回测环境标准、模拟交易一键启动。
缺点:策略代码运行在平台上,灵活性受限;实盘通常走指定券商。
路径三:券商自带量化终端
| 券商 | 平台 | 特点 |
|---|---|---|
| 华泰证券 | MATIC | 内置因子库 + 策略模板,适合入门 |
| 中泰证券 | XTP | 极速交易接口,面向程序化交易 |
| 国信证券 | iQuant | 类似聚宽的在线平台 |
| 中信建投 | 蜻蜓点金 | 量化策略商城模式 |
6.2 Demo 代码到实盘需要增补的模块
以 quant_etf_rotation_demo.py 为例,从 Demo 到可实盘运行,至少需要做:
| 步骤 | 内容 | 优先级 |
|---|---|---|
| 1. 替换数据源 | 合成数据 → AKShare/Tushare 真实 ETF 日线 | 必须 |
| 2. 接入交易日历 | 使用 exchange_calendars 或 A 股专用日历 |
必须 |
| 3. 信号与执行分离 | run_rotation_backtest() 拆成"信号计算"+"订单执行" |
必须 |
| 4. 仓位校验 | 检查涨跌停、停牌、流动性、最小交易单位 | 必须 |
| 5. 风控层 | 单只 ETF 最大仓位、最大回撤止损线、连续亏损暂停机制 | 强烈建议 |
| 6. 日志与告警 | 调仓清单输出、异常情况推送(企业微信/钉钉/邮件) | 强烈建议 |
| 7. 模拟交易验证 | 在真实券商仿真环境跑 1-2 个月 | 强烈建议 |
| 8. 参数稳健性检验 | 对 top_k、回望期、再平衡频率做敏感性分析 | 建议 |
| 9. 绩效归因 | Brinson 归因 / 因子归因,确认收益来源 | 进阶 |
以下对其中两项(数据接入 + 风控层)展开详细说明,因为它们是 Demo 到实盘跨度最大的两步,也是市面量化入门书(如《DeepSeek+Python 量化交易》)几乎不涉及的内容。
6.3 真实数据接入:合成数据的第一个"暴击"
现有 Demo 全部使用合成数据(GBM / 因子模型生成),好处是零门槛运行,但切换到真实数据时会遇到以下几类合成数据没有的问题:
问题 1:停牌导致的日期错位
真实 A 股数据中,不同标的停牌日期不同。直接 pd.concat 多个标的的收盘价会得到参差不齐的日期索引。关键是只做 ffill(向前填充),禁止 bfill——bfill 会用"复牌后的未来价格"填补停牌前的 NaN,这是典型的 Look-Ahead Bias。
正确做法:
price_panel = price_panel.ffill() # 只看向历史
price_panel = price_panel.dropna(how='any') # 仍有 NaN 的行丢弃
问题 2:ETF 净值 vs 市价的差异
ETF 有两个价格——IOPV(实时估算净值)和市价。Demo 7 的轮动策略用收盘价回测是合理的,但实盘中 ETF 可能出现折溢价(市价显著偏离净值),这在极端行情下会影响实际成交价格。实盘代码应该用市价做信号计算和回测,但需要理解 ETF 的折溢价风险。
问题 3:数据源的选择
| 数据源 | 优势 | 劣势 |
|---|---|---|
| AKShare | 免费、覆盖面广、更新及时 | API 偶尔不稳定,部分接口可能变更 |
| Tushare Pro | 稳定、文档全、数据质量高 | 需要积分(部分接口收费) |
| Baostock | 免费、无需注册 | 更新慢、覆盖面有限 |
| 聚宽/米筐数据 | 清洗过、质量最高 | 绑定平台,本地使用受限 |
推荐初次尝试用 AKShare(零成本),策略验证通过后切到 Tushare Pro(稳定性更好)。
6.4 风控层详解:Demo 系列最大的盲区
现有 7 篇 Demo 的风险管理几乎只有"最大回撤"这个事后统计指标。实盘中,风控必须是一个事前和事中的执行层——在亏损发生之前或初期就介入。以下三种风控手段是个人投资者最容易落地且效果最显著的。
手段一:波动率缩放仓位(Volatility Targeting)
这是最简单、最有效、但对策略绩效改善最大的手段。核心思想:当市场最近很"颠簸"(波动率放大),自动减小仓位;当市场平稳,正常仓位。
核心公式:
目标仓位 = 基础仓位 × (目标波动率 / 近期已实现波动率)
示例:
基础仓位 = 100%(满仓)
目标波动率 = 15%(年化,你愿意承受的风险水平)
近期已实现波动率 = 30%(过去 20 日年化) → 仓位 = 100% × 15/30 = 50%
近期已实现波动率 = 10% → 仓位 = 100% × 15/10 = 150%(需设上限)
实现要点:
- 波动率窗口:20-60 个交易日,太短不稳定,太长反应慢
- 仓位上下限:通常设 [30%, 150%] 或 [50%, 100%](不做杠杆)
- 更新频率:每日计算但每周调一次即可(避免过度交易)
- A 股限制:融资账户最高杠杆 1:1,普通账户无法做空
这个手段的妙处在于:它不预测市场方向,只根据"当前有多危险"来调整暴露——是纯粹的防守动作,不会引入新的预测误差。
手段二:硬止损(Hard Stop-Loss)
现有 Demo 的策略出场完全依赖信号(金叉进/死叉出),这在实盘中是不够的。信号可能迟迟不来,而你的亏损已经超出了可承受范围。
简单止损规则:
- 单笔交易止损:持仓亏损超过 -X%(如 -8%或 -15%)→ 无条件平仓
- 月度最大亏损:当月累计亏损超过 -Y% → 暂停交易,下月再评估
- 连续亏损暂停:连续 Z 笔交易亏损 → 暂停,人工审查策略是否失效
参数建议(个人投资者):
- 趋势策略(如动量轮动): X=12-15%,Y=8-10%,Z=4
- 均值回归策略(如 RSI): X=5-8%, Y=5-8%, Z=5
手段三:最大回撤熔断
这是一个组合层面的保护:如果账户从历史最高点回撤超过一定幅度,自动进入"防御模式"。
实现逻辑:
if 当前回撤(从历史最高净值算起) < -25%:
强制减仓至 30%
暂停新开仓
发送告警 → "策略触发最大回撤熔断,净值从峰值回撤 xx%,已自动减仓"
# 回撤恢复到 -15% 以内再恢复交易
这三种手段的组合使用,能把你从"策略失效了才发现"的被动状态,变成"有明确规则控制损失"的主动状态。Demo 系列没有覆盖这些,但它们在实盘中比多找到 0.1 的夏普更重要。
7. 推荐学习与实践路径
7.1 推荐的策略选型(最可行的组合)
核心仓位:月频 ETF 行业轮动
├── 信号:动量 (12-1M) × 估值 (PE 分位数) 双信号过滤
├── 避险:绝对动量为负 → 切换至国债 ETF
├── 增强:北向资金流向 + 融资余额变化作为情绪因子
└── 风控:波动率放大时自动减仓(波动率缩放)
再平衡频率:月度(每月最后一个交易日出信号,次日开盘执行)
预期年换手:6-10 次双边
预期年化成本:约 1.5%-2.5%(含佣金+印花税+滑点)
7.2 分阶段学习路线
| 阶段 | 时间 | 目标 | 对应 Demo |
|---|---|---|---|
| ① 概念建立 | 1-2 周 | 理解数据→信号→回测→优化的完整链条 | 全部 7 篇 Demo |
| ② 数据实战 | 1 周 | 用 AKShare 拉取真实 ETF 数据,替换合成数据重新验证 | Demo 1 + 7 |
| ③ 因子研究 | 2-4 周 | 在真实数据上计算因子 IC,找到有效的因子组合 | Demo 4 |
| ④ 回测验证 | 2-4 周 | 在 Backtrader/vnpy 中实现完整回测,含交易成本 + 参数敏感性 | Demo 2 + 3 |
| ⑤ 模拟交易 | 1-2 月 | 在券商仿真环境中每日自动运行,记录所有交易和意外情况 | — |
| ⑥ 小资金实盘 | 3-6 月 | 用总资金的 10-20% 试跑,严格记录绩效 | — |
| ⑦ 规模扩大 | 持续 | 策略稳定后逐步加仓,持续监控绩效归因和风格漂移 | — |
7.3 最重要的提醒
如果一个策略你不能用三句话解释清楚为什么它会赚钱,就不要投钱进去。
量化策略的核心不是代码有多复杂,而是你理解策略赚的是谁的钱、在什么市场环境下会失效、最大可能亏损是多少。
Demo 给你的是知识地图,不是提款机密码。实盘中最重要的是仓位管理和风险控制——一个夏普比率一般的策略配合严格的仓位纪律,远好于一个夏普很高的策略加上随意的主观干预。
附录 A:关键术语速查
| 术语 | 英文 | 含义 |
|---|---|---|
| 截面策略 | Cross-Sectional Strategy | 在同一时间点横跨多只股票比较和选择 |
| 时序策略 | Time-Series Strategy | 对单一资产做择时(何时进、何时出) |
| 动量崩溃 | Momentum Crash | 趋势突然逆转导致动量策略大幅亏损 |
| 换手率 | Turnover | 组合中资产被替换的比例,越高成本越大 |
| 纸交易 | Paper Trading | 使用真实行情但虚拟资金进行模拟交易 |
| 前视偏差 | Look-Ahead Bias | 用"未来数据"做回测决策导致的虚假高收益 |
| 幸存者偏差 | Survivorship Bias | 只用当前存活的股票回测,忽略了已退市的股票 |
| 风格漂移 | Style Drift | 策略实际持仓偏离了其宣称的投资风格 |
附录 B:市面入门书 vs 本 Demo 系列——以《DeepSeek+Python 量化交易》为例
市面上很多量化交易入门书看起来很厚(三四百页、几十个案例),但读完往往发现"好像学了很多,又好像什么都没学到"。这里以《DeepSeek+Python 量化交易》(16 章、51 个实战案例)作为典型标本,拆解为什么会有这种感觉,以及它和本 Demo 系列的真实差距。
全书结构
| 板块 | 章节 | 内容 |
|---|---|---|
| Python 基础 | 第 1-5 章 | Python 语法、NumPy/Pandas/Matplotlib、网页爬虫 + Tushare API |
| 策略入门 | 第 6-10 章 | 量化概念、DeepSeek 辅助分析(技术/基本面/消息)、双均线/RSI/海龟策略 |
| 进阶策略 | 第 11-13 章 | 高频交易(概念层)、套利策略、机器学习预测(分类/回归/LSTM) |
| 工程与风控 | 第 14-16 章 | Backtrader 回测、止损止盈/头寸管理/对冲、DeepSeek API + 智能体 |
它的定位
一本面向绝对零基础读者的量化交易科普 + DeepSeek 使用指南。目标读者是"刚学会 Python 甚至还没学 Python 的人"。全书 51 个案例覆盖面极广,但每个案例的深度有限——典型模式是:"拉数据 → 套一个经典公式 → 画图 → 把结果扔给 DeepSeek 解读 → DeepSeek 给优化建议"。
它有价值的部分
书中真正值得关注的内容集中在三个 Demo 系列没有覆盖的方向:
- 真实数据接入(第 5 章):用 Tushare API 拉取 A 股真实数据的流程,虽然讲得浅,但方向对——这是 Demo 到实盘的第一道坎
- 风险管理工具(第 15 章):止损止盈、波动率头寸管理、对冲组合——这些是 Demo 系列最大盲区,详见本文 §6.4
- LLM 辅助分析(第 7、16 章):用 LLM 处理非结构化信息(公告解读、新闻情绪、策略回测解读)——这是这本书唯一真正的差异化内容,详见本文 §5.3
它的问题
| 问题 | 说明 |
|---|---|
| 策略覆盖面过时 | 双均线 + RSI + 海龟是 1980-1990 年代的经典。现代量化核心——因子模型、截面选股、组合优化——完全没有涉及 |
| 高频章节名不副实 | 第 11 章名为"高频交易",实际是概念科普 + 一个比亚迪案例。真正的高频涉及 colocation/FPGA/市场微观结构,书中完全无法覆盖——这会误导读者以为"写个 Python 脚本就是高频交易" |
| 深度学习案例浮于表面 | LSTM 预测股价只用一个案例,无时间序列交叉验证、无样本外泛化讨论——容易让初学者产生"跑个模型就能预测股价"的危险错觉 |
| DeepSeek 角色被过度包装 | 书中几乎每个案例都以"DeepSeek 辅助优化"结尾。但 LLM 对量化策略的优化能力完全取决于 prompt 质量和用户自身的判断力——书中没有讨论这个根本局限 |
| 回测严谨性近乎为零 | 不涉及过拟合检测、前视偏差、幸存者偏差、参数敏感性——而本 Demo 系列的事件驱动回测和滚动前向验证专门解决了这些问题 |
| 无 A 股特有规则的系统讨论 | 涨跌停、T+1、融券限制、印花税——这些在本 Demo 系列的 doc_06 和 doc_07 中有专门覆盖,书中几乎没有 |
两种学习路径的对比
| 维度 | 《DeepSeek+Python量化交易》 | 本 Demo 系列 |
|---|---|---|
| 目标读者 | 零基础(从 Python 安装开始) | 有 Python 基础,缺少量化方法论 |
| 学习方式 | 广度优先 — 51 个案例快速扫一遍 | 深度优先 — 5-7 个主题层层递进 |
| 策略类型 | 经典技术指标策略(均线/RSI/海龟) | 因子模型 + 截面选股 + 组合优化 |
| 回测方法论 | 仅 Backtrader 基本使用 | 向量化 → 事件驱动 → 前向验证,完整链条 |
| 学术严谨性 | 较低 — 不涉及 IC/ICIR/因子预处理 | 较高 — IC 分析、去极值/Z-score/中性化、Ledoit-Wolf |
| A 股实操 | 无系统讨论 | 实盘指南(doc_06)+ ETF 轮动策略(doc_07) |
| AI 角色 | DeepSeek 贯穿全书,定位为"策略顾问" | 无 AI 依赖,本文 §5.3 补充了 LLM 的务实用法 |
| 代码复杂度 | 简单脚本级别 | 类 + 函数封装,模拟生产级结构 |
一句话总结
这本书能让你从"完全不会 Python"跑到"能跑通第一个策略脚本",但从"跑通脚本"到"独立做量化交易"所需的系统知识——因子研究、稳健回测、组合构建、风险控制、A 股实盘陷阱——它几乎没有涉及。而这些东西恰好是本 Demo 系列所覆盖的。两套内容存在一定的互补性:用那本书学会 Python 基础,用这套 Demo 学会量化方法论。