Python量化交易06——Fama-French三因子模型(Rmt,SMB,HML)

这篇具有很好参考价值的文章主要介绍了Python量化交易06——Fama-French三因子模型(Rmt,SMB,HML)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  参考书目:深入浅出Python量化交易实战


 本次带来的是著名的获得了诺贝尔奖的三因子模型。

因子模型介绍

Fama和French从可以解释股票收益率的众多因素中提取出了三个重要的影响因子,即市场风险溢酬因子、市值因子和账面市值比因子B/M Ratio,仿照CAPM模型用这三个因子建立起来一个线性模型来解释股票的收益率,这就是著名的三因子模型(Fama and French Three Factor Model,简称FF3)。

三因子模型中的3个因子均为投资组合的收益率:
市场风险溢酬因子(Rmt)对应了(市场投资组合的收益率减去无风险利率);

市值因子(SMB)对应了做多市值较小的公司与做空市值较大的公司的投资组合带来的收益率;

账面市值比因子(HML)对应的是做多高BM公司、做空低BM公司的投资组合带来的收益率。

三因子模型的形式为:

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

其中SMB(Small Minus Big)为市值因子,也就是小公司比大公司高出的收益率,HML(High Minus Low)代表账面市值比因子,用高B/M比股票减去低B/M比股票的收益率得到;     分别为投资组合(或单只股票)的收益率对三个因子的敏感系数。

实证模型上常用:

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

来做回归检验,公式中就是我们通常说的超额收益率。在进行实证研究时,投资组合(或个股)收益率Rit、无风险利率 Rft、市场投资组合Rmt、市值因子SMBt和账面市值比因子组合HMLt都是已知的,通过线性回归拟合最小化残差平方和我们可以得到参数, ,   , 的估计值,检验超额收益及三个因子的系数是否显著地异于0,也就是检验三个因子是否能够届时收益率。

这里的 和 就是我们平时买基金看到的阿尔法和贝塔值,说起来很神秘,其实就是一个回归的截距和系数。整体的三因子模型,说白了就是三元线性回归,最小二乘就能求解的那种。

三因子四因子五因子,就是用3个X,4个X,5个X进行回归。变量X分别是

FF三因子:SMB HML MKT
Carhart四因子:SMB HML MKT UMD
FF五因子:SMB HML MKT RMW CMA


因子数据获取

知道了因子模型的真实面目后,那么这些X怎么来?

一般大型数据公司都会计算好了,直接用就行。我这里找了一个央财的金融院的因子模型的数据,有安装日期,也有周,月,年的数据。本文使用的日期性数据。

链接:五因子数据的更新(2022年10月份数据)-中央财经大学金融学院 (cufe.edu.cn)

唯一的缺点是,只更新到22年10月...没有很及时更新,后续更新可以继续关注央财金融院官网。


数据读取

先导入常用的包

import baostock as bs
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams ['font.sans-serif'] ='SimHei'               #显示中文
plt.rcParams ['axes.unicode_minus']=False               #显示负号

读取因子数据,选取需要的三因子:

factors = pd.read_csv('fivefactor_daily.csv', index_col = 'trddy',parse_dates=['trddy'])
factors = factors[['mkt_rf','rf','smb','hml']].copy()
three_factors = factors['2021-11-01':'2022-11-1']
three_factors.head()

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

变量名称说明:
trdyr trdwk trdmn trddy [交易日期]
mkt_rf [市场风险因子]
smb [规模风险因子]
hml [账面市值比风险因子]

这里选取了2021年11月到2022年11月的数据。

利用证券宝获取需要分析的股票收盘价数据,这里选择使用中国平安作为样例,同样也是时间为2021年11月到2022年11月的数据。

lg = bs.login()
# 获取沪深A股601318的历史K线数据
rs_result = bs.query_history_k_data_plus("sh.601318",  fields="date,open,high,low,close,volume",   
                        start_date='2021-11-01',   end_date='2022-11-1',  
                        frequency="d",  adjustflag="3")
df_result = rs_result.get_data()
bs.logout()
df_result=df_result.set_index('date')
df_result=df_result.astype('float64')
df_result.head()

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

查看一下数据的长度

len(three_factors),len(df_result)

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

是一样长的,一年大概244个交易日。


收益率计算分析

#计算对数收益率,画图查看

day_return = np.log(df_result['close'] /df_result['close'].shift(1))
day_return.dropna(inplace = True)
day_return.name = 'Return'
day_return.plot(figsize=(7,3))
plt.title('中国平安日收益率')
plt.show()

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

 将因子数据和每日的对数收益率合并

zgpa_threefactor = pd.merge(three_factors, day_return,left_index=True, right_index=True)
zgpa_threefactor.head()

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

画散点图进行分析

sns.pairplot(zgpa_threefactor[['mkt_rf','smb','hml','Return']])

 三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

 可以看到收益率和其他三个因子其相关性可能没有那么明显呈现线性关系。

 计算相关系数,画热力图

 sns.heatmap(zgpa_threefactor[['mkt_rf','smb','hml','Return']].corr(),annot=True,square=True)

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

 相关性都一般,收益率和Rmt这个因子相关性较大一点。


回归模型

import statsmodels.api as sm
result = sm.OLS(zgpa_threefactor['Return'], sm.add_constant(zgpa_threefactor.loc[:,['mkt_rf','smb','hml']])).fit()
result.summary()

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

 可以看到除了截距,其他三个因子的系数都是显著的。

返回系数列表

list(result.params)

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

带入模型 

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

可以得到最终计算的模型结果为:

Ri-0.000041=-0.0007+0.8099mkt_rf-0.5288SMB+0.7271hml


其他指标计算 

评价一个投资收益有很多指标,其中总收益率,最大回测率,夏普比率,信息比率是常用的四个指标,其计算公式分别为:

策略收益:也就是总收益率,这是最基础的指标,金融中我们也叫单期简单收益率,衡量回测期间策略收益率的。简单说就是期末资产额减去起始资产额再除以起始资产额,这里用了资产意思就是包括现金和持有的股票的价值。

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

 最大回撤:最大回撤率是一个衡量策略风险的重要指标,越小越好

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

 夏普比率:表示每承受一单位总风险,会产生多少的超额报酬,肯定是越大越好。夏普比率是在资本资产定价模型进一步发展得来的。

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

 信息比率:衡量单位超额风险带来的超额收益。信息比率越大,说明该策略单位跟踪误差所获得的超额收益越高,因此,信息比率较大的策略的表现要优于信息比率较低的基准。合理的投资目标应该是在承担适度风险下,尽可能追求高信息比率。

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

代码为:

def sum_return_ratio(price_list):
    '''实际总收益率'''
    price_list=price_list.to_numpy()
    return (price_list[-1]-price_list[0])/price_list[0]
def MaxDrawdown(price_list):
    '''最大回撤率'''
    i = np.argmax((np.maximum.accumulate(price_list) - price_list) / np.maximum.accumulate(price_list))  # 结束位置
    if i == 0:
        return 0
    j = np.argmax(price_list[:i])  # 开始位置
    return (price_list[j] - price_list[i]) / (price_list[j])
def sharpe_ratio(price_list,rf=0.000041):
    '''夏普比率'''
    #公式 夏普率 = (回报率均值 - 无风险率) / 回报率的标准差
    # pct_change()是pandas里面的自带的计算每日增长率的函数
    daily_return = price_list.pct_change()
    return daily_return.mean()-rf/ daily_return.std()
def Information_Ratio(price_list,rf=0.000041):
    '''信息比率'''
    chaoer=sum_return_ratio(price_list)-((1+rf)**365-1)
    return chaoer/np.std(price_list.pct_change()-rf)

计算上述的中国平安的相应的四个指标为:

sum_return_ratio(df_result['close']),MaxDrawdown(df_result['close']),sharpe_ratio(df_result['close']),Information_Ratio(df_result['close'],rf=0.000041)

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型


多公司对比 

将上述流程推广为更加一般的形式,定义一个函数,输入证券代码和开始结束日期,就能自动计算出这些因子的bata系数和这些指标:

def deal(stock='sh.601318',start_date='2021-11-01',end_date='2022-11-1'):
    lg = bs.login()
    rs_result = bs.query_history_k_data_plus(stock,  fields="date,close", start_date=start_date,end_date=end_date, frequency="d", adjustflag="3")
    df_result = rs_result.get_data()
    df_result=df_result.set_index('date')
    df_result=df_result.astype('float64')
    bs.logout()
    three_factors = factors[start_date:end_date]
    assert len(three_factors)==len(df_result), "数量长度不一样" 
    
    day_return = np.log(df_result['close'] /df_result['close'].shift(1))
    day_return.dropna(inplace = True)
    day_return.name = 'Return'
    zgpa_threefactor = pd.merge(three_factors, day_return,left_index=True, right_index=True)
    result = sm.OLS(zgpa_threefactor['Return'], sm.add_constant(zgpa_threefactor.loc[:,['mkt_rf','smb','hml']])).fit()
    betas=result.params
    实际总收益率=sum_return_ratio(df_result['close'])
    最大回测率=MaxDrawdown(df_result['close'])
    夏普比率=sharpe_ratio(df_result['close'])
    信息比率=Information_Ratio(df_result['close'])
    return pd.DataFrame({'阿尔法':betas[0],'贝塔':betas[1],'市值因子SMB':betas[2],'账面市值因子HML':betas[3],
                        '实际总收益率':实际总收益率,'最大回测率':最大回测率,'夏普比率':夏普比率,'信息比率':信息比率},index=[stock])

我们拿贵州茅台去试试:

deal(stock='sh.600519')

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

可以返回上面的说的所有指标。

这样就能写循环,计算你所有想计算的股票了。

stocks=['sh.601318','sh.600519','sh.600416','sh.600765','sh.600535','sz.300129','sh.600036','sz.000001']
df_deals=pd.DataFrame()
for s in stocks:
    df_deal=deal(stock=s)
    df_deals=pd.concat([df_deals,df_deal],axis=0)

 计算了上述8家公司

df_deals

三因子模型,Python量化交易,python,pandas,量化策略,量化交易,因子模型

可以看到很便捷的算出了所有公司的指标。然后可以比较排序关注的指标进行策略选股了。

(本案例仅用于策略研究,不构成任何投资意见) 


创作不易,看官觉得写得还不错的话点个关注和赞吧,本人会持续更新python数据分析领域的代码文章~(需要定制代码可私信)文章来源地址https://www.toymoban.com/news/detail-781795.html

到了这里,关于Python量化交易06——Fama-French三因子模型(Rmt,SMB,HML)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python:Python编程:金融量化交易

    在金融量化交易中,下面几个模块是应用的比较广泛的 numpy (Numberic Python) : 提供大量的数值编程工具,可以方便的处理:向量矩阵等运算,相比高昂的 matlab , NumPy的出现使 Python得到了更多人的青睐。 scipy : 更多应用于 统计,优化,差值,数值积分,时频率转换等领域 Pandas

    2024年02月07日
    浏览(29)
  • 【粉丝福利社】AI时代Python量化交易实战:ChatGPT让量化交易插上翅膀(文末送书-完结)

    🏆 作者简介,愚公搬代码 🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,51CTO博客专家等。 🏆《近期荣誉》:

    2024年02月03日
    浏览(40)
  • 【粉丝福利社】AI时代Python量化交易实战:ChatGPT让量化交易插上翅膀(文末送书-进行中)

    🏆 作者简介,愚公搬代码 🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,51CTO博客专家等。 🏆《近期荣誉》:

    2024年02月04日
    浏览(36)
  • Python量化交易策略--双均线策略及代码

            双均线策略是比较经典的策略,股票的价格均线是投资参考的重要指标。均线有快线和慢线之分,当快线向上穿过慢线则是金叉,一般执行买入操作,当快线向下穿过慢线时则形成死叉,一般执行卖出操作。基于这个基本思路,出于兴趣爱好,便使用python复现了这个

    2023年04月11日
    浏览(62)
  • 【python量化交易】qteasy使用教程04 -使用内置交易策略,搭积木式创建复杂交易策略

    @ 目录 使用内置交易策略,组合成复杂策略 开始前的准备工作 本节的目标 多重策略以及策略组合 定义策略组合方式 blender blender 示例 使用四则运算符定义blender表达式 使用逻辑运算符定义blender表达式: blender表达式中还可以包含括号和一些函数: blender 表达式中每个策略可

    2024年04月14日
    浏览(30)
  • 你应该知道的21大Python量化交易工具

           技术可用性的快速增长使个人交易者也能够进行系统和算法交易。下面为大家分享2022年 Python 量化交易使用最广泛的21大交易平台和框架、经纪自营商、数据提供商和其他有用的交易库等,这些交易库适用于搭建个人完整的量化分析和交易系统。 一、云交易平台    

    2023年04月08日
    浏览(29)
  • 量化交易——python数据分析及可视化

    数据来源:tushare 数据字段包含:日期,开盘价,收盘价,最低价,最高价,涨跌 需要计算的数据:macd,diff,dea (1)计算指数移动平均值(EMA) 12日EMA的算式为 EMA(12)=前一日EMA(12)×11/13+今日收盘价×2/13 26日EMA的算式为 EMA(26)=前一日EMA(26)×25/27+今日收盘价×2/27 (

    2024年02月15日
    浏览(27)
  • 量化交易与人工智能:Python库的应用与效用

    💂 个人网站:【 海拥】【神级代码资源网站】【办公神器】 🤟 基于Web端打造的:👉轻量化工具创作平台 💅 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 量化交易是一种利用计算机算法执行交易策略的交易方法,它依赖于严格定义的规则和数学模型,而非人

    2024年02月05日
    浏览(36)
  • AI时代Python量化交易实战:ChatGPT引领新时代

    ChatGPT让量化交易师率飞起来! 金融量化交易新模式 一本专注于帮助交易师在AI时代实现晋级、提高效率的图书 书中介绍了如何使用 ChatGPT 来完成量化交易的各个环节 并通过实战案例展示了ChatGPT在实际量化交易中的应用方法 量化交易新模式:让量化交易更高效、更快捷、更

    2024年02月04日
    浏览(32)
  • (9-5)基于深度强化学习的量化交易策略(OpenAI Baselines +FinRL+DRL+PyPortfolioOpt):深度强化学习算法模型

    本项目的深度强化学习算法的是基于Stable Baselines实现的,Stable Baselines是OpenAI Baselines的一个分支,经过了重大的结构重构和代码清理工作。另外,在库FinRL中包含了经过调优的标准深度强化学习算法,如DQN、DDPG、多智能体DDPG、PPO、SAC、A2C和TD3,并且允许用户通过调整这些深度

    2024年01月25日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包