注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

QuantsGeek量化极客

量化投资日记

 
 
 

日志

 
 

量化投资在中国市场应用之四(指数基金构建与实证)  

2010-09-17 14:45:22|  分类: 量化投资论文集 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

被动投资理念的兴起起源于华尔街随机漫步理论,其理论认为“投资分析通常浪费时间,没有人能战胜市场”。被动投资理论的雏形最早由学者Bachelier1900)在法国提出。之后,被动投资学派形成了一致观念:“事实上,基金经理普遍不能战胜市场,我们可以做的是廉价复制指数,而不是昂贵地购买共同基金和指数基金”。相反,Nigel1989)也同时指出:“指数基金构建基本假设和短期技术分析原理一样,即指数基金筛选的股票间的统计关系将在长时间内保持不变,显然,随着时间的流逝,这一假设将变得不那么现实”。

 

虽然指数基金公司的数目近年不断上升,我们可以找到指数基金文献数量却寥寥无几。在过往的30年的文献中,我们可以发现五个曾经做过指数基金研究的学者。他们分别是 Rudd1980)涉及在美国的指数基金;Andrews1986)检验了英国的指数基金的有效性;NIGEL1989)研究日本股票的市场数据,并提供了基于跟踪误差最小化的四种不同算法合成指数基金,同期在1990年他也提出过英国股票指数基金复制解决方案;雄田端和武田英二(1995)开发了一种有效的算法来为纽约证券交易所股票合成指数基金,最大限度地减少了跟踪误差。下面让我们来具体讨论了被动投资方法和原理。

 

关于定量的被动投资,我们需要复制的指数。通常我们有两个步骤来完成投资组合建构。首先,我们需要选择的股票,其次我们需要对选择的股票进行权重分配。现在让我解释一下整个过程如下:

 

合成指数基金第一步在于选股,我们将股票权重和行业因素作为两大考虑因素。总体来说,我们有三种方法来选择股票,他们分别是全样本复制,分层抽样和权重选股。

 

?  全样本复制是抽取构成基准指数的所有股票

?  权重抽样意味着抽样权重较高的股票,以配合市场的整体行为。

?  分层抽样意味抽选部分股票以达到和基准指数相同的行业分配情况和权重比例。从图1中,我们可以清楚地看出分层抽样的具体方法:

 

量化投资在中国市场应用之四(指数基金构建与实证) - 琦少 - 撒拉弗琦少

 

图一

 

对于全样本复制方法,虽然跟踪误差最小,但将牵涉到非常高的交易成本和冲击成本,因此它是在实践中通常不使用。分层抽样的方法一方面从理论和优化方面,更加科学,易于实现,容易取得更好的优化结果。同时由于成份股数量较少并且冲击成本较小,在实践中被较多使用。

 

指数基金合成的第二步是组合构建。当我们选择了股票组合以后,接下来我们需要分配权重。在本文中,我将用三种优化求解方法进行指数模拟,它们依次是跟踪误差最小化法,相关系数最大法以及Beta 系数法。对跟踪误差的公式可描述为如下: 

量化投资在中国市场应用之四(指数基金构建与实证) - 琦少 - 撒拉弗琦少

 我们可以看到从上面的公式,优化算法的基本条件,要么保证跟踪误差最小化或者确保相关系数最大化,这两种方法的限制条件是相同的: 个别股票的权重是01之间;个别股票的权重总和为1

 

最后,我提供了第三种方法来模拟指数,虽然这种方法不太流行。我将这种方法称为Beta构建法。这种方法的原理和前两种一样,约束条件也是相同的,唯一不同的是优化条件为Beta = 1。在我的实证研究,我将用VB.Net平台的牛顿切线法进行规划求解,完成指数基金构建的金融模型。

 

实证部分:

这部分将展示在中国股票市场的被动投资(指数基金构建)的应用。理论部分已经介绍了被动定量投资的2个步骤:第一个是选股,第二个是模拟权重。在实证测试,我通过VBA开发了一个指数基金模型,模型界面见图二,基本包括分层抽样和权重选股两种选股模式和三种优化求解方法(跟踪误差最小化,Beta,相关性最大化)。

 

量化投资在中国市场应用之四(指数基金构建与实证) - 琦少 - 撒拉弗琦少

 

图二

 

实证部分我只采用分层抽样的方法,分层将覆盖9大产业和67个权重股,同时我将应用这三种模拟方法分别构建三种不同投资组合,并比较其与基准的业绩对比情况。在附录中,我列出的这67只个股构成,行业别,电脑模拟的权重分配以及自2010年以来个股对应的价格变动。

 

样本期间从200961日开始至20091231日。在2009年半年数据基础上,我使用了前述3种优化求解方法进行指数模拟。表一中列出在样本期间和样本外预测期间业绩的表现(201011日至2010813日)。该表左边的部分是在模拟时刻的各项统计指标汇总,而右边部分描绘了8个月后的各个统计指标实际结果。从表中可以发现这三种优化求解方法的模拟,经历了8个月,在不改变任何个股构成和权重的前提下,业绩表现依然相当成功。在这三种方法相关系数法表现最好,8个月后相关系数依然保持99.46%和跟踪误差仅为0.13%。

 

模拟点时组合各项指标表现

8个月后组合各项指标表现

跟踪误差法

跟踪误差法

Tracking Error

0.09%

Tracking Error

0.13%

Correlation Coefficient

99.86%

Correlation Coefficient

99.50%

Beta

1.00

Beta

0.98

相关系数法

相关系数法

Tracking Error

0.10%

Tracking Error

0.13%

Correlation Coefficient

99.86%

Correlation Coefficient

99.46%

Beta

1.02

Beta

0.99

Beta

Beta

Tracking Error

0.16%

Tracking Error

0.13%

Correlation Coefficient

99.57%

Correlation Coefficient

99.51%

Beta

1.00

Beta

0.98

表一

 

从三种模拟指数基金组合的业绩与基准比较表我们可以得出类似结论。表二提供了沪深300的表现与三种模拟指数基金组合回报对比,同时也提供了在中国股市8个主流指数基金业绩的对比。从表中我们发现了相关系数模拟方法在三种模拟方法最好,在样本外预测期,得到回报最接近于沪深300Beta构建的方法得到最高的回报,但是从指数基金建设的原则上来说表现是最差的,因为它与基准的偏差8个月后最高。最后,我将相关系数求解方法与主流指数基金的表现相比较,它也得到最好的业绩(8个月后,与沪深300最终误差最小)。

 

组合名称

2010-1-1 to 2010-8-13

沪深300全收益

-20.14%

跟踪误差法模拟指数基金

-19.62%

相关系数法模拟指数基金

-20.10%

Beta法模拟指数基金

-18.64%

100ETF

-16.94%

华安180ETF

-20.78%

交银180ETF

-22.30%

红利ETF

-23.00%

工银50ETF

-25.12%

华夏50ETF

-23.37%

南方ETF

-7.98%

博时 ETF

-20.33%

表二

 

最后,我将这3种模拟方法的累计回报和沪深300收益累计回报在图三进行了对比。结果表明,这三个模拟方法非常成功地模拟沪深300指数,直观上看,从模拟时间开始8个月后,全部保持与指数最小的跟踪误差。

量化投资在中国市场应用之四(指数基金构建与实证) - 琦少 - 撒拉弗琦少

图三

 

虽然中国股市不像发达国家那样有效,信息披露机制也并不公平公开,但被动投资的方法在中国A股市场却表现较为有效。从实证的角度看,相比主动投资方式,被动的定量投资结果更为激动人心。根据最近的一次与基金公司的采访,上述现象的部分原因来自于落后的资讯科技应用,同时,在指数基金领域,有较少的定量分析师能独立写计算机编码,通常依靠内部IT部分完成,从需求分析到最终的产品间总是存在这样那样的不一致性。同时也有部分基金依赖于一些所谓的“黑匣子”的软件造成算法的不公开和后期组合维护的难度。

 

 

  评论这张
 
阅读(332)| 评论(3)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017