2008-04-12

藤田郁雄の「サバイバル・インベストメント」

http://wiredvision.jp/blog/fujita/200804/200804101300.html
へトラックバックをつけたいのですが、つけ方が分かりません(汗)

> 騰落率をSTDEVP関数(*4)で処理すれば標準偏差が求まります。
> これでTOPIX連動型上場投資信託の月間騰落率は、平均値+0.15%からおおよそ±4.41%の範囲で存在するだろうということが分かると思います。
> *4: 証券価格から値動き自体の標準偏差を推定する場合はn-1法が望ましいと考える。
しかしnないしn-1.5の適用が望ましい場合もあるのだが、これは統計学の領域に大きく踏み込む為ここでは割愛。

と書かれていますが、私がやってみるとn-1法のSTDEV関数を使わないと4.41%という数字になりません。

> 投資の教科書では、証券の騰落率は「正規分布」に従うと仮定して考えます。

対数をとってから正規分布を考えます。これは倍になる(+100%)と半分になる(-50%)を対等に扱うためです。厳密には対数をとっても裾の方は正規分布にならず冪分布なのですが、それは些細なことで、対数を取るか取らないかが肝です。

数字の解釈としても、日次ではなく月間騰落率で
> 平均値+0.15%からおおよそ±4.41%の範囲で存在するだろう
これではリスクに対してリターンが低すぎて、普通預金、MMFの方が良いです。
この解析結果をインデックス投資擁護の視点から解釈するならば「この期間の数字だけを見ると今なら預金したほうが良いように見えるが、リターンの源泉、より長期間あるいは他の市場の数字を見るとインデックス投資の優位性はあるので、数年の間預金に負けることがあってもインデックス投資を続けるべき」でしょう。

インデックス投資を否定するわけではないです。
資本主義の発展に最もローコストに乗る手法としては最善だと思います。
但し、数量的に判断しようと思うなら、計算方法及び計算結果の良し悪しを正しく理解しなければなりません。
例えば、全く同じ期間で同じ計算をフィデリティ・日本成長株ファンドに対して行うと、
平均値+0.29%からおおよそ±5.61%
ということになって
「TOPIX連動型上場投資信託を300万円買うより、フィデリティ・日本成長株ファンドを200万円買う方がローリスク・ハイリターンです」
という、アクティブファンド営業者の宣伝文句にそのまま使えてしまいます。
これは対数をとらずに解析したことによります。
・2年連続0%リターン
・一年目は+25%、二年目は-20%
・一年目は+100%、二年目は-50%
どのケースも二年通してのリターンはゼロですが、対数を取らずに単純にリターンの算術平均を求めると後のものほど良くなります。
実はここから、売買手数料や税金の繰り延べ効果を考えないなら、インデックスファンドの単純バイアンドホールドより有利な方法へのヒントに繋がるのですが、それは話題がそれますのでまた今度。

> 先月TOPIXは新安値を更新し「TOPIX連動型上場投資信託」も1月は-8.19%、2月は-1.9%、3月は-7.75%と急落していきました。しかし、これは未だ-8.67%~+8.97%の間に収まっています。
そもそも今年の3月までのデータ、つまり今年1月とか3月の急落も含んだデータを用いて標準偏差を求めているのですから「想定の範囲内」になるのは当たり前です。-8.67%~+8.97%という数字を求めるために「1月は-8.19%」という数字も使っているのですから。
本当に「想定の範囲内」と言う為には、今年1月より前のデータで標準偏差を求める必要があります。
というわけで毎月の終値の自然対数をとって(常用対数でも数字全体に定数をかけるだけなので、標準偏差の何倍になるか、という時点では関係なくなります)、前月末からの増減を求めます。その昨年末までの平均は0.00292、標準偏差は0.04277ですので2σの範囲ですと-0.08262~+0.08846。一方今年1月は-0.08543ですのでこの範囲から出ています。
「だからインデックス投資は駄目」と言いたいのではなくて「これくらいのことは確率的に起こりうるから、最初から覚悟しておけ」ってことです。

日付始値高値安値終値出来高調整後終値*対数終値2007年末までの平均
2008年4月1,2501,3391,2431,30626,602,0001,3067.174724310.0534718570.002919777
2008年3月1,3001,3171,1571,23869,639,3001,2387.121252453-0.0806638642007年末までの標準偏差
2008年2月1,3601,3921,2901,34275,869,7001,3427.201916318-0.0191887810.042770819
2008年1月1,4531,4531,2391,36878,481,1001,3687.221105098-0.085426301(2008年1月-平均)/標準偏差
2007年12月1,5611,5981,4661,49042,027,5001,4907.306531399-0.038833441-2.065568977
2007年11月1,6521,6581,4351,54955,932,8001,5497.34536484-0.055255737
2007年10月1,6371,7001,5521,63738,366,8001,6377.400620577-0.001221001
2007年9月1,6171,6491,5161,63939,599,2001,6397.4018415790.012277625
2007年8月1,7001,7091,4911,61980,043,7001,6197.389563954-0.058187326
2007年7月1,8061,8151,6851,71661,033,4001,7167.44775128-0.047790664
2007年6月1,7911,8211,7581,80054,478,0001,8007.4955419440.009489326
2007年5月1,7281,7851,7141,78346,227,9001,7837.4860526180.03191154
2007年4月1,7441,7691,7071,72752,451,6001,7277.454141078-0.009221967
2007年3月1,7681,7761,6731,74387,488,9001,7437.463363046-0.013109336
2007年2月1,7371,8431,7231,76661,055,5001,7667.4764723810.017709689
2007年1月1,7101,7681,6661,73549,432,4001,7357.4587626920.020379162
2006年12月1,6241,7041,6101,70040,010,7001,7007.438383530.048819576
2006年11月1,6301,6461,5381,61960,730,8001,6197.389563954-0.007997582
2006年10月1,6341,6881,6111,63246,179,8001,6327.3975615360.004914015
2006年9月1,6371,6651,5521,62435,647,6001,6247.392647521-0.012848142
2006年8月1,5801,6551,5481,64535,326,6001,6457.4054956630.039050515
2006年7月1,6171,6291,4821,58249,482,1001,5827.366445148-0.016301301
2006年6月1,6241,6281,4571,608124,311,3001,6087.382746450.001244555
2006年5月1,7391,7901,5961,60663,238,5001,6067.381501895-0.078988411
2006年4月1,7551,8061,7221,73852,859,5001,7387.460490306-0.005165004
2006年3月1,6481,7601,6101,74775,887,4001,7477.465655310.044477782
2006年2月1,7171,7341,5811,67168,002,1001,6717.421177529-0.032384343
2006年1月1,6931,7371,5511,726116,140,9001,7267.4535618720.037183392
2005年12月1,5531,6861,5511,66387,183,9001,6637.4163784790.071013639
2005年11月1,4781,5671,4721,54962,132,5001,5497.345364840.059858292
2005年10月1,4181,4601,3741,45978,096,5001,4597.2855065490.028503841
2005年9月1,2841,4471,2771,41879,350,8001,4187.2570027070.106301249
2005年8月1,2111,2861,1761,275116,308,8001,2757.1507014580.05563708
2005年7月1,1941,2111,1771,20681,425,2001,2067.0950643770.010837955
2005年6月1,1571,1971,1531,19350,102,0001,1937.0842264220.02718944
2005年5月1,1381,1701,1231,16192,710,9001,1617.0570369820.019131018
2005年4月1,1931,2201,1171,13985,049,9001,1397.037905963-0.047995501
2005年3月1,1851,2171,1811,19574,033,3001,1957.0859014640.009247649
2005年2月1,1581,1881,1461,18467,169,1001,1847.0766538150.023068088
2005年1月1,1551,1691,1371,15747,283,4001,1577.053585727-0.001727116
2004年12月1,0941,1591,0891,15959,175,2001,1597.0553128430.049523824
2004年11月1,0851,1361,0841,10381,429,8001,1037.0057890190.012773896
2004年10月1,1171,1601,0741,089112,311,7001,0896.993015123-0.019100171
2004年9月1,1361,1561,0911,11085,966,6001,1107.012115294-0.01697227
2004年8月1,1421,1451,0771,12982,454,5001,1297.029087564-0.0123241
2004年7月1,2121,2141,1181,143115,329,1001,1437.041411664-0.053652713
2004年6月1,1561,2071,1301,20661,573,0001,2067.0950643770.04407493
2004年5月1,2011,2061,0651,15452,052,0001,1547.050989447-0.040752668
2004年4月1,1961,2431,1831,20253,317,7001,2027.0917421150.006677821
2004年3月1,1011,2081,1001,19487,147,8001,1947.0850642940.086554652
2004年2月1,0561,0951,0241,09567,566,2001,0956.9985096420.03911113
2004年1月1,0731,0951,0511,05348,584,5001,0536.959398512-0.001897534
2003年12月9881,0559841,05532,809,8001,0556.9612960460.052541267
2003年11月1,0901,0909611,00151,726,4001,0016.908754779-0.047790664
2003年10月1,0291,1241,0221,05066,705,1001,0506.9565454430.020202707
2003年9月1,0151,0921,0121,02965,398,7001,0296.9363427360.024595436
2003年8月9521,0209161,00472,132,4001,0046.91174730.063742026
2003年7月91399391394270,069,1009426.8480052750.029081209
2003年6月85291985291538,241,1009156.8189240650.076043429
2003年5月80285380084830,262,6008486.7428806360.052038358
2003年4月79582478180549,636,3008056.6908422770.007481332
2003年3月82584277579925,051,1007996.683360946-0.029595255
2003年2月82387681782321,134,1008236.712956201-0.006056954
2003年1月86487982382818,504,3008286.719013154-0.021506205
2002年12月89890581384613,613,3008466.74051936-0.061875404
2002年11月86690981490013,413,2009006.8023947630.035051638
2002年10月91092082186924,506,2008696.767343125-0.057030545
2002年9月94597588292018,512,7009206.82437367-0.027868899
2002年8月97698893594618,136,7009466.852242569-0.026083899
2002年7月1,0351,07094497124,232,1009716.878326468-0.055096557
2002年6月1,1331,1429901,02613,863,8001,0266.933423026-0.08944506
2002年5月1,1031,1511,0731,12215,899,6001,1227.0228680860.0280181
2002年4月1,0701,1141,0541,09111,935,7001,0916.9948499860.025999607
2002年3月1,0191,1301,0101,06310,692,8001,0636.9688503780.046206487
2002年2月9751,0309221,01517,299,3001,0156.9226438910.04534782
2002年1月1,0431,0589599709,955,7009706.877296071-0.061957875
2001年12月1,0601,0809851,0328,501,1001,0326.939253946-0.0220421
2001年11月1,0771,1001,0081,05515,592,7001,0556.961296046-0.005671093
2001年10月1,0401,1201,0181,0617,138,5001,0616.9669671390.039409232
2001年9月1,1071,1079561,0208,991,0001,0206.927557906-0.080042708
2001年8月1,2001,2391,0931,1058,484,2001,1057.007600614-0.074107972
2001年7月1,2601,2631,1581,1904,947,0001,1907.081708586

4 件のコメント:

  1. どうも、水瀬さんとこから来ました。

    書かれていること自体はもっともなんですが、前半部分のつっこみは個人的には重箱の隅をつつき気味な気がしてます。

    >私がやってみるとn-1法のSTDEV関数を使わないと4.41%という数字になりません。

    本文ではなく注釈として「nやn-1.5を使う場合もある」と書いてるだけなので、普通の読み方をすれば4.41%という数字を出すのにn-1法を使っていることは明らかでつっこみとしてはずれているように思いました。

    >対数を取るか取らないかが肝です。

    個人的には「厳密に計算するなら対数に変換してから」であって、これくらいの変動幅なら対数にしなくても実用上あまり問題はないと思います。
    対数の分散を取ると出てくる標準偏差も対数になって、いちいち逆変換してやらなければいけないので面倒です。
    数十年といった長いスパンだとスケールの違いが大きく影響するので対数でないと使い物になりませんが、2001年以降程度のサンプリングなら気にするほどではないのではないでしょうか。

    だいたいそこまで厳密さを求めているのに
    >厳密には~裾の方は正規分布にならず冪分布
    といった説明はまずいでしょう。
    ここは「厳密には正規分布ではなく冪分布に近いと言われており、正規分布とは裾の部分で違いが出てくる」といったところでしょうか。
    元の書き方だと「平均値近くは正規分布で、裾の方は冪分布」という間違った意味に読まれてしまいます。

    >1月とか3月の急落も含んだデータ~ですから「想定の範囲内」になるのは当たり前

    このあたりはまったく同意します。本来はここを一番のつっこみどころに持っていくべきだったのでは。

    藤田氏の文章は確かに厳密さに欠ける部分もありますが、全体としては統計などに詳しくない人が簡単にリスクを計算するための解説としてはよくできていると思います。
    実用性としてはこれでも十分かと。
    ただそれだけに1月以降も含めたデータで「想定の範囲内」というくだりは本末転倒になっているのが残念ですが。

    返信削除
  2. 追記
    >トラックバックをつけたいのですが、つけ方が分かりません(汗)

    記事の一番下の「トラックバック(0)」をクリックすると、トラックバックURLが書かれたページに移動しますよ。
    わかりにくいなぁ

    返信削除
  3. コメントありがとうございます。

    コメントの重要度については仰るとおりで、単に気づいた順に書いたので、重箱の隅が最初に、大事なところが後に来ています。ちゃんと順番を考えるべきでした。
    検証していて「あれれ、STDEVPでは合わないな?」と思ったので最初に書きました。

    > >厳密には~裾の方は正規分布にならず冪分布
    > といった説明はまずいでしょう。
    > ここは「厳密には正規分布ではなく冪分布に近いと言われており、正規分布とは裾の部分で違いが出てくる」といったところでしょうか。

    これも仰るとおりです。
    但し、
    > 個人的には「厳密に計算するなら対数に変換してから」であって、これくらいの変動幅なら対数にしなくても実用上あまり問題はないと思います。
    中略
    > だいたいそこまで厳密さを求めているのに
    に関しては、正規分布か冪分布か、という違いよりも、対数を取るか取らないかの方が大きな問題です。
    確かに、値そのものは±0付近では大差ないので些細なことに思われるのでしょうけれど、私が書いた数値例
    > ・2年連続0%リターン
    > ・一年目は+25%、二年目は-20%
    > ・一年目は+100%、二年目は-50%
    > どのケースも二年通してのリターンはゼロですが、対数を取らずに単純にリターンの算術平均を求めると後のものほど良くなります。
    及びフィデリティ・ジャパン・オープンの具体例のように、どのようなデータでありどのように扱うべきか、という点はデータ解析において最も重要な部分だと思います。

    これは藤田さん一人に限ったことではないのですが「金融工学では正規分布を仮定しているが、厳密には冪分布の方が近い」と指摘していながら対数を取っていない記事をしばしば見かけます。正規分布と対数正規分布の違いと比べれば、正規分布と冪分布の違いは僅かですので、
    対数を取らずに正規分布を当てはめて当てはまりが悪いのは、冪分布を使わないからではなく対数正規分布を当てはめるべきデータに正規分布を当てはめているからです。

    > 記事の一番下の「トラックバック(0)」をクリックすると、トラックバックURLが書かれたページに移動しますよ。

    ありがとうございます。
    次回やってみます。

    返信削除
  4. 間違いました。
    > 及びフィデリティ・ジャパン・オープンの具体例のように、
    ではなくて本文中で書いたのはフィデリティ・日本成長株でした。
    このファンドに深い意味はありません。
    ベータの大きなファンドとして適当に思いついて計算してみたら、例に挙げるのに適当な結果が出たので書いただけです。

    返信削除