2008-08-16

見習わねば

データの値段

土屋賢三氏のブログ(2008年08月15日)

 

==================== 引用開始 ====================

こんばんは、土屋賢三です。

林輝太郎先生がどこか(脱アマ相場師列伝?)で書いておられたが、中源線のバックテストを大勢で手分けして手作業でおこなう話がある。

当時はまだPCもなかったし、中源線のような簡単な検証ですらこうして手作業による膨大な作業が必要だったのである。

私自身も検証こそPCを使ったが、昔は磁気媒体でデータが入手できることはほとんどなかったために、データは手入力するのが当たり前であった。

株式の4本値や出来高のデータすら全部手入力だったのである。

具体的には過去のデータが必要なときは、東京の茅場町の証券会館に行って、まず「株価便覧」のバックナンバーを大量にコピーしてくるのだ。

次にそれを自宅でスプレッドシートに手入力していくのである。何週間もかかる作業だ。

右手だけで作業していて強烈な肩こりになったために、左手でもデータを入力できるように練習したものだ。

これは他のデータでも同じであった。競馬や競艇の過去データの場合、まず競馬場や競艇場に行って月報のバックナンバーを大量にもらってくる。

これはタダでくれる。あとは同じように何週間もかけて手入力である。

それができて初めてPCによる検証作業に入れたのだ。当時のPCの性能はおもちゃみたいなものだったが、それでも手作業でやることに比べたら天国であった。

林先生が中源線の検証を手作業でやった苦労に比べるとなんでもないことだ。

さて、ブログのコメント欄にいただいた質問で、ヒストリカルな「予想PER」をどこで手にいれたらよいかという問い合わせがあった。

これはブルームバーグやアムサスがあれば簡単に落とせるが、証券会社や投資顧問会社にいる知り合いにでも頼まなければいけないから、誰にでもできると言うわけではないだろう。

しかし、四季報や日経会社情報にはこの手の情報が掲載されている。

だから話は簡単なのだ。

四季報や日経会社情報のバックナンバーを買ってきて、全部手入力すればよいのだ。

いや、冗談ではなくてホントにそうなのだ。実際、私は10年以上前にそれをやった。

東洋経済に行って、四季報のバックナンバーを10年分買ってきて、それをスプレッドシートに手入力したのだ。私は自分ができもしないことを他人にやってみたらと勧めたりなどしない

生まれたときからPCが自宅にある、欲しい磁気データが簡単に手に入るという世代の方からみたら、なんと非効率なことだろうと思われるかもしれないが、私ぐらいの世代は皆こういった努力をしてきたのである。

その程度の時間や労力を厭わず割くことぐらい、あたりまえだったのである。

簡単には手に入らないが、頑張れば手にはいるならば、話は簡単ではないか?

努力してやり遂げればいいだけのことである。自分の思いどうりになどならないトレードと違って、やれば必ず成果が出るのだからこんな楽な話はない。

まず、やってみることだ。

(土屋)

==================== 引用終了 ====================

 

私、やりました。

それも10年以上前じゃなくて去年。

「騰落レシオ」を使った検証したいと思ったので、いろいろ探したのですが、無料データどころか有料のものでさえ見つかりませんでした。

ちゃんとした大手のデータベンダーに問い合わせても、しがない個人では、まともに取り合ってもらえないのは経験からよく知っています。

それで、図書館にある日本経済新聞の縮刷版から手入力することにしました。

それも、1988年08月31日(水)から約 19 年分です。

項目数も少ないので、コピーより早いだろうと、紙に手書きで書き写して家で入力することにしました。

週末の土曜日か日曜日に通い始めて 2 回、計 6時間30分もつぎ込んだ後のことです。

東証1部・東証2部のみの「売買高(千株)、売買代金(百万円)、上場・公開銘柄、値上り、値下り、商い成立」の12項目のみを書き写していた時に、悪魔がささやきました。

「他の項目も後で必要になるかも・・・」

 

 

それで結局、青色の 12 項目だけじゃなくて、黄色も含めた 74 項目のデータを集めることにしました。

以前、コピー機を長時間占有して、列で待っていたおじさんに殴られそうになったことがあります。

そのことを図書館に説明し、デジカメで撮影する許可をもらいました。

大枚 6万2500円をはたいて 1220万素画素デジカメを買い、グループ閲覧室の予約を取り、撮影を開始しました。

最初は試しに 2 時間です。

家で事前に実験した時は大丈夫だったのに、家に帰って見てみると、何枚かに 1 枚は手ぶれで一部の数字が読めない・・・

やり直し。

真下をとる 3 脚は見つからなかったので、昔、ある業界誌のランキングで私が所属していた部門が 1 位になった時にもらった中に紙が入った透明なプラスチックの記念の盾(よくインベストメント・バンカーのオフィスに置いてあるトゥーム・ストーンを入れてあるやつ)を 3 脚代わりの台にしてデジカメを固定することにしました。

慣れてくると、ページを 1 ページずつめくらなくても、勘で 1 発で次の日のページまでめくれたりします。

3 時間で約 18ヶ月分。

ただ、3-4冊ずつグループ閲覧室まで運ぶんですが、それがまた重い。

結局、図書館に合計 15 回通い、かかった時間は 44 時間 17 分。

撮った画像は 4,870 枚(単調なのでどこまで撮ったかわからなくなって念のため撮って消去した多数の重複画像を除く)で約 27GB。

これで終わりではありません。

家に帰ってからの、入力作業はもっと大変です。

> 右手だけで作業していて強烈な肩こりになったために、左手でもデータを入力できるように練習したものだ。

これはやった人にしかわからない。

1 時間もやると、コチコチです。

手首、肘にもものすごい負担がかかります。

実際、肘を痛めて 1 週間ほど箸を口に運ぶのが困難だったほどです。

それに、超単純作業なのでモチベーションを維持してエラーなしに入力するのは想像以上に大変です。

この難行苦行も仕事ではないので、いつまでにやらなければいけない、という締め切りがないことだけが唯一の救いです。

1 日分入力するのに、平均すると 2 分以上かかります。

それが、4,749 日分。

合計 120 時間 30 分。

図書館までの往復もいれて、なんやかんやで、かかった時間はなんと計 191 時間 26 分。

フルタイムで働いた約 24 日分です。

この努力の結果は、騰落レシオ だけ・・・

その他のデータはまだ使う機会がありません。

もともと、騰落レシオの情報価値はたぶんないだろうと思っていたので、「そんな苦労の価値があったのか?」「おまえはそんなに暇なのか?」と聞かれても、「ただ興味があったから・・・」としか答えられません。

 

でも、データの価値って何なんでしょうね?

昔、顧客だった大手証券会社のクオンツ部門に、業務ではないものの業務上の立場を利用して個人的に収集していた「ある非常に特殊な時系列データ」をあげたことがあります。

そのお返しの取引は、私が勤務していた金融機関に通常のマージンに加えて 1 億円以上もの利益をもたらしました。

その取引だけで私のボーナスがいくらか増えたはずなので、個人的にも価値があったことは確かです。

 

よく、「データを売ってください」というメールをいただきます。

以前、約 11 年分の気配値を含んだ株価指数先物とオプションのパッケージ価格が、トヨタのヴィッツや日産のマーチのクラスの小型車なら 3 台ぐらい買える値段だった話をしたのですが、この苦労して集めたデータの価格はいくらでしょう?

フルタイムで働いた約 24 日分だから、1 か月分の給料?

東京都の最低賃金で計算しても、約 14 万円。

そんな価値はないですよね・・・

あなたの 1 か月分の給料でよろしければ、喜んでお売りします。

 

0 件のコメント:

コメントを投稿