2008年6月27日 (金)

記号の着差 タイム差0.0秒にドラマがある!

_13596_image108_2 競馬のタイム表記の最小値は日本では0.1秒、米国では0.2秒です。タイム理論的には0.1秒以下を論じる無意味であると考えられますが、実は、そうでは無いようです。左の棒グラフは前走における1着馬とのタイム差の影響を見たものです。+0.0はハナ差、アタマ差、クビ差で負けた場合を、-0.0はハナ差、アタマ差、クビ差で1着になった事をあらわしています。物理量的表現では等価である0.0秒差ですが、勝った(-マイナス)場合と負けた(+プラス)場合で大きく違います。私の現在の理解では騎手の心理に原因があるとしています。即ち、僅差(0.0.秒)での負けは騎手の悔しさを刺激していると考えています。ある程度以上差のある勝ち負けは馬の能力差として受け入れる事が出来るが、僅差の勝ち負けは騎手の技量の差であるとの認識が存在するのではと考えています。

ところで、競馬には着差データが存在しています。着差(競馬)-Wikipediaで詳しく解説されていますが、予想因子としても使えるのではと考えています。即ち、0.0秒差をさらに詳しく分析できるのではと。しかしながら、競馬データに盲点が有りました。着差の定義は”前馬”との着差であるとされています。従って、1着になった馬には着差データは同着(降着はあるか不明)以外は有りません。でも良く考えて見ると1着馬に着差データが存在しても良いのではないかと、1着馬の着差は2着馬に着けた着差、2着馬の着差データをコピーすれば良い事になるでは無いか。そんな事で実際にプログラム組んで始めました。ロジック的には簡単ですが実装すると時間がかなり掛かります。

最後まで実装できたかと思い、今週の馬の過去走を参照したら、1着馬の着差データが殆ど歯抜け状態、考えて見たら今週のデータのみからは過去走の1着馬の着差は構築できませんね。数量化用のデータは先ずフルセットアップから入ります。馬毎データでは140万レーコード以上有りますが、この中から2000年以後に実走データのある馬コードを引き抜きます。大体4万数千頭になります。この中で一番古いものは1994年あたりが初出走になりますが、実際に数量化に利用するのは2004年以後のデータです。今週の馬の過去走1着着差を完全に近づけるには4万数千頭の2着データを保持する必要が有る訳ですね。。。。

| | コメント (0) | トラックバック (0)

2008年6月 4日 (水)

記号の劣化 競馬予想は進歩していたのか?

_7910_image001 今年2008年のダービーの馬連も万馬券になりましたが、最近万馬券の発生件数が多くなったようです。昔に比べれば3連複、3連単など券種が増えたので、万馬券の絶対数が増えるのは当然なのですが、券種を馬連あるいは枠連に限定しても増えているのではと思い、ここ十数年の万馬券数を調べたのが左のグラフです。

グラフを見て驚いたのは増えている事実でした。中央競馬の年間レース数は288日に12レースかけた3456レースを基準にして台風や雪などで中止される数レースから十数レースを引いたレース数で略一定しています。2000年以前は馬連で350本程度だったのが近年では400本を越していますし、枠連でも70本程度から100本程度まで増加しています。

この増えている原因をどう捉えるかです。近年インターネットの進歩普及により競馬情報は溢れていますし、予想技術も飛躍的進化を遂げたとする論調が支配的ですが、そうであるならば、馬連・枠連万馬券は減少してもいい筈なのに何故?本当は総体としての競馬予想力は劣化しているのでは?。

予想力が劣化しているかどうか別として、ここ十数年で確実に起こった事は”競争原理”の導入でしょう。有力地方騎手の中央への移籍、昇級ルールの見直しによる弱い馬の排除、メリット制導入による厩舎の選別等など、これらにより生じるのは同一レースに参加する総体としての馬の能力(単に馬の能力だけでなく騎手、調教師、生産牧場などの能力を含めて)の均等化が起こり、結果として偶然性により強く支配され万馬券の出現が多くなったのではと考えています。均等化はレース内での事で、騎手、調教師、生産牧場間の能力は近年ますます拡大して二極化していると感じています。

もう一つの万馬券の多発の原因かも知れないのは、3連複特に3連単へのシフトで馬連・枠連市場が急速に縮小した事ですね。大きな市場と小さい市場では効率化の程度に差があるとおもわれますので、この影響かも知れません。

| | コメント (3) | トラックバック (0)

2008年4月14日 (月)

記号のXP  WindowsXP SP3残酷物語

021_2 現在私の使っているPCは3台、OSはVista、Windows2000とXPです。VB6の開発環境は無事にVistaに移行でき、管理者権限とも折り合いが付き、今のところ快適です。ところで先日、VistaのSP1が公開されましたので、SP1にアップデイトを試み上手く行きましたので、動作が不安定なXPもSP3にアップデイトと試みたのです。キャンディデイトと言うのが、即ち候補版と言うのが引っかかったが、強引にインストールしてしまいました。そして起動させたところ、STOP C0000139のブルースクリーン、何度再起動させても同じC0000139でストップ、観念して近くの持ち込み修理へ、しかし、そこでの回答はC0000139はSP3が原因であり、リカバリーするかSP3をアンインストールしてSP2に戻すか選択する事になり、一応まずSP3のアンインストールを選択して家に持ち帰る事にしました。

家に持ち帰り、修理チェックで頂いた情報を元にSP3をアンイストールしようと思い、確認の為google検索したところ、まずXP-SP2の起動ディスクが必要との事、しかし、ホワイトボックスPCには起動ディスクは元々ついていなかったのを思い出し起動ディスクの作成方法をgoogleで検索しましたところ”Windows XP のインストール用起動ディスクを入手する方法”が見つかり、これは簡単と思ったところ良く読むとフロッピーディスクが6枚必要とのこと、今時1.44MBのFD等手持ちが無くCD-R(W)に焼く事は出来ないかと、さらにgoogleを検索、すると”CDブートの回復コンソールディスクを作る”が見つかりその指示どおりにVisata上で作業してbootdisk.isoを作成、作成途中で引っかかりそうなのはwin51ipをリネイムしてwin51ip.sp2を作るところが少しトリッキーかなと思います。最後に躓いたのはCD-R(W)に焼きこむソフトです。どうも単純にCDにコピーすれば良いと考えていたのですが、やはり手順がありました。ISOファイルを焼きこむにはと、googleで検索すると”「CD manipurator」を使ったISOイメージファイルの書き込み方法”が出てきて別のDLしたCDmanipuratorを起動させCD-Rに焼きこみました。ただ実際に焼きこんだのはDVD-R(W)でしたが問題なく回復コンソールが起動しました。

さらに最後の回復コンソールで分からなかったのはSP3のアンインストールの方法でした。RでC:WNINDOWS>までは行き着いたのですが、その後がよく分からず、またまたgoogleで検索すると”Windows XP SP2 を回復コンソールからアンインストールする方法”が見つかりそのとおりするとSP3が削除され再起動で見事SP2が立ち上がりました。あとはコントロールパネルでSP3を削除して完了しました。ただ、元々の動作不良は解決せず、これで修理に出せる状態に戻っただけです。原因はどうも物理メモリの欠陥のようですが、手持ちのmemtest34aでは異常を検出できず、まだ断定できません。3Dベンチのように負荷の大きそうなソフトでは落ちませんが、何故か私の自作VB6ソフトは相性が悪く70%くらいの確率で落ちます。

後日談として、結局メモリーに加えてMBにも不具合があり、自力で修理しようと思ったのですが。しかし、昨今は自作系あるいはホワイトボックスは下火になっているようです。価格的にはDELL、e-machine等の完成品の安くなっているようです。自作は経済的な事より趣味の世界になったようですね。考えて見れば当然の傾向ですね。それにしても国内のメーカー品はどうなっていくのでしょうか。

さらに、後日談MBもダメなら、新しくWindowsXP専用のPCの購入を考えたのですが、壊れたマイクロATXに刺さっているメモリーを思い出し、メモリーを差し替えてみました。古いメモリーはサムスン製で512MBしか有りませんが、今のところ、遅いところを除けば、相性の悪かった私の自作ソフトも問題なく動き、その他のソフトも動きます。何故なんだろう?

さらに、さらに、自作のソフトとNEXTなど4本のソフトを同時起動させたら、とうとう落ちました。落ちたと言っても、ブルースクリーンでは無く、フリーズしてしまいました。従って、ひょっとしたら仮想メモリーが少ないと思いタスクマネジャーを起動させ確かめたら、物理メモリは確かに512MBになっているがコミットチャージの制限値は490MBにしかなっておらず。仮想メモリーを操作して制限値を1GBにしたところ、自作ソフトと標準的な競馬ソフトさらに3Dベンチを同時に稼動しても落ちません。利用可能物理メモリーは現在32KBで動いています。

Ver2 5月7日 Microsoft UpdateよりSP3へのアップデイトにとうとう成功しました。現在順調に動いています。C0000139の原因については定かではありませんが、GDI32.DLLのバージョンとか?何れにしましても、無事インストールできた訳ですので、これからメモリーのチェックをしようかと思います。現在DDR PC2100(多分)の215MBの2本指しですが、問題を起こしたメモリ-はDDRPC3200512MB4本の内多分1本か2本と推定しています。

| | コメント (5) | トラックバック (0)

2008年4月 6日 (日)

記号の感情 行動馬券学?

025 最近と言うより昔から存在していたようですが、経済は感情で動くと言う”行動ファイナンス理論”が再注目されています。経済理論は”効率的市場仮説”に代表されるように”人”は常に合理的判断の元に経済活動を行っているとしていました。しかし、実際にはノーベル経済学賞受けた人物がチームの一員であったLTCM(Long Term Capital Management)の破綻に代表されるように現実社会では理論通りには行きません。即ち、経済が何故理論通りに動かないかを理論的に考察したのが行動ファイナンス理論になる訳ですが、皮肉な事にこちらも2002年にノーベル経済学賞を受賞しています。

そこで、競馬予想にも行動ファイナンス理論的なものを導入できないか考えました。即ち、感情や非合理的判断を予想に使えないかをです。結果2つほど現在使っています。一つ目は僅差で負けた騎手は次走では頑張るのでは?、2つ目は血統に目がくらんだ競馬関係者(おもに馬主)は能力の低い当歳馬を高額で購入しているのでは?と言う物です。

| | コメント (0) | トラックバック (0)

2008年2月21日 (木)

記号の市場 市場取引価格の怪

_14131_image106 市場取引価格のデータが公開されてから暫く経ちますが、市場取引価格の意義について解説した物は余り見かけません。市場取引価格は単純で子馬(当歳、1歳、2歳)の値段です。ここまでは分かりますが、知りたいのは値段が競走馬の能力に見合ったものであるかないかです。

結果は左上のグラフの様に、一寸不思議な物でした。当歳では1億円以上の馬の能力が数百万の馬より劣っていました。1歳では価格に見合った能力を示しているようです。2歳では数百万の馬も数千万の馬も同じような能力でした。なお、この傾向はダートでも略同じでした。

| | コメント (2) | トラックバック (0)

記号の土日 芝コースの土日の内枠外枠

_924_image104  過去、土日で的中状況が激変する事を何度も経験してきましたが、なかなか原因が特定できずにいました。と言うより薄々土曜日の芝の内枠は早い即ち有利ではないかと言う思いはあったのですが、これを数的に処理するモデルが中々良い物が思いつかず今まで本格的には手を付けていませんでした。競馬予想の経験が長い方は、例えば芝コースであれば馬場悪化はタイムが悪くなると言う経験則は持っている筈です。まあ、競馬の常識ですね。でもこの悪化を具体的に科学的な数値として捉えている方は皆無かと思います。さらに微妙な土日の内外の有利不利は、存在すると認識される方は多いと思いますが、科学的に正確な数値として捉える事は不可能ではないかと思われていました。

結果は左上のグラフの様に芝コースでは土曜の内枠(4枠あたりまで)有利と8枠不利が浮かび上がってきました。日曜日は余り有利不利は見られませんが強いていえば中間枠が有利なる傾向が見られます。ダートコースについては明確な傾向は見られませんでした。

| | コメント (1) | トラックバック (0)

2008年1月 6日 (日)

記号の深層 騎手の深層心理?パート2

騎手の深層心理?に迫ってみました。では、騎手は余り人気を気にしない傾向が見られるとしましたが、考えてみれば当然ですが、騎乗馬のレースでの調子を一番知る立場にあるのが騎手ですので人気にかかわらず出来には納得しているのではないかと推察されます。ところが、ハナ差、頭差での勝ち負けは騎手の心理に大きく係わっているようです。ハナ差、頭差はタイム的には同タイムになってしまいタイム指数理論的には手におえませんが、数量化理論では追求出来ます。

_17352_image103 左の棒グラフは1着馬とのタイム差(当該馬が1着の場合は2着とのタイム差)の次走への影響を見た物です。ハナ差、頭差はタイム差は00になりますが、勝った場合-00となり、負けた場合+00となります。グラフから読み取る事が出来る現象はタイム差00で負けた馬(+00)の次走は、タイム差00で勝った馬(-00)の次走の速度より0.2Km/hr程速くなります。1000mの芝では1馬身強の差なります。サンプル数は十分大きいので確かな事象と考えられます。さらに、この傾向はタイム0.5秒(+05)まで続きますのでより確かな現象と考えられます。騎手にとっては僅差の勝ち負けは技量に直結したところがあり勝ち負けに拘るものと推察します。

| | コメント (3) | トラックバック (0)

記号の深層 騎手の深層心理?に迫ってみました。

今回は騎手の深層心理?に迫ってみたいと思います。予想が外れた場合に騎手の不手際のせいにする事があると思います。しかしながら本当のところはどうなのでしょうか? 騎手は人気をどのように捉えているのか、人気を裏切った騎手はその事を負い目に感じているのか等を考察してみました。最初に考えたのが人気馬に騎乗して惨敗した騎手は、次回その馬で汚名を濯ぐべく頑張る筈であり、逆に不人気馬に騎乗して勝ってしまった場合、その馬に続けて騎乗する時に気が緩むのではないかと言う事でした。

_14669_image101 でも実際のところは、この仮説は違うようです。左の棒グラフは前走人気着順が今走の速度にどのように影響するか調べたものです。単純に人気と着順を組み合わせたものを予想因子にすれば良いようですが、人気にしてしまうとオッズ1.0倍のダントツの1番人気もオッズ3~4倍のそこそこの1番人気も同列に扱う事になり、少々不合理なので人気の代わりにオッズの逆数の100倍して支持率に近似させたもの(1=1%以下から8=80%)を使用しました。結果の着順に関しては1着を1、2~4着2、5着以下を3として3分類を用いました。具体的には11は支持率1%以下で1着、83は支持率80%で5着以下を意味します。数量化の結果は強い馬がやはり次走も速いと言う常識的な結果で、とくに騎手の心理を反映した物ではないようです。即ち、勝利騎手インタビューなどのコメントとは裏腹に騎手は人気のプレッシャーを感じていないようです。

| | コメント (0) | トラックバック (0)

2008年1月 4日 (金)

記号の脂肪 競走馬の体脂肪率を調べていたら。。。パート2

_21346_image097 競走馬の体脂肪率を調べていたら。。。からするとウオッカとかダイワスカーレットの大活躍が説明出来ないのではと思われます。しかし、左の雌雄馬の成長曲線を見てください。月齢にして36ヶ月までは雌馬の基本能力は雄馬を上回っています。

_21346_image099 基本的には雌馬の方が早熟と言えます。グラフの起点である27ヶ月、即ち2歳と3ヶ月の時点以降で時速として少なくとも約0.25Km/hr程雌馬が勝っています。即ち1000m(芝)地点で約1.7馬身程雌馬が雄馬に対して先行している訳です。ただし、雌馬は雄馬に比べて成長余力が無いようです。

| | コメント (0) | トラックバック (0)

2008年1月 3日 (木)

記号の脂肪 競走馬の体脂肪率を調べていたら。。。

久しぶりの書き込みになりますね。ところで、競走馬の体脂肪率を調べていましたら、非常に興味深い資料に突き当たりました。それは日高育成牧場の馬体重に関するレポート中で”生まれ月”により”総獲得本賞金”が違うと言う物でした。具体的には生まれた月が遅くなるほど総獲得本賞金が高くなる事です。言い換えると1月生まれの馬より5月生まれの馬の方が能力が高い事になります。考えてみると一寸不思議な事象です。

_17570_image091 そこで私の数量化分析の結果を見ると左のグラフのように1月から6月まで綺麗な右肩上がり(遅い月生まれの方が速度が大きい)になっておりレポートと同じ傾向を示していました。

_17570_image093_3 さらに驚くのは雄馬と雌馬の馬体重の変化に関する記述です。レポートの中では雌雄ともに2歳時から月を追う毎に馬体重は増加しますが、体脂肪率から見ると雌馬の増体重は主に脂肪によるもので筋量(正確には除脂肪体重)の増加による物では無いとしています。

_17570_image095_4 その事を踏まえて左の二つの数量化分析の結果グラフを見ていただくと解かると思いますが、雄馬は馬体重が重くなるほど速度が大きくなる傾向が見えるのに雌馬では見られない事です。

| | コメント (0) | トラックバック (0)

2007年11月 1日 (木)

記号の天気  天気予報と競馬予想

天気予報に用いられる数値予報のロジックが競馬予想のロジックに援用できると考える方は非常に少ないようですね。競馬は基本的にエンターテイメントであり、100人いれば100通りの予想が正当化される世界です。即ち、ギャンブルとしての透明性、公平性が損なわれない限り何でもありです。競馬を仕組む事は違法ですが、競馬が仕組まれていると考え予想を行うのは何の問題もありません。先に書きましたように何でも有りのエンターテイメント、即ち娯楽であるからです。

一方天気予報はどうでしょうか、確かに最近の天気予報番組はエンターテイメント化されていますが、テレビ会社が100社あれば100通りの天気予報が正当化されている訳では有りません。明日の天気が雲一つ無い晴天から台風並の暴風雨まで認められてしまったら、大変な事になります。ある場所の明日のある時点での天気予報は一通りである事が、求められる最終的な予報となるのは明らかです。この観点から気象庁が国民の税金を使い高額なスーパーコンピュータを購入して使用できる所以である訳です。

スーパーコンピュータの予測は、まず外れない事が要請される訳ですが、外れるのを恐れて競馬で言うところの展開予想の様に何通りの予報を出されても困りますね。ただ、確率予報と言うのも曲者です。降水確率30%を考えてみると残りの70%は何かとなりが、多分曇りか晴れで35%、35%とすれば、明日の天気は晴れか曇りか雨となり、天気に晴・曇・雨しか分類が無ければ必ず的中している事になります。何か変ですね、この場合、正確な予報は”明日の天気は分かりません”ですね。でも、こんな予報を何度も出したら天気予報にスーパーコンピュータを使用する事の正当性が疑われてしまいます。だから確率なのかも知れません。

ところで、天気と競馬には共通点が有ります。競馬の決着は基本的(同着は有りますが写真判定の分解能の限界から生じているだけです)には一通りしかありません。一方、天気ですが、ある地点のある時点においての天気は当然の事ですが一通りです。即ち、起こり得る事は沢山有りますが、実際に起こる事は一通りでしか無い訳です。即ち、一通りである事が競馬と天気の共通点です。

ここから、最初に書きました事とは違った展開となります。競馬はエンターテイメント、それもギャンブルと言う人間であれば多分に持ち合わせているであろう射幸心を刺激する強力な娯楽である訳ですが、しかしながら、競馬はエンターテイメントである前に天気と同じく自然現象である事も事実です。自然現象の自然とは何かですが、常識的には自然とは人為ではない物、人が係わった事は自然でないと言うのが自然な考え方です。しかし、人も自然の一部であり、人が馬を使う競馬も広く考えれば自然現象と言えなくはないでしょうか。

競馬も自然現象であれば、天気と同じく科学的分析対象となり、数値解析の対象となり得る訳です。即ち、理論的にアプローチできる100人が居れば、その予想は一通りに収束してくる訳です。

| | コメント (0) | トラックバック (1)

2007年10月23日 (火)

記号の仮想  Windows Vistaの仮想化とは

私が使用してきたwindows2000並びにwindowsXPは既に購入してから5年から7年近く略連続使用を行っていますので、各部品が大分ヘタッテ来ているようです。2台とも面白い事に使用1年弱でマザーボードが壊れてしまい保証期間中でしたのでMBを全交換しています。また2台ともHDを換装してOSを再インストールして今日に至っています。Windows2000に至っては電源ファン、CPUクーラーも怪しくなり、PCケースを外し、外側からターボファンで冷却しています。Windows2000はアスロン2400+ですが一時80℃まで上昇していたCPU温度は今は54℃まで下がり、現在は一応安定して連続稼動しています。しかし、何れにしても危うい状態であるのも事実なので、後継のPCを購入する決心をして選んだのがGateWayのAthlon64x2 6000+ Windows Vista home premiumのプリインストール(OEM)でハードに5年間の保証を付けました。ホワイトボックスからメーカー品への回帰ですが要らないソフトが沢山ついてくる日本のメーカー品は止めました。

ところで、仮想化の問題ですが、VB6の開発環境としてはハード的に不安のあるwin2000、XPを諦め少なくともハードとしてメーカー保証があるvistaマシン(gateway)に乗り換えた訳です。最初は順調に動いたvistaのvb6開発環境でしたが、ある日突然コードが読めなくなってしまいました(ファイルが見つかりません)。色々サイトを調べたところ管理者権限による仮想化が原因らしい事が分かり、プログラムコードがとんでもないところへ飛ばされていました。仮想化の概念は何となく分かるのですが、実際に遭遇して見るとvista初心者にとってはなんとも腹立たしい現象です。win2000、XPではコンパイルするとProgram Filesにexeが出来るのですが、vistaではユーザー名のフォルダに飛ばされ何となく変だなと感じていましたが、プログラムコードも飛ばされるとは思っておらず。慌てました。一応プログラムコードの保存フォルダをユーザー名フォルダにして何となく収まっていますが、正しい対処方法が分からず戸惑っているのが現状です。

| | コメント (0) | トラックバック (0)

2007年9月13日 (木)

記号の破壊  オブジェクト指向?

Hrptv5c0_2 やっと涼しくなって来ましたね。私自身少々夏ばて気味ですが、開発用に使用してきたPCの調子もおかしくなり、この半月ほどはその手当てで時間を食ってしまい。ソフト開発は遅れてます。

今回の開発用PC(XPPen4)のトラブルは原因が判らず困りました。最後はハード(多分HD)もおかしくなり、HDを新しく購入してOS(XP)を再インストールしてもらいました。そこで問題は解消するかと思ったのですが、まだ”問題が発生しました。。。。。”が出現してVBがとまるので、ハードとソフトの問題を切り分ける為と将来の開発環境という事でVista(アスロン64x2)を購入してVB6(2008年4月までサポート)の開発環境を構築しています。将来的にはVB2005となるとはおもいますが、当面はVB6で行いたいと考えています。

問題が発生したPCの原因の切り分けですが、当初ハードの故障かと思っていたのですが、Windows インストーラを弄り始めた時点から変になったようですので、どうも同じオブジェクトを頻回に使用して、メモリーを完全に解放しないで、使い続けるとメモリーリークを起こして”問題が発生しました。。。。。”でVBが停止するようです。従いまして、毎回新しいオブジェクトを作り破壊する方法に切り替えたところ、上手く動き出しました。また、VistaでのVB6の開発環境はフルセットアップソフトも含め順調に動きはじめました。これでWIN2000、XP、Vistaと3代のOSを使うようになったのですが、皮肉にももっとも古いWIN2000(SP4)がもっとも信頼できるようです。

オブジェクトの問題であるとヒントを与えてくれたのは、馬吉のソースでした。多分分割してコーディングを行う為、オブジェクトを完全に破壊するするようにしないとデバッグが効率的に出来ないのではと感じています。今回、公開しているソフトでは明示的なメモリー解放を行っていませんので、ひょっとしてトラブルを起こすかもしれません。また、Visual Studio Installerはどうもレジストリーを書き換えるみたいで、少し心配です。現在はEXEpressのイントーラが使われているようですが、まだ今ひとつ使い方が分かりません。プロのプログラマーではない私には公開用ソフトの開発は非常に難しいです。

ところで肝心のソフトの予想成績ですが、馬インフルエンザ後の成績は本線6点馬連で的中率33%以上、回収率100%以上を達成しています。開発用のPC(XPとVista)が順調に稼動すればロジックをもう一段精緻化して一応必勝状況に突入できるのではと感じています。ただ、競馬ファンが期待しているものとは微妙に違うかもしれませんが。

| | コメント (0) | トラックバック (1)

2007年8月23日 (木)

記号の再開  馬インフルエンザ

三十数年ぶりの馬インフルエンザとは驚きました。インフルエンザと言えば鳥インフルエンザ、古くはスペイン風邪などのイメージが有り、大変な出来事のような風評が有りますが、コントロールされたインフルエンザは決められた手順を守っていれば、それ程の事では有りません。今回の出来事はJRAが見識を有するのか”ただの無作為”なのか見極めるには良い試験紙でした。例えばディープインパクトの薬物事件の原因は帯同日本人獣医師の無作為であったと感じていますが、JRAが唯一日本で罰の対象としたのはこの獣医師であったのにはJRAの見識を感じます。

今回の馬インフルエンザについては2007年8月18日19日の中止はJRAの無作為を感じましたが、25日よりの再開は見識在る行為であると思います。本当の正解は18日19日も粛々と開催を継続する事だったような気がします。

| | コメント (0) | トラックバック (3)

2007年7月20日 (金)

記号の残差  真の競走馬の能力とは?

_9286_image088 道悪適性が無いので凡走した。あるいは道悪適性が有るので好走した。血統から距離適性への言及など、競馬解説は一見明快のようです。従って、そのような解説ができる競馬予想家は前提として言及した競走馬の真の能力を理解している事になります。そうであれば言及した競走馬が出走するレースは略100%的中して、必ず100%以上の回収率を示す筈ですが、現実にはそのような事は起きないようです。真の競走馬の能力を見極めるのはやはり非常に難しい事のようです。

ところで、速度理論と数量化分析では真の競走馬の能力をどのように定義しているかですが、左上の概念図に注目して下さい。まず、能力とは速度であると仮定します。芝であれば約10,000パラメータを調整してディープインパクト型の能力を求めます。ここで重要なのは求められるのはディープインパクトそのものでは無くディープインパクトを含めたディープインパクト型の能力である事です。この型であることが過去走のデータが無い新馬でも予想できる事に繋がる訳です。

それでは、ディープインパクトの真の能力とはなにかですが、それは”残差平均”です。即ち真のディープインパクトの最適推定値=Σ(ディープインパクト過去走-ディープインパクト型)/過去走数で求める訳です。つまり、ブラックタイドの最適推定値=Σ(ブラックタイド過去走-ディープインパクト型)/過去走数として全兄であるブラックタイドと差別化する訳です。

理屈としては道悪だけの残差平均や近走(過去2,3走)の残差平均も求まる訳ですが、何故か的中パフォーマンスが悪くなります。過去走を出来るだけ多く取った方が精度が良いようです。過去走は当然標準馬が受ける道悪補正は行っています。道悪で起こる事は偶然による不確実な出来事として速度理論と数量化分析では処理しており最適推定値は天候晴,馬場状態良で得られるものとしています。

| | コメント (1) | トラックバック (1)

2007年7月11日 (水)

記号の騎手 ダートコースにおける各騎手の経年能力変化

コース取りの不利、道中両側を塞がれた、折り合いが着けられず、前半ハイペースになり最後ばてた、出遅れ等等。これらは敗因としてよく語られるます。また、競走馬が第一人称になることが多いですが、本当でしょうか?競走馬は位置取りあるいはコースの内外を考えて走るのでしょうか?馬は動物としては頭が良い方であることは確かですが、レースで起こる事を戦術あるいは戦略的に競走馬自身が考えて走っているとは思えません。レースでの出来事の大部分は馬の操縦者である騎手の特性によると考える方が合理的,論理的ではないでしょうか。そんな事を考慮に入れていただき,下のダートコースにおける各騎手の上がり速度、ペース速度を眺めて見れば面白いアイデアが浮かぶかも知れません。

「dirtjockyspeed.xls」をダウンロード

| | コメント (0) | トラックバック (0)

2007年7月 9日 (月)

記号の騎手 芝コースにおける各騎手の経年能力変化

今年は騎手のパワーバランスに大きな変化が起きたとされます。即ち、武豊騎手の能力の絶対値と相対値の変化です。下のエクセルファイルは2004年前半~2007年前半までの芝コースで出走した全ての騎手の年毎の影響速度(Km/hr)です。考え方としては影響速度が大きい程、技量・能力・実力が上と考えて下さい。最終的な能力値は走破速度に対する影響速度で比較して頂くのが、妥当です。上がり速度とペース速度は騎手個々人の脚質を現しています。実は脚質は競走馬では無く騎手が持っています。

エクセルの簡単なでも無いかも知れない活用法を紹介します。今ここにA,B2頭の競走馬がいるとします。さらにA,Bともに2000mを2分で走りきる能力(60km/hr)を持っているとします。ここでA馬には2007年の武豊騎手が騎乗しますと走破影響速度が0.091Km/hrですので、A馬の速度は60.091Km/hrとなります。B馬には2007年の岩田康誠騎手が騎乗するとしますと走破影響速度が0.111km/hrですので、B馬の速度は60.111km/hrとなります。従って2000mのタイムはA馬が1分59秒82、B馬が1分59秒78となります。即ち、岩田康誠騎手が騎乗するB馬の方が0.04秒ほど先着します。具体的には”頭”差程度先着する事になります。

「turfjockyspeed.xls」をダウンロード

| | コメント (0) | トラックバック (0)

2007年6月27日 (水)

記号の別人  武豊騎手は武豊騎手ではない?

表題は禅問答のようですが、理屈と言うか仮説なのか別として、2006年の武豊騎手と2007年の武豊騎手を別人として数的扱っていると言う意味です。実際に導出された影響速度は、下のグラフの如く、正しく別人のような違いを見せています。しかし、データとしては非常に綺麗で、また、表出した成績とも良く整合していると言えると思います。ただ、現実の競馬に適用して有効なのかどうか難しいところです。Over-fitingの気配もあり今しばらく見守る必要が有りそうです。

_27190_image001_1 

| | コメント (0) | トラックバック (3)

2007年6月21日 (木)

記号の下落  やはり武豊騎手の能力は落ちていた

116 前の記事で、3年間と言う比較的長い期間で騎手の能力は変わらないとする仮説が微妙である事に触れましたが、武豊騎手の今年(2007年)はやはり特別な節目の年のようです。現在検討中のモデルでは、下のグラフのように2006年までの約3年間は走破速度に対する影響度は02Km/hrより少し上で安定(一般的な仮説として3年間一定は妥当とも言えます)していましたが、2007年前半では0.08Km/hrまで低下しています。

さらに、上がり(ゴール前3F)速度をみますと、2004年後半をピークに徐々に低下してきています。これはディープインパクトの存在を考えるとやや不思議な事です。2004年から2006年に掛けてはディープインパクトの成長に合わせて、特に上がり速度上昇しても良い訳ですが、逆に低下していますので、この数値は武豊騎手自身の力の低下と考えるのが至当と思われます。

今年(2007年)の状況をグラフから読み取ると”後ろに控えて差し切れない”状態が続いているようです。別の感想としては思いのほか綺麗なと言うか理屈を立て易いデータが得られたのには驚きました。しかし、実際のレースを予想してみると意外とダメな事も有りますので、難しい物です。

さらに下のグラフは最近活躍が目立つ若手の松岡正海騎手の足かけ4年のデータです。最終的なパフォーマンスの指標である走破速度に対する影響速度は武豊騎手の0.08Km/hrを越して0.12Km/hrを示しており、2007年前半時点では武豊騎手の技量を上回っています。ただ、2004年後半から絶対値としての松岡正海騎手の影響速度は殆ど動いていません。従って、大筋としては騎手の能力は3年間位は安定していると言う仮説は採れると考えています。短いスパンで、サンプル数を少なくしてして解析した場合、オーバーフィッティング(過剰適合)の危険性も有り、悩ましいところです。

_6220_image001

_27528_image001

| | コメント (3) | トラックバック (0)

2007年6月18日 (月)

記号の岩田 陰謀説はさておき

124 陰謀説はさておき、前記事の検定は有る意味正しく無いと言えます。統計学は往々にして難しい言葉を使い、もっともらしい体裁を装いますが、よく考えてみるとおかしな事が多いのも事実です。武豊騎手の成績が去年より低下している事は明白ですが、成績の低下が武豊騎手自身の馬を速く走らせる能力の低下によるものとは決して言えません。即ち、エージェントのせいかどうかは別として、騎乗している今年の馬の能力が全体的に低い事により低下したとも十分考えられます。競馬を予想する観点から考えると騎手の能力と競走馬の能力を切り分ける事が重要です。従って、検証対象とした勝率は予想には殆ど役に立たないと言えます。

*勝率に関するリンク

阪神タイガースは何故優勝したか薬物のお話(背景の同一性確保)、お医者さんと患者さんを盲目にする千兆分の一一兆円の無駄使い競馬予想に勝率・連対率は役に立たないなど参照頂ければと思います。

ところで、騎手の能力と競走馬の能力を切り分けて評価する事は簡単そうで実は非常に難しい事です。過去色々調べて見ましたが、理論的なレベルで納得できるものは有りませんでした。そこで速度(km/hr)を能力値として目的関数にすれば、騎手と競走馬の能力を切り分けられるとして考えたのが速度理論でした。そして、その数的解析手段として使用したのが数量化1類と言う多変量解析手法です。数量化1類では、その特性から騎手の能力のみを取り出す事ができます。即ち、各騎手が騎乗している競走馬の能力は同一(別の言い方すれば消されている→仮想的な幻の標準馬を想定する)とされますので、純粋に騎手の技量(どれだけ速く馬を走らさせるか)を比較できる事になります。

下のグラフは、そのようにして4人の騎手の走破速度(全距離-例えば芝1600m-を走破した場合の速度)への影響速度を調べたものです。色違いの2つの棒グラフは共に3年間のデータを使用したものですが、採録期間を約半年ずらしています。即ち、右側は今年(2007年)の1月より5月を含まない3年分のデータを、左側は武豊騎手の不調が話題になった今年(2007年)の5月までを含む3年分のデータを使用しています。

結果は武豊騎手自身の能力の低下は余り見られず。特にライバル視されている岩田康誠騎手との技量の差には殆ど変化は見られません。しかし、安藤勝巳騎手に対しては影響速度の大きさが逆転しましたので、その意味では武豊騎手自身の不調があるのかも知れません。さらに、この分析の問題点としては3年と言う比較的長いスパンで騎手の能力は一定であるとの仮説を採用しています。従って、もう少し短いスパン(例えば年度毎-但し算出した影響速度の信頼度が低下するリスクが有ります)にすれば、もう少し違った結果がでるかも知れません。これからの課題として追求してみたいと思います。

_30673_image001

_22126_image001

| | コメント (0) | トラックバック (0)

«記号の武豊 武豊騎手は本当に良い馬ばかりに乗っていたのか?