2009年10月13日 (火)

新しいブログ

ワードプレスへの引越しを行っています。

| | コメント (0) | トラックバック (0)

2009年8月 7日 (金)

記号の光  ひかりTV狂想曲

004 それは一本の電話から始まりました。その電話の主旨は、貴方の回線はBフレッツ光なので”ひかりTV”が視聴可能ですから2ヶ月の無料お試しはどうですか?と言うものでした。日頃、ケーブルTVの料金が高いなーと感じていましたので、早速申し込みました。この時、光ケーブルは進化して、ハイビジョンTVも送れるようになったかと感心しました。ただ、ここはマンション、光回線が来ているとは言え、最後はメタルなのに凄いなーと!7月初旬に申し込み後、一週間程してリモコンが付いた接続末端などが送られて来ました。

8月1日から無料期間に入ろうと思っていましたが、引越しの準備などで時間を取られてしまい、ようやく5日に光回線に繋げてみましたが2820が出てしまい失敗、この時、BUFFALOのブロード ステイションに繋げているLOGITECからLANを引いている状態が駄目かと思いセンターに電話するとやはり駄目でBUFFALOのブロード ステイションに繋げて下さいとの事でした。また、次の日、たまたま量販店に”ひかりTV”のコーナーがあったので、再度同じ質問を投げかけたところ、同じくBUFFALOに繋いで下さいとの事でした。このとき同時にIPv6対応について確認したところ大丈夫との返事でした。しかし、BAFFALOに繋いでも2820が出てしまいました。

そして、昨日、色々面倒なので、NTTから貸与されているVDSL端末に直接LANを繋いで、ひかりTVを点けたところ見事に繋がりました。また、BAFFALOのIPv6対応も気になったのでBAFFALOのサポートに電話して聞いたところ、やはり、現在使用中のものは古くてIPv6には対応していないとの事で、どうも2段でLANを引いた事が原因では無いようでした。

これで、ひかりTVに繋がり目出度し目出度しで終われると思いました。繋がったので、普段見ている民放やNHKの番組を見ようとしましたが、どうしたら良いか分からず。116に電話すると地デジを見るには光ネクスト(接続末端まで光ケーブルが繋がっている)が必要ですとあっさり言われてしまいました。自分の不注意さを呪うと同時に、電話勧誘では、そのような事は一言も言われていないので釈然としませんでした。そこで引越し先のマンションは光ネクストに対応しているか尋ねると対応していないとの事でした。

ここで、不思議に思ったのは、116が簡単に光配線かVDSLかを答えてくれたので、最初の勧誘電話で、この二つの区別が付けられるのではと思い問いかけたところ、Bフレッツ光マンションまでは個人情報では無く、光配線とVDSLの区別は個人情報であるとの事でした。何となく納得してしまいましたが、考えて見るとBフレッツ光マンションの時点で既に個人情報であるべきではないかと?

何れにしろ分かったのは、各レベルで随分いい加減な対応をしているなーと言う事で、速攻でキャンセルしました。多分、実害は防げたと思いますが、どうでしょうか?マンションの光ネクストへの対応は始まっているようですが、光VDSLでも合意が大変であったようですので、この上光ネクスト対応の合意は、理解できないあるいは必要性を当面感じないなどで大変そうですね。

| | コメント (0) | トラックバック (0)

2009年7月24日 (金)

記号の未知  ダートの痛み方

Dirtseason 芝は生き物ですので、その上を馬が走れば痛みますし、痛みの度合いは連続使用された日数に比例して酷くなって、結果競走馬の走破速度は低下します。即ちタイムが掛かるようになります。一方ダートは日本では基本的に砂であり、無機物ですので、傷むと言う事は有りません。従って、連続使用してもタイムが悪くなる事はありません。

しかしながら、良く考えてみると日本には四季があり、冬場は乾燥しますし、夏場は非常に蒸し暑くなり。日本のダートは砂ですので乾燥すれば足を取られます。また、湿りを持てば砂は走りやすくなります。そうです。ダートのタイムは四季によって上下する訳です。冬は遅く、夏は早くなる訳です。そのような状態を左上のグラフは示している訳です。

| | コメント (0) | トラックバック (0)

2009年7月 1日 (水)

記号の未知  芝の傷み方

_14345_image001 今年の夏の北海道は函館との絡みで札幌競馬は3回連続となります。3回連続(体裁上は2回x12日)とは日数に直すと24日連続と言う未知の世界になります。芝は生き物ですから、当然四季の影響を受けます。また、芝は非常に成長力は旺盛ですが、残念ながら一週間では元に戻る事はできず。日数を経る事にタイムは悪くなります。

ところで、競馬開催の日程ですが、通常開催場所の後に○回X日と表示されています。○は回次と呼ばれとおり、通常8(X)日開催からなっています。それでX日は日次と呼ばれ、通常度土日が4週で8日となる訳です。従って競馬の始めの日は土曜日で日次では1日目になります。それから日曜日が2日目、次の週の土曜日が3日目、翌日の日曜日が4日目、次の次の次の週の土曜日が7日目、日曜日が8日目となり競馬の1回次が終了します。

競馬の初日とは1回1日、2回1日は無条件で9日目。何れも違います。ややこしい事に年次によって違ってきます。具体的には中山1回1日と京都1回1日は1日目では無く、変則9日目にあたります。また、2回1日は連続開催の9日目になることもありますが、1ヶ月あるいは2ヶ月してからの1日目になることもあります。経過日数など簡単に出せると思われるかも知れませんがプログラムとして実装するとなると非常に手間取ります。

何故このように、連続開催の経過日数にこだわる理由ですが、コースが十分整備できる期間を置いた初日と連続開催の初日では芝コースに於いてはタイムが全く違ってくる為です。さらに言えば芝が枯れる冬場と芝が成長盛んな夏場でも違ってきます。左上のグラフが其の辺りの現象を捉えたものになります。また、速度理論と数量化分析のモデル構造を公開したのは、このあたりを指数理論と差別化するためです。即ち、一般的な指数理論の基準タイムは諸々の係わり合いが、込み込みなってしまい、真の基準タイムとは乖離していると言う事です。

| | コメント (0) | トラックバック (0)

2009年6月26日 (金)

記号の構造 モデル構造と全パラメータ

20090419_034 今回、速度理論と数量化分析に使用しているモデル構造と予想パラメータの全てを公開します。これは私のソフトの心臓部分でVer.24.0.0に実際に組み込まれているものです。公開した理由は速度理論・数量化分析と一般の指数理論を差別化するためです。私の理論のルーツは1970年代に勤めていた会社と関係があった英国原子力公社のRadiochemical Centreが研究者向けに出していたパンフレットに掲載されていた非線形回帰のプログラムにヒントを得たもので、競馬とは全く関係しない分野からの発想です。DLファイルの内容は速度理論と数量化分析による競馬予想 (HRPTV5C)の解説にありますので、ここより落として下さい。さらにF27に定義されている基礎牝馬を見つけ出す為の母母母***12代母まで探れるデータテーブルも速度理論と数量化分析による競馬予想 (HRPTV5C)の解説にて落とせます。これはミトコンドリア因子を想定しました。

| | コメント (0) | トラックバック (0)

2009年6月19日 (金)

記号の醍醐味 3連単を楽しもう!

_29415_image002 3連単の醍醐味はなんと言っても的中時の金額の大きさです。万馬券は言うに及ばず、10万馬券、100万馬券、果ては1000万馬券となります。しかしながら、大きな壁もあります。単勝であれば1点でも数十パーセント的中率が見込めますが、3連単では1点の的中率は1%を超えるかどうかです。この低的中率をクリアするには多点数を買わなければなりません。この点を手っ取り早く解決するにはボックス買いと言う方法がありますが、3連単は3頭を入線通りに的中させなければなりませんので、5頭位をピックアップしたくらいでは中々的中しません。そこで6頭7頭と買う馬を増やす必要がありますが、例えば7頭ボックスを考えると買い目点数は210点、金額に直すと2万1千円になります。でも、この金額では気楽に購入するには少し大きいですね。

そこで考えられたのが上位9頭位まで組み込んでも買い目点数が36点から42点程度に抑えられる2軸マルチと言う方法です。この方法には必要条件が有ります。それは予想の質、即ち精度です。よく100万馬券的中などと宣伝されていますが、その詳細を調べてみますと、多くは7頭ボックスでの的中となります。それも多くが①②③-④⑤⑥⑦②③-④⑤⑥⑦、①③-⑤⑥(赤が1,2,3着来た馬の予想順位)と言うように、どうしても7頭即ち1レースにつき最低2万1千円以上必要になる的中状態です。言い換えると2軸マルチには耐えられない予想精度である訳です。

2軸マルチに耐えられる予想とは何かとなりますが、具体的には①②③-④⑤⑥-④⑤⑥あるいは①②③-④⑤⑥などになります。即ち上位3頭に3着までの2頭をカバーする精度が求められる訳です。実際には36点乃至42点まで許容すればでも的中となります。そうです速度理論と数量化分析による予想は、これにこたえられる精度を持っています。

それでは具体的に速度理論と数量化分析による予想とはどんなものでしょう。代表的なのが2009年5月9日東京12Rで①②(③)-③④⑤⑥の組み合わせで743,010です。直近では6月13日東京10R稲村ヶ崎特別①②(③)-③④⑤⑥273,990円、6月14日中京12R(①)②③-④⑥⑦の311,130円などがあります。ここで注目して頂きたいのは速度理論と数量化分析による予想の2軸の人気順位です。6月14日中京12Rでは予想順位2位に指定したのは8番人気の馬で3位になり、予想順位3位に指定したのは10番人気の馬で1位になりました。即ち人気順位には関わり無く上位に指定している訳です。これが速度理論と数量化分析による予想の精度を現しています。何故このような事が出来るかを説明するのは難しい事ですが、簡単に言えば本当に強い馬を見出せると言う事です。

| | コメント (0) | トラックバック (0)

2009年5月31日 (日)

記号の魔界 東京芝2400m馬番18は緑の魔界

Itarianry 皐月賞大敗組みのワンツー、そして皐月賞1着馬で単勝人気2.1倍の一番人気馬の大敗、今回の日本ダービー(優駿牡馬Jpn1・2009年5月31日)は予想の所作をあざ笑うような結果でした。速度理論の予想もオークス(優駿牝馬Jpn1・2009年5月24日)のようには行かず的中はしませんでしたが、殆どの予想が本命ないし対抗とした単勝1番人気のアンライバルトの予想順位を今回の結果に近い14位(確定順位12位)としました。即ち、全くの無印にしていた訳です。速度理論はアンライバルトの本当の強さを見抜いていたかもしれませんが、もう一つアンライバルトが勝てない理由も同時に示していたようです。速度理論の予想因子の中に東京の芝の2400mの馬番18の上がり速度がありますが、この予想因子の値が他のものに比べて大きなマイナスの値を持っていた訳です。これがどうのような意味を持つかと言えば、東京の芝の2400mの馬番18になった馬は、相当に傑出した能力を持たない限り、勝つ事は殆ど無いという事で、今回のダービーではその通りになったようです。

Sibaitemcategory200401n20083rd0920_ ところで問題なのは、この東京の芝2400mの馬番18の上がり速度が何故大きなマイナスになったかです。サンプルとなったのは2004年から延べ18頭いました。ダービーは2004年から算入されますので5頭です。サンプル数18と言うのは大きいか小さいかですが、どちらかと言えば非常に小さいものです。芝コース全体では約10万サンプルあります。ただ、多変量解析の手法からは18でもかなり信頼すべき値になります。東京の芝2400mの馬番1から17の上がり速度は実は余り変化がありません。馬番18だけ特異的に大きなマイナスとなっています。

緑の魔界の魔物とは芝生の事です。日本の競馬場には主に2種類の芝が使われています。主役は野芝、学名 Zoysia japonica 、日本に自生する芝から改良された品種で別の場所で育成されたものを移植(貼り付けて)して造成する。冬季は枯れる。もう一つは 洋芝・イタリアンライグラス(Italian ryegrass)、学名 Lolium multiflorum Lam. 本来は家畜の餌にされる牧草で非常に成長が早く播種(オーバーシード)によって簡単に緑化できる。冬季も緑を保つが夏の暑さには弱い。この2種類の芝により現代の競馬場は通年緑に保たれるが、実際、手で触れると、この2種類は全く別物である。野芝は私の田舎の道にも使われていましたが、根張りが良く、葉もしっかりしていて踏圧には非常に強いようです。一方、イタリアンライグラスは葉は柔らかく簡単に千切れます。実際、英国のゴルフ練習場で歩きましたが靴に纏わり付き、クラブは非常に重く感じました。特に水気が多いとどうにもならない状況でした。また、イタリアンライグラスの驚くべき点はその成長力です。今の時期ですと一日当り数cm(2~3cm)に達するようです。一方、野芝は実感として良くて数mmと言ったところです。イタリアンライグラスのボリュームはダービーの時点では考えられないほど大きさになっている筈です。

どちらの芝生が魔物かと言えば、当然イタリアンライグラスとなります。それとダービー週には仮柵移動が行われるようです。今回は一番外側になるCになり。仮柵移動によって荒れていた最内は使われなくなり、適度に踏圧された最内が現れ、今回はロジユニバースが最大限利用したようです。仮柵移動により大外18番の右側には踏み荒らされていないイタリアンライグラスの一見緑の楽園が出現し、こちらへと誘っている訳ですが、実際には緑の魔界であり、特に水分を多く含む場合、まさしく魔物です。馬番17番と18番の違いは右側に馬がいるかいないか差であり、馬番18の馬はどうも必ずイタリアンライグラスと言う魔物にスタート後暫くは足を取られスタミナを消耗して、最後の上がりで力尽きているようです。今後東京芝2400m馬番18は勝つ事は無いだろうし、馬場が悪化したら絶望的と考えられます。

よく出来た作り話か、出鱈目な作り話か、それとも真実なのか? なお、データは2004年以後の実際のレースを元にしていますので、それ以前のレースに当てはまるものではありません。

| | コメント (4) | トラックバック (0)

2009年5月10日 (日)

記号の評価 人力評価関数の終焉

Sibaitemcategory200401n20083rd092_3 連休中の興味の中心は競馬ではありませんでした。早稲田大学で行われていた第19回世界コンピュータ将棋選手権(2009)のIT中継をずっと見ておりました。お陰で競馬予想はさっぱりでした。しかし、将棋ソフトの進化は凄いですね。この世界でのブレークスルーは2006年に彗星の如く現れたBonanzaが使用した機械学習という手法ですね。機械学習自身は古くからある手法らしいですが、それを実際に実感(プロと平手で対戦出来る)できるところまでプログラムとして実装できるとは思われていなかったようで、そこで、それまでの機械学習とは区別する為に現在ではBonanza Methodと呼ばれているようです。Bonanza methodで重要な点は将棋の指し手の評価関数(特徴の重み)が自動学習のみで付与されており、人間のソフト作者個人として習得した将棋力(棋力)で付与されていない事です。因みに当時のBonanzaの作者の生身の人間として棋力は殆どゼロに近かったようです。

翌年(2007)は、私としてはBonanzaが優勝すると思っていましたが、棋力の高いソフト作者のソフトに上位を独占されて、Bonanzaは4位に陥落してしまい。さらに、去年(2008)こそは優勝すると思っていましたが、またしても人力評価関数ソフトに敗れてしまいました。そして優勝と準優勝したソフトはトップアマに連勝してしまいました。ただ、この時優勝したソフトの6勝1敗の1敗はBonanzaによるものでした。Bonanzaは3位となりシード権は得ました。そして今年(2009)、当然Bonanzaが優勝となると思いきや、なんと5位に沈みシード権までも失ってしまいました。意外でした。でも、Bonanza methodとしては完全勝利でした。優勝したのは、このmethodを精緻に展開したGPS将棋であった訳です。

今回の選手権では前回優勝ソフトは2勝5敗と大幅に負け越し、過去何度も優勝した事のある人力評価関数ソフトは1勝6敗で決勝8ソフト中6位と7位であった。面白いのは前回準優勝ソフトで、このソフト作者は学習で得られた評価関数をその高い棋力で調整(ドーピングと言うらしい)したようです。今回も期待されていたようですが不参加とされたようです。GPS将棋が優勝した結果から考えると人力では無理と判断されていたようです。Bonanzaの初出場の時は1万近い特徴の重さを自動学習していたそうですが、今回優勝したGPS将棋は2万2千もの特徴の重さを計算したようです。これほどの数になれば、手動で調整する事はいくら高い棋力があっても無理な気もします。

何れにしましても、表題の人力評価関数の終焉はトッププロと対峙できるソフトとしては通過儀礼として迎えなければならないものであり、今回それが起こったようです。しかしながら、特徴の自動抽出などなど(一部には将棋のルールから学習を始めようとする意欲的な挑戦?もあったようです)というのは、まだまだ夢の彼方であり、この部分あるいは教師データの選択など限りなく人知(棋力)が必要である事も確かな事です。

| | コメント (0) | トラックバック (0)

2009年4月16日 (木)

記号の乖離 B.M.SはB.M.Sに非ず?

Matuzaka 量的形質とはからの続きです。ところで、前の記事に書きました血統思索者の葛藤をよく表していると思われるのが、今は更新が止まっているようですが血統の深淵が参考になります。それと量的形質の遺伝を解説している別の分野がありました。レース鳩の血統解析です。ここでもレース鳩の飛行性能が量的形質であるとの解説がありますが、聞き手の一般のレース鳩飼育者は量的形質とは初耳である様な事が書かれていますので競走馬と同じような血統観あるいは血統理論が流布されているのだなーと感心しました。ここで、また少し横道にそれますが、メンデルの法則と確率の出会いが面白いですね。弧愁と言うページに上手く纏められているハーディー・ワインベルクの法則(Hardy-Weinberg principle)がそれに当ります。でも、この辺から強烈に難解になりますね。

| | コメント (0) | トラックバック (0)

記号の乖離 量的形質とは

20090412alpus_002 血統理論と遺伝学の乖離からの続きです。競走馬の血統ないし血統理論は文献学的事実を纏めたもので科学的な事実で裏付けられたものでは殆どありません。文献学的な事実で構成された血統理論で、そもそも未来予測である競馬予想を行う事が出来ると考えてしまうリテラシー(物事を理論的にあるいは科学的ないし合理的に考え、その本質を理解する力)に問題があるのではと思います。しかしながら、私もNHKの風林火山、篤姫、天地人などの大河ドラマは欠かさず見てしまいます。元となっている歴史小説の作者は異口同音に文献的、歴史的事実を素材にしているが作り話・フィクションである事を強調していますが、ついつい引き込まれてしまいますね。血統理論もこれと同じ原則に沿っています。従って血統と言うフィクションに引き込まれて楽しむのは有りですね。

ですけれど、フィクションに酔いしれた頭で、お金を賭けるギャンブルである競馬の予想を行うのはどうでしょうか。一端冷静になって考えてみましょう。前にも書きましたように競走馬の速く走る能力は実体が何であれ”量的形質”となります。即ち多数の遺伝子によって決まります。また表現形(観察できる形質)は”環境因子”の影響を強く受けます。この点が”質的形質”とは違っています。例えば質的形質の代表的なものに血液型がありますが、表現形は全く環境因子の受けません。

一方、量的形質の代表的なものは人間の身長や体重ですが、栄養状態が極端に悪くなれば勿論体重は軽くなりますが、身長も低くなります。経済生物である牛や豚あるいは花卉などの植物であれば環境を有る程度までコントロールして表現形を観察できますが、競走馬では難しいと思われます。即ち、表現形としての競走馬の速く走る能力も環境に大きく左右されている訳です。さらにこの走る能力は多数の遺伝子の影響を受けていますので、例えば血統用語で血量で表せば50%に相当する親子であっても量的形質としての早く走る能力が伝わる確率は数百分の1から数千分の1となります。

血統理論を科学的なレベルまで持ち上げるには量的形質の遺伝に突き進んでいかないとなりませんが、ここで突如では有りませんが、必然的に現れるのが統計学と確率論です。多分、血統理論を真面目に考えれば、ここに至るとは思いますが、統計学と確率論は余りにも高い壁です、まともに取り込むのは大変な事です。そこで多くの血統思索者は物語を選んだ訳です。しかし、これでは袋小路ですね。そんな中、一条の光が差し込んできました。先を急ぐ人は量的形質の遺伝解析などを参考にしてください。

| | コメント (0) | トラックバック (1)

2009年4月11日 (土)

記号の不整 VistaへHRPTV5Cをインストールする

Sidareminamioosawa 最近Vistaを使用されている方が増えているようです。OSとしては最初は取り扱い難く余り積極的には使ってきませんでしたが、振り返って見るとウイルスに感染して大変な目には遭っていません。2000及びXPでは何回も経験していますから不思議ですね。どうも仮想化という技術が功を奏しているようです。しかしながら、VB6アプリケーションを使うに当っては、これが原因でトラブルを起こしているようです。それにしてもVB6は息の長い言語ですね。開発環境こそ2008年4月でサポートが終了していますが、ランタイムのサポートというか使える状況はVistaの次の7まで続くようです。

それでHRPTV5Cのインストール時のトラブルの原因ですが、このVB6ランタイムルーチンの不整となります。基本的はVistaにはVB6のランタイムルーチンが予めインストールされており、VB6アプリケーションは動きそうなものですが、実際にはエラーでます。VistaでVB6のSP6(最後のサービスパックーHRPTV5Cはこれを使っています)を動かす為にはVista用に作られたランタイムルーチンVB6SP6ver4のインストールが必要となります。現在HRPTV5CVB6に同梱していますランタイムルーチンはVista用のもので、Vistaに予めインストールされているVB6ランタイムを書き換えずに不足しているランタイムルーチンをインストールします。

ところで、VB6SP6ver4をvistaに単純にインストールしてもインストールされません。即ちHRPTV5Cを起動しても動きません。通常はエラー339となります。ここで仮想化の問題が出てくる訳です。そうですランタイムのインストールも”管理者権限”で行わないとだめな訳です。しかしながら、ここから先は私にも分かりませんが、VB6SP6ver4を管理者権限で単独インストールは上手く行かないようです。VB6アプリケーションと同梱したものを管理者権限で解凍インストールしてさらにランタイムを管理者権限インストールした場合に上手く行くようです。どうも管理者権限の継承に問題があるようですが、エラーが出ずに動けば良いとして、ここまでは追求していません。

| | コメント (2) | トラックバック (0)

2009年4月 3日 (金)

記号の乖離 血統理論と遺伝学の乖離→量的形質とは

Sidare2_2  巷間に存在する血統理論が基本的に誤っているのは、競走馬の能力が量的形質である事が正確に理解されていない点にあると考えています。血統理論において遺伝学の知識はメンデルの法則が援用される等、生かされている部分があるのですが、馬の走る能力も血液型や毛色などの質的形質と同様に考えられ理論展開がされている点が問題になります。即ち、走る能力を決める特定された遺伝子(塩基配列)が代々引き継がれメンデルの法則により開花したりしなかったりするのではと考えられているのではと思います。

しかしながら、考えて見れば分かると思いますが、どんなに優れた心肺機能を持っていても、ポニー程度の体躯ではサラブレッドには勝てない(漫画の世界では勝ってしまう意外性の設定が受けていますが)訳です。少なくとも400Kg程度以上の体重とそれなりの脚の長さは必要です。

ところで、話が少し横道にそれますが、量的形質とは何かです。これと競走馬の血統理論に関してgoogleで検索して見ますと、トップページでは次の2つに関連したページしか引っかかりませんでした。一つはwikipediaの”競走馬の血統”もう一つは私が書いた”血統論がトンでもな理由”です。量的形質の遺伝に関してはgoogleで検索すれば学問としての統計遺伝学あるいは集団遺伝学の解説が読めます。ここで注意しなければならないのは巷間に流布している血統理論あるいは血統について書かれている書物の出版時期です。当時、既に量的形質の遺伝についての概念は出来上がっており、競走馬の走る能力は実体が何であれ科学的に突き詰めれば”量的形質”としてしか定義出来ない状況であった訳です。

量的形質とはに続く

| | コメント (6) | トラックバック (0)

2009年3月26日 (木)

記号の思考 3連単2軸マルチの的中解析のソースコード

今回は趣向を変えて、私のVB6のソースコードをご紹介します。プログラム言語の特長とかテクニックではなく、的中解析のアルゴリズムが面白いのではないかと思います。3連単の買い方は多分非常に難しいと思います。特にボックスでは買い目が4頭-24点、5頭-60点,6頭-120点,7頭-210点、8頭-336点と急上昇します。即ち、無駄な買い目が非常に多い訳です。一方2軸マルチは予想順位7位まで絡んでも買い目は30点、8位で36点、9位でも42点にとどまります。超高配当が狙える割には少ない点数に抑えられます。しかし、的中アルゴリズムは私にとって中々困難なことでしたが、以下のソースコードで示しますように何とか成功しました。頭の体操と3連単とは如何なる物かを理解する上で参考になれば幸いです。

'*************3連単12マルチ**************************
If CInt(ThisWeekSyosai(I1, 10)) > 8 Then
S12KaimeSuu = 30
HajimeTensuu = 3
OwariTensuu = 7
Else
S12KaimeSuu = 36
HajimeTensuu = 3
OwariTensuu = 8
End If

Select Case Val(Detail.Torokutosu(0))
Case 1 To 4
URFKaimeSuu = 12
HajimeTensuu = 3
OwariTensuu = 4
Case 5
URFKaimeSuu = 18
HajimeTensuu = 3
OwariTensuu = 5
Case 6
URFKaimeSuu = 24
HajimeTensuu = 3
OwariTensuu = 6
Case 7
URFKaimeSuu = 30
HajimeTensuu = 3
OwariTensuu = 7
Case 8
Case Else
End Select

S12KaimeRuikei = S12KaimeRuikei + S12KaimeSuu

TekichuCount = 0

KakuteiKumi = KakuteiJuni(Umaban(1)) & KakuteiJuni(Umaban(2))

Select Case KakuteiKumi
Case "0102"
TekichuCount = 2
SeekJuni = "03"
Case "0201"
TekichuCount = 2
SeekJuni = "03"
Case "0203"
TekichuCount = 2
SeekJuni = "01"
Case "0302"
TekichuCount = 2
SeekJuni = "01"
Case "0103"
TekichuCount = 2
SeekJuni = "02"
Case "0301"
TekichuCount = 2
SeekJuni = "02"
Case Else
TekichuCount = 0
End Select

Select Case TekichuCount

Case 2
For I2fk = HajimeTensuu To OwariTensuu
If KakuteiJuni(Umaban(I2fk)) = SeekJuni Then
TekichuCount = TekichuCount + 1
End If
Next I2fk
Case Else
End Select

If TekichuCount = 3 Then
S12k = SRTN(Hrhi.PaySanrentan(0).Kumi)
S12h = CStr(CLng(Hrhi.PaySanrentan(0).Pay))
S12TekichuSuu = S12TekichuSuu + 1
S12RuisekiHaito = S12RuisekiHaito + CLng(Hrhi.PaySanrentan(0).Pay)

End If

| | コメント (0) | トラックバック (0)

2009年3月25日 (水)

記号の解析 単勝・複勝などの的中解析

現在、買い目は一点毎に提示していますが、予想順位をそのまま投票される方に向けて単勝・複勝・フォーメイション・ボックス・マルチの的中率並びに回収率を参照出来るルーチンを作って見ました。なお、下に示されているレースが荒れるか堅く収まるかの判定は予想タイム(速度)のばらつき(標準偏差)を基準しています。予想タイムが大きくばらつく場合(標準偏差が大きい)は馬の能力差が大きくレースとしては堅く収まるとして買い目点数は少なく、反対にばらつきが少ない(標準偏差が小さい)場合は、馬の能力差が小さく”どんぐりの背比べ”となりレースとしては荒れるとして買い目点数を増やして回収率並びに的中率を計算しています。

単勝1、複勝1は数量化予想順位1位を1日1場12レースを1点買いした場合の的中率と回収率を示しています。複勝1は的中率も回収率も高い傾向があり一番のお勧め馬券です。単勝2、複勝2は数量化順位2位を同様に購入した場合の的中率と回収率を示しています。単勝2は的中率は高くはなりませんが、思いがけない高配当が出ます。特に馬場が荒れた場合の押さえとして有効です。複勝2は複勝1と共にお勧めです。

馬連Fはフォーメイションと言う買い方で1着候補に予想順位1,2,3位、2着候補にレースが堅く納まると予想される場合は予想順位1,2,3,4,5,6位が荒れると予想される場合は予想順位1,2,3,4,5,6,7位が来るとして的中率並びに回収率が計算されています。買い目点数は前者が12点、後者が16点となります。

馬連Bはボックス買いとなります。レースが堅いと予想される場合は上位5頭ボックス(予想順位1,2,3,4,5位)となり買い目点数は10点です。レースが荒れると予想される場合は上位6頭ボックスを想定して買い目点数は15点として回収率並びに的中率が計算されています。

馬単Fはフォーメイションと言う買い方で馬連Fと考え方は同じですが、買い目点数が堅いレースは15点、荒れるレースは18点となります。的中すれば高配当が望めますが、予想順位4位以下が1着にきた場合外れとなります。

3連複Bはボックス買いとなります。馬連Bと同じ考え方ですが、買い目点数は堅い場合10点、荒れると予想する場合20点を想定しています。

3連単12は通称2軸マルチと呼ばれる一寸特殊な買い方です。的中すれば30点強で100万馬券を遥かに上回る1000万馬券まで狙えます。3連単12は予想順位1,2を2軸に堅いレースの場合、予想順位3,4,5,6,7,8位に流します。この場合は買い目点数は36点となります。荒れると予想されるレースの場合は予想順位3,4,5,6,7,8,9位まで流し、買い目点数は42点を想定しています。

3連単23並びに3連単13は、それぞれ2軸に予想順位2,3位と予想順位1,3位を設定した場合です。ただ、注意して頂きたいのは流す相手の予想順位が4位から(~8位または9位)になりますので、3連単12は必ず購入して下さい。即ち、買い方としては3連単12単独、3連単12+3連単23か13、3連単12+3連単23+3連単13となります。3連単23と3連単13は3連単12に比べ更に強烈な高配当志です。買い目点数は3連単12より少ない30点並び36点となります。

20090322hannsintffm 

| | コメント (0) | トラックバック (0)

2009年3月23日 (月)

記号の同値 同値同着予想の問題点

現在私のソフトの買い目はタイム(速度)合計法と言うあまり一般的でない手法により求めています。この方法の利点は理論上無駄な買い目を最小にできる事ですが、問題点としては買い目を1点毎に扱う必要が有り、特に多点数になる馬単、3連複及び3連単については手入力では煩雑で事実上購入するのには至らないのではと感じています。その為、”シンプルぱっと”や”ターゲットの外部指数”などの競馬支援ソフトで使えるように買い目をCSVファイルとしてソフトから出力できる様にしました。

しかしながら、競馬場やWINSでマークシートを使われる方やIPATを使われる方に取っては予想順位をそのまま使って、フォーメーション、ボックスあるいはマルチフォーメーションで投票されているのではと思います。ここで問題となるのがフォーメイションとかボックスではどの位の点数を購入して、どの位の的中率並びに回収率が期待できるのかです。タイム(速度)合計法では既に”予想結果の纏め”やソフト自体に過去予想成績で検証できるルーチンを用意して、情報を提供しています。そこで、これに習いフォーメイションやボックスでの的中率並びに回収率を検証できるルーチンをプログラムして見ました。

ところで、的中解析のアルゴリズムを考えていて気が付いたのですが、予想を提供できるソフトをあれこれ弄くって見たのですが、どうも予想検証あるいは馬券シミュレーションに満足できるものがありません。突き詰めて行くと”同値同着予想の問題点に行き着くようです。例えば80を中心値とした指数系では、89,89,89のように同値同順位が頻繁に発生します。この場合、上位5頭ボックスの買い目を考えると、通常上位4頭か5頭目に前述の同値同順位が頻繁に現れるために上位6頭、7頭とか8頭ボックスになってしまい条件(厳密に5頭ボックス)が揃わず検証が曖昧なものになってしまいます。

同値同着の回避は、一般的には行われていないようです。買い目が多くなれば的中数が上がりますので見栄えが良くなります。ですが回収率的には問題が残ります。同値同着の解決には過去のパフォーマンス等の付加情報を付ける場合もありますが、数的に扱いが難しく検証には不向きな気がします。便法としては指数の少数点以下に馬番を入れ強制的に同値同順を無くす方法が取れます。一見インチキぽい感じがしますが統計学的には問題は無いようです。最終的な解決法は指数に重複が出現しない理論を使う事です。この点では数量化理論による予想タイム(推定速度)には全く重複が出現しませんので正確な的中解析が可能です。

以下の表はフォーメイション、ボックスなどに単勝・複勝を加えた的中率*回収率です。ただ、この数値は予想因子のパラメータに過去の実際の予想とは少し違ったものが適用されていますので、過去予想実績と全く同一では有りません。

20090307hannsinn2_28794_image002

| | コメント (0) | トラックバック (0)

2009年3月15日 (日)

記号のCSV ターゲットの外部指数用推定速度のCSVファイル

ターゲットの外部指数用の推定速度CSVファイルをソフトとは別にアップロードするようにします。即ち、HRPTV5Cソフトが無くてもターゲットさえあれば予想が見られる訳です。但し、ファイルは前日では無く日曜日の最終レース後にアップロードします。ただ、間違(?)えて前日アップロードするかも知れません(?)。CSVファイルはエクセルあるいはワードパットでも読み取る事ができますので、ターゲットも必要無いかも知れません。以下の画面は2009年3月15日の中京9レースのターゲット出馬表です。参考にして頂ければ幸いです。なお操作法はターゲットに外部指数として取り込ませる(1)からお読み下さい。CSVファイルの解凍先は標準的にはProgram Files¥HRPTV5C¥SOKUDOです。

20090315chukyo9rtarget

| | コメント (0) | トラックバック (0)

2009年2月28日 (土)

記号の指数和 ターゲットの外部指数からのタイム合計法による買い目(2)

ターゲットに外部指数として読み込ませた推定速度から指数機能を利用したタイム(速度)合計法により導出した買い目を実際にIPATより購入して見ました。タイムは速度と距離から一義的に求まりますので等価です。レースは2009年2月28日阪神11Rアーリントンカップ(G3)です。ターゲットの外部指数からのタイム合計法による買い目(1)からの手順は投票をクリック->買いたい目のオッズをクリックして反転させます-->ここがIPAT支援ソフトと違い購入点数を自由に設定でき、低すぎるオッズを削れます。-->買い目転送をクリック->はい->取り込むをクリック->金額をクリックして掛け金を入力->IPAT投票をクリック->あとは指示に従い投票完了。

Aerlintonkaime

Aerlintontouhyou

| | コメント (0) | トラックバック (0)

2009年2月27日 (金)

記号の指数和 ターゲットの外部指数からのタイム合計法による買い目(1)

ターゲットに外部指数として取り込ませる(1),(2),(3),(4),(5),(6).(7),(8)で数量化理論と速度理論による各馬の推定速度をターゲットにセットできたかと思います。ところで、数量化理論では買い目が示されていますが、この買い目をターゲットに作らせターゲットのIPAT機能を利用して投票できれば非常に便利ではないかと考えていたところ、ターゲットの作者さんのブログに外部指数の指数和が使えるとのアナウンスが有り、早速使って見ました。対象にしたのはに2月21日の京都7Rです。このレースでは7630円の3連複が1点目で的中しています。使用条件としましては既に出馬表は読み込まれているものとして、まず、出馬表をクリッツ->出馬表ファイル選択で当該レース日を選択してOK->当該レースをダブルクリック->予想したいレース(京都7R)が表示されたらJVオッズ取得をクリック->オッズをクリック->▼3連複作成をクリック->マーク全Aをクリック->ソート指数和をクリックした状態が下の画面です。

Target20090221kyoto7rkaime_2 

| | コメント (0) | トラックバック (0)

2009年2月11日 (水)

記号の効率 大数の法則か、効率化仮説か?

数量化理論による2008年の3連複、3連単予想において、回収率の点では100%の壁を大きく突き破っています。どうも必勝法であるらしいのですが、この理由を大数の法則と効率的市場仮説との対比で解説したいと思います。競馬には必勝法が存在しないとする理論的な根拠に大数の法則が頻繁に引用されます。果たして、この引用は正しいのでしょうか。正しくもあり、正しくもないと言ったところですか。馬券(複勝から3連複ぐらいまで)の一番人気の回収率は大体75%前後に落ち着くようです。また、この75%と言うのはJRAの控除(国への税金、運営費、賞金など20%から25%)を引いた数字と略同じになることから、大数の法則、75%、JRAの控除の3点セットで競馬には必勝法が存在しない事になっているようです。しかしながら、本当のところは大数の法則も控除も直接には関係なく、回収率75%が導出される本当の理由は馬券市場において”効率的市場仮説”のウイークフォーム(多分)が成立していると考えるのは論理的ではないかと思います。

下のグラフ並びに表は2007年~2008年の全てのレースの単勝人気順1位と当該券種の人気順1位の的中率と回収率を調べたものです。一般的には同じ様な印象で受け取られていると思います。事実、的中率では殆ど差がありません。しかしながら、不思議な事に回収率には大きな差があります。特に3連単では単勝人気順が61%に対して券種としての3連単1番人気は52%と大きく下がります。また、3連複の75%、73%とも大きなさがあります。サンプル数は相当大きいので偶然の出来事として片付けてしまうには大きすぎる差と考えています。この事実をどのように説明するかです。これには情報の拡散速度も絡んでくるようです。

_2687_image111

_2687_image114

_2687_image117

| | コメント (0) | トラックバック (0)

2009年1月24日 (土)

記号の標的 ターゲットに外部指数として取り込ませる(8)

     

ターゲットに推定速度を外部指数として取り込みが成功したら見たいのは色々な条件での的中率や回収率となります。これがなかなか難しいところもありますので、少し解説を試みてみます。一応2007年からの推定速度の取り込みが成功したとして数量化1,2,3位の2008年の単複的中率並びに回収率を求めて見ましょう。まず、ターゲットを起動しましたらレース検索を選びます。表示されます戦歴・レース検索条件の着順範囲の全をクリックします。次に検索実行をクリックしますと検索範囲の設定が表示されます。ここで検索開始日の年末、前年をクリックします。次に検索月数に黒ポチを入れます。デフォルトで12ヶ月ですので、このまま検索実行をクリックします。レース検索が表示されましたら左上2番目のファイル(F)をクリックし、外部指数の読み込み(開発中)から【推定速度】を読み込むをクリックします。次にレース検索の中程にある集計項目メニューから全項目をクリックし中段より下にある外部指数順位をクリックしますと指数順で2008年の集計結果でます。1位が数量化による推定速度の1位を表します。

| | コメント (0) | トラックバック (0)

2008年12月31日 (水)

記号の3連単 2008年3連単万馬券について

     

3連単につきましては7月19日に開始されたサマーステージよりなし崩しに全レース適応になりました。ところで、2008年中に中央競馬では3452レース実施されたようですが、その内何レースに3連単が発売されたかについては明示されたものがありません。実際に計算して見ますと2238レースになるようです。このレース数を元に数量化理論の3連単的中率、回収率を計算して見ました。まず、1,2,3着をその順番通りに当てる正真正銘の1点的中は19レースありました。的中率では約0.9(19/2238)になりますが、回収率は69万馬券等があり、457%に達しました。本線42点では的中率16.5%(370/2238)、回収率110.4%でした。ちなみに、全レース3452レースを対象にした3連複本線1点目的中は146本あり、的中率は4.2%(142/3452)で回収率は136.6%でした。3連複本線7点購入では的中率17.7%(610/3452)、回収率102.8%でした。

| | コメント (0) | トラックバック (0)

2008年12月30日 (火)

記号の万馬券 2008年万馬券的中エクセルファイル

     

2008年は夏より3連単が全レースになり、万馬券が増える背景が有りましたので、861本に達しました。単勝枠連万馬券を加えると882本になります。内容的には100万以上が2本、10万以上が60本となります。ただ、万馬券は定義によりいくらでも大きな数字に出来ますので、あまり意味は無いのですが一応の目安にはなります。数量化理論が他の予想と差別化出来る点は本線予想、即ち少ない点数で高額配当に至る事だと思います。本線とは馬連では6点、馬単では表裏12点、3連複では7点、3連単では42点になります。それでは良いお年を。

「ATARILIST2008ORIGINALMANBAKEN.xls」をダウンロード

| | コメント (0) | トラックバック (0)

2008年12月29日 (月)

記号の標的 ターゲットに外部指数として取り込ませる(7)

     

下の画面は2008年7月20日小倉2Rの推定速度をターゲットの外部指数に取り込んだものです。3連単は1点目で691700円が的中しています。2007年~2008年の全レース(6914R→6908R?)の推定速度の解析が可能になりました。推定速度はレース結果を取り込んでパラメータを再最適化したものでは有りません。純粋に事前予想を記録したものです。

Tgjkako20080720kk2r

| | コメント (0) | トラックバック (0)

2008年12月27日 (土)

記号の標的 ターゲットに外部指数として取り込ませる(6)

     

下の画面はVer.18.1.0による2008年12月27日の中京最終12R長良川特別の推定速度を取り込ませたターゲット出馬表です。指数が数量化理論による推定速度、指順が予想順位です。この時点では人気順(オッズ)とZIとマイニングとの比較が出来ます。導出されるロジックがそれぞれ違いますので順位は違います。後は実際に使われる方の匙加減となりますが、日本(世界?)で最高レベルの情報が詰まっているのは確かです。それと私のソフトの重さから解放されるのも良いですね?

20081227ck12r

| | コメント (0) | トラックバック (0)

2008年12月26日 (金)

記号の標的 ターゲットに外部指数として取り込ませる(5)

     

下の画面はVer.18.1.0による2008年12月27日の中山最終12RグレイトフルSの推定速度を取り込ませたターゲット出馬表です。指数が数量化理論による推定速度、指順が予想順位です。この時点でZIとマイニングとの比較が出来ます。明日の午前7時以降は人気順とも比較できます。

20081227nk12r

| | コメント (0) | トラックバック (0)

2008年12月24日 (水)

記号の標的 ターゲットに外部指数として取り込ませる(4)

     

下の画面はVer.18.0.1による2008年12月21日の中山5R新馬戦の成績です。過去走の無い新馬でも正確(?)に予想できる事を示したものです。こちらでは推定速度のタイトルが入ります。

20081221nk5rsinba

| | コメント (2) | トラックバック (0)

記号の標的 ターゲットに外部指数として取り込ませる(3)

     

外部指数ファイルの定義をOKしますと下の画面になります。チェックボックスにチェックを入れ(クリック)入れNo1を設定します。No 0はマイニングとなります。OKをクリックすれば完了です。出馬表であれば★4をクリックすれば”ターゲットに外部指数として取り込ませる(1)”の画面が現れます。RACEID.txtはHRPTV5CソフトでSOKUDOフォルダに自動生成されています(筈です)。

Gaibusisuusettei

| | コメント (1) | トラックバック (0)

記号の標的 ターゲットに外部指数として取り込ませる(2)

     

ターゲットを起動しましたら、まず、オプション(O)をクリックします。次に環境設定(E)をクリックします。次に環境設定項目メニュー(M)のその他 外部指数の設定をクリックします。次に新規追加をクリックしますと以下の画面のような外部指数ファイルの定義が出てきます。まず、指数名(N)は推定速度としましたが、名前は自由ですので好みものを入力下さい。次にパス・ファイル名(F)は参照を使ってSOKUDOフォルダまで捉えて下さい。下の画面ではC:\Program Files¥HRPTV5C¥SOKUDO\が相当します。C:\Program FilesまではHRPTV5Cソフトをインストールした場所になりますのでD:\何とかになったりします。その後は手入力%Y3%M1%D1%P4%K3%N3%R1.csvと記入してください。おまじないのようですが約束事です。あとのボタンチェックは画面のようにしてOKをクリックして下さい。

Gaibusisuu

| | コメント (0) | トラックバック (0)

記号の標的 ターゲットに外部指数として取り込ませる(1)

     

ターゲットは競馬予想支援ソフトとして最も普及しています。従いましてターゲットに数量化理論による結果を取り込ませれば色々加工でき、便利だと思い、推定速度(時速-整数4桁)と予想順位のCSVファイルを作成しました。まずは、ターゲットの表示画面をご紹介します。これは2008年12月20日の仲冬ステークスのものです。指数が数量化理論による推定速度です。表示の関係で4桁の整数になっていますが100分の1にしますと時速(Km/hr)となります。タイムへの変換は距離から求めて下さい。指順は数量化理論による予想順位です。人(気)、(ZI)順、マイ順、指順と結果取得後には(確定)着(順)と比較でき大変便利です。

20081221nk5rtarget

| | コメント (0) | トラックバック (0)

2008年12月17日 (水)

記号の連動 リアルオッズとの非連動を利用した高度な買い方

     

数量化理論による予想の印象は多分1点で69万馬券や6点で100万馬券を的中するなど大穴に志向したものと言うのが一般的だと思います。しかし、本当に凄いのは数量化予想順位1,2位の単勝と複勝にあります。一般的な予想の多くはリアルオッズに連動したものが多く、人気上位に来る馬を中心にして多少意外性のある馬を加えたものが大部分かと思います。一方、数量化理論による予想では意外な馬を数量化1,2位に挙げ、それがそのまま一位入線する頻度が多くなっています。即ち、リアルオッズに殆ど連動していない訳ですが、それでいて的中率は低くは無い事になります。言い換えると数量化による予想は高精度となります。このリアルオッズとは非連動でありながら高精度な予想が出来る点を利用した買い方が数量化1,2位の単複買いになる訳です。具体的に複勝を例に取りますと数量化1,2位の複勝リアルオッズが2倍以上の時のみ購入します。万馬券を求めて多点数購入するよりもずっと負担が小さく、ローリスク・ハイリターンが狙えます。但し、数量化1,2位の複勝リアルオッズが2倍以上になるレースは事前に特定できませんので、全レースの数量化予想を予め取得して置く必要とリアルオッズを入手出来る環境が必要となります。

20081214090504rcm_31131_image002_2

| | コメント (0) | トラックバック (0)

2008年12月 9日 (火)

記号の信頼 信頼度を利用した高度な買い方で100万馬券的中へ

     

2008ゴールデンホイップトロフィーでは多くの外国人騎手が出場しています。その内の多くの騎手は日本での出走実績が無いかあっても1回程度です。信頼度での表示は左端のA~Fの記号で表され、前述の1回以下は、EとかFになります。GHTではシン、シュタル、ガルシア及びムルタ騎手になります。このうちムルタ騎手は予想順位一位ですが、信頼度Eですので、一位ではありますが買い目から外します。そうしますと、馬番1のメンディザバル騎手(D)のマッチメイトが1位に、馬番5のホワイト騎手(A)のクラウンプリンセスが2位に、馬番9のウイリアム騎手(C)のヒサノアルハンブラが6位となります。ここで2軸マルチフォーメイションで3連単を購入すると仮定しますと1,057,640円が24点目で的中に至ります。ある意味都合の良い解釈ですが信頼度の具体的な使い方の参考にして頂ければ幸いです。

現在のランキング順位はこちら

| | コメント (0) | トラックバック (0)

2008年11月16日 (日)

記号の落馬 ポルトフィーノ 1着!

     

今回のエリザベス女王杯で一番印象に残ったのはポルトフィーノの快走(怪走)でした。コーナーでは流石に大外に振り出されましたが、1着になったリトルアマポーラに馬体を併せて、最後は綺麗に差しきって快勝(怪勝)してしまったではありませんか、騎手がいないのに凄いと思いました。しかし、さらに驚いたのは、レース後に放映された落馬の瞬間の映像でした。武豊騎手はポルトフィーノの前に放り出され、あわやポルトフィーノに踏みつかれて大怪我を心配させる映像でしたが、実際には武豊騎手は無事のようでした。何れにしても騎手の恐怖心は如何ばかりか計り知れないものがあります。一方、ポルトフィーノの快走を見て考えたのは、ポルトフィーノが騎手を踏みつけないようにして走ったのではないかとの思いです。馬の視野は非常に広いと言われますし、野生の段階では岩だらけの荒野を走っていた事を考えると、あながち無理な考えでは無いのではと思います。今回のエリザベス女王杯では馬の賢さを垣間見た一瞬でもあったような気がします。

現在のランキング順位はこちら

| | コメント (0) | トラックバック (0)

2008年10月17日 (金)

記号の変? 偏相関と言う概念

     

私が使っています数量化1類はダミー変数による重回帰と等価とされていますが、重回帰の中でも難しい概念は偏相関です。この説明には単純に予想因子と馬の能力(速度)との本当の関係として、あまり詳しく触れませんでした。しかし、最近、この偏相関について分かり易く(?)解説したページが見つかりましたので、ご紹介したいと思います。サイトのタイトルは”アイスクリーム統計学にようこそ!”と言うものです。物事の表面的関係(単相関)と偏相関の違いをアイスクリーム店に来る客の数とその日の最高気温及び最低気温と関係を例にして解説しています。内容的には常識では理解できないような事がさらっと記述されています。それは当然競馬予想にも適用される訳です。

現在のランキング順位はこちら

| | コメント (0) | トラックバック (0)

2008年9月17日 (水)

記号の父父 サンデーサイレンスは父父馬としては現役です。

     

多重共線らしきものを調べていましたら、何となく数年前に比べて予想精度が落ちている原因が判って来ました。精度が落ちた一番の理由はやはりサンデーサイレンスがいなくなった事によるようです。数量化では種牡馬は重要と考えモデルに取り込んでいます。具体的には産駒出走数(サンプル数)の多い順番で種牡馬にダミー変数を100から200程度割り振り、サンプル数の少ない種牡馬は統合しています。種牡馬数は2004年以降では約900頭になっています。問題なのは、種牡馬の中でサンデーサイレンスの様に死亡した場合です。数量化演算の中でサンデーサイレンスの産駒データは他の因子の影響度を妥当なものにする為に非常に重要なのですが、サンデーサイレンス自身の影響度を充当すべき産駒が近年では老齢化して非常に少ない状況で、折角算出した影響度が役に立たない事態になっています。本当に欲しい新進の種牡馬はその他に統合されているか、サンプル数が少なく信頼がおけない状態になっています。今から4年前くらいでは、サンデーサイレンスが生きており毎年産駒が多数出走していました。この頃はサンデーサイレンス自身の影響度が有効に働き数量化予想も順調でした。即ち、現状ではサンプル数が多い種牡馬の予想因子ウエイトが効率的に利用されていない訳です。

そこで、考えたのが父の父馬の導入です。しかし父馬と父父馬との間に多重共線らしき現象が出現して上手く行きませんでした。上手く行かないのであれば父馬は出来るだけ数を抑えて父父馬を中心にしてみました。これで試行したバージョンでは馬連6点での回収率100%近く示しましたが、特徴的なのは的中率が40%近くに達した事です。来週からはこのシステムを採用します。考えて見れば父父馬としてのサンデーサイレンスはまだ十分現役ですので、このモデルは行けるのかなと考えています。

現在のランキング順位はこちら

| | コメント (0) | トラックバック (0)

2008年9月 1日 (月)

記号の共線 数量化1類における多重共線らしきものの考察 Part2

     

多重共線らしき現象の主役の1頭であるダンシングブレーブに不思議な事が起こるのです。孫馬達のデータを調べていたら、彼らあるいは彼女らの祖父(父の父)馬が不思議な事に2頭いるのです。即ち、Dancing Braveとダンシングブレーヴがいたのです。これは有り得ない事ですね。(これは今回の問題とは別にデータベースの無謬性と言う厄介な命題に繋がります) この2頭の内、Dancing Braveが多重共線らしき現象を芝コースで引き起こしました。父父馬としてのDancing Braveのダミー変数のサンプル数が父馬コマンダーチーフと父馬ホワイトマズルの両ダミー変数のサンプル数合計と全く一致してしまったのです。具体的な数字を挙げますとDancing Braveのサンプル数が2812、コマンダーチーフのサンプル数は1633、ホワイトマズルのサンプル数1179となり、1633+1179=2812となり見事一致します。ここでのサンプル数は孫馬(コマンダーチーフとホワイトマズルに取っては産駒になります)のここ4年間(2004年~)の延べ頭数となります。

現在のランキング順位はこちら

| | コメント (2) | トラックバック (0)

2008年8月31日 (日)

記号の共線 数量化1類における多重共線らしきものの考察 Part1

     

多重共線性(multi-colineality)、通称はマルチコと言うらしい。一般に多変量解析では非常に厄介な問題であるが、あまり具体的に説明されていないところがあります。特に数量化分析では少ないようです。多重共線性は多数の説明変数のなかで、ある特定の説明変数間に強い相関がある場合、解析結果が不安定になったり説明不能になる事です。例えば、競馬の場合、騎手と調教師の間に専属契約があり、調教師も騎手も複数の契約が出来ないとすると騎手と言う変数と調教師という変数が全く同一になってしまい、これら2つの変数を同時に設定することは無意味になります。こういう場合はどちらか一方を変数として使用しなければ良いわけですが、一般的なデータの場合は背景の理解が難しい事が多く曖昧です。ここで注意しなければならないのは専属契約と複数契約の禁止と言う二つの条件があるとして、この二つは数学的な処理では無いという事です。多変量解析における変数の設定は突き詰めれば非常に恣意的になっている事です。また、実際の競馬の場合、フリー契約や専属契約の縛りの方向などにより、騎手と調教師は二つの変数を取ることができ、さらに騎手x調教師と言うこれまた厄介な交互作用が存在します。

ところで、数量化では、実は多重共線は起こらないようです。逆行列が発散してしまう事は起こりますので、これを多重共線として扱えばそうでしょうが、発散が起こった場合の状況は一つしかありません。それはダミー変数が等価になった時生じます。ダミー変数が等価になるとは具体的に競馬ではどういう事かですが、父父馬と父馬が一致してしまう事です。さらに具体的に言いますとダンシングブレーブという有名な種牡馬がいます。この馬はマリー病と言う奇病に罹り、生産国イギリスでは種牡馬として見切られたが、JRAがリスクを被って購入し日本で種牡馬として供用され、産駒のコマンダーチーフやホワイトマズルなどが活躍して種牡馬として大成功を収め、生産国イギリスでは安易な日本への流出を問題視されたとか。現在、日本で活躍しているのはコマンダーチーフやホワイトマズルの産駒達で、ダンシングブレーヴから見れば孫馬になる訳です。今回、多重共線らしきもの現象の主役はこの3頭が務めます。

現在のランキング順位はこちら

| | コメント (0) | トラックバック (0)

2008年8月28日 (木)

記号の3連単 3連単1点で691,700円を的中出来る理由

     

2008年7月20日2回小倉2日2R3歳未勝利ダート1700m晴稍重で3連単7→4→8を1点目で的中、配当は実に691,700円に達しました。もし,間違えて1万円購入していれば4000万円以上になっている計算です。さらに、同日2回新潟2日10R火打山特別では82,120円の3連単13→6→15をやはり1点目で的中、直近では8月23日1回札幌3回3R新馬戦では6点目で100万馬券に今一歩の967,910円の3連単3→2→11を的中出来ました。その他配当は少し低くなりますが、14,700円と26,260円の3連単1点目的中がありました。詳しくは私のソフト(フリーソフト)を起動してみて下さい。

多分、競馬の常識では考えられない的中かと思います。偶然の出来事とすると3連単1点的中は約0.05%(14頭で考えると)しか起こりませんが全レース3連単が始まった前回288レースでは、私のソフトは都合4回的中しており,的中率は1.4%になっていました。この同じ期間では3連単1番人気的中は3回ありました。的中率こそ1%を超しましたが、的中時配当は的中時配当は720円、300円、1880円で回収率は10%そこそこでした。このように私のソフトは超高配当を的中する事に特化している感じを与えますが、96万馬券を的中した1回札幌3日11Rの日高特別では本命サイドの馬連2-3、,520円を3点目で的中するなど、本命サイドも的中します。

ところで、何故本命サイドと超大穴を同じ程度の点数(1点~6点)で的中できるのかですが、ロジックとしては勝つ理由あるいは負ける理由を探していないからです。言い方を替えると馬の真の能力を算出しているからです。私のロジックの中には本命馬も穴馬も存在しません。それと考え方としてオッズは馬の能力を反映した物であるが、オッズから馬の真の能力は推定出来ないとする因果の方向を仮定する事も重要ではないかと考えています。

現在のランキング順位はこちら

| | コメント (1) | トラックバック (3)

2008年8月 7日 (木)

記号の謎 Beyer Speed Figuresの謎 Part1

     

1992年、シカゴの街角で入手したのはDaily Racing Form 実にA3で88ページに及ぶ競馬専門紙でした。値段は内容に比してそれ程高くなく$2.85(日本の専門紙と同じくらい)でした。但し、紙質は悪いですね。この中で目を引いたのがExplanation of Beyer speed figuresでしたが、当時、彼の著書”Picking Winners"の翻訳が出ていたので、その内容について深くは吟味しませんでした。しかし、この1992年はBeyer speed figuresにとって特別な年である事を後年知ることになりました。即ち、この年1992年よりDaily Racing Form紙が全面的にBeyer speed figuresを取り入れ、以後一般化される最初の年だった訳です。

Beyer speed figuresは良く考えて見ると非常に謎めいた存在です。”Picking Winners"邦題”勝ち馬を探せ”を読んでも、特にその数学的なアプローチについてはどうも良く分からない所があります。今回取り上げる”Explanation of Beyer speed figures”を完訳と言うより私なりの超訳して、その謎あるいは疑問に切り込んで見たいと思います。本文に入る前に、最初の謎は何故”figure”なのかです。正確には複数形で”figures"ですね。RatingでもなくRatioでもなくPointでもなくIndexでも無い理由です。”figures”はKgとかKmとかの単位系を持つのか持たないのか?

”figures"の訳としては算出値、数値、合計値などが無難なところですが、ベイヤーが目指したものは単一な数字で競走馬のある時点で持つべき全ての能力を代表させ顕わす目的からすると秋葉のフィギュアあるいはスケートのフィギュアに近い概念ではと感じます。即ち、競走馬の一次元の数的フィギュア(一次元写像 One-Dimensional Mapsと英文ではなりますが、一般的には何の事やら分かりませんね)ではないかと思われます。従って訳としては”フィギュア”が適訳になるのかな。

ところで、試訳を試みる前に、ごく最近のBeyer speed figuresの評価はどうか、気になるところが有り、調べてみましたら、非常に興味深いブログに行き当たりました。ここ数年、欧米では全天候型人工走路の導入が急速に進んでおり、これがBeyer speed figuresに深刻なロジック上の混乱を引き起こしているようです。これは、これから述べる謎あるいは疑問に絡んでおり、これからの行方が興味を引きます。

| | コメント (3) | トラックバック (0)

2008年7月14日 (月)

記号のマトリックス  毛色マトリックスPart2

     

Sibaitemcategory200401n20082nd0715_ 左のグラフの様に、想定していた通りの結果が出ました。具体的には両親の毛色が違い且つ産駒も両親の毛色と違う,即ちバラバラ(000)の毛色が最も能力が高く、次は母馬とのみ一致する産駒(010)、3番目は父馬とのみ一致する産駒(100)、最も能力が低かったのは両親と産駒が同一毛色の場合(111)と両親が同一毛色で産駒が不一致(001)であった。

何れにしましても000の場合はアウトブリードの確率が高く、001及び111の場合はインブリードの確率が高いと思われますので、今回の結果は交配の常識的な事象を確認しただけかもしれません。但し、注意して頂きたいのは毛色マトリックスの影響の絶対値は非常に低く、せいぜい予想順位を1つ上げるか下げるか位です。

なお、芝コースの計算に用いた延べ頭数は101816走で、000は20%、001は14%、010は26%、100は21%、111は19%でした。

| | コメント (0) | トラックバック (0)

2008年7月11日 (金)

記号のマトリックス  毛色マトリックス

     

028_2 現在新しいモデルを色々試していますが、今ひとつ上手くいきません。特に父父馬を導入してから、父馬(種牡馬)と共線を起こしているようで、最適値に落ちないのではと考えています。元々父父馬と父馬は同じような情報となっています。例えばダンシングブレーブ(Dancing Brave)はホワイトマズルとコマンダーチフの父馬になりますが、2004年以降現役で走っているダンシングブレーブ(Dancing Brave)の孫馬は前述の2頭の産駒しかいません。従って、父父馬のダンシングブレーブは父馬のホワイトマズル+コマンダーチーフと等価になってしまい数量化演算が成立しません。そこで、今試しているのは、常識的には重要であると思われている種牡馬(父馬)を使わないモデルです。父馬と父父馬の持っている情報量はやはり父馬の方が高いと思われますが、モデルでカバーできる範囲が父父馬では70%近くまで行けますが、父馬では20%にも届きません。そこで今回は父馬を使わず。父父馬のモデルにトライしている訳です。

ところで、一つ空いた因子に有り当てたのが表題の毛色マトリックスです。遺伝形質には2種類有ります。一つは毛色のような質的形質で一つの遺伝子情報によって決まる物です。他の一つは量的形質と言われる物で多数の遺伝子情報によって決まります。後者の例には競走馬の走る能力などがあるわけですが、遺伝子情報の在り様は質的形質と量的形質に差がある訳では有りません。もし、質的形質である毛色の遺伝子情報の近くに走る能力を決める遺伝情報があれば毛色の発現と馬の走る能力に何らかの関係があるのではと考える事もできます。

そこで、過去毛色を直接因子に組み込んでみましたが、思うような数値が出てきませんでした。ならばとして考えたのが産駒の毛色と両親の毛色の一致度です。具体的には母馬と一致するかしないかと父馬に一致するかどうかを組み合わせてみました。00は母馬とも父馬とも一致しない。10は父馬と一致するが母馬とは一致しない。01は逆に母馬とは一致するが父馬とは一致しない。11は両親も産駒も同じ毛色の4つになります。結果まだです。遺伝学的には11が最も低いと予想されますが、どうでしょうか。

| | コメント (3) | トラックバック (0)

2008年6月27日 (金)

記号の着差 タイム差0.0秒にドラマがある!

     

_13596_image108_2 競馬のタイム表記の最小値は日本では0.1秒、米国では0.2秒です。タイム理論的には0.1秒以下を論じる無意味であると考えられますが、実は、そうでは無いようです。左の棒グラフは前走における1着馬とのタイム差の影響を見たものです。+0.0はハナ差、アタマ差、クビ差で負けた場合を、-0.0はハナ差、アタマ差、クビ差で1着になった事をあらわしています。物理量的表現では等価である0.0秒差ですが、勝った(-マイナス)場合と負けた(+プラス)場合で大きく違います。私の現在の理解では騎手の心理に原因があるとしています。即ち、僅差(0.0.秒)での負けは騎手の悔しさを刺激していると考えています。ある程度以上差のある勝ち負けは馬の能力差として受け入れる事が出来るが、僅差の勝ち負けは騎手の技量の差であるとの認識が存在するのではと考えています。

ところで、競馬には着差データが存在しています。着差(競馬)-Wikipediaで詳しく解説されていますが、予想因子としても使えるのではと考えています。即ち、0.0秒差をさらに詳しく分析できるのではと。しかしながら、競馬データに盲点が有りました。着差の定義は”前馬”との着差であるとされています。従って、1着になった馬には着差データは同着(降着はあるか不明)以外は有りません。でも良く考えて見ると1着馬に着差データが存在しても良いのではないかと、1着馬の着差は2着馬に着けた着差、2着馬の着差データをコピーすれば良い事になるでは無いか。そんな事で実際にプログラム組んで始めました。ロジック的には簡単ですが実装すると時間がかなり掛かります。

最後まで実装できたかと思い、今週の馬の過去走を参照したら、1着馬の着差データが殆ど歯抜け状態、考えて見たら今週のデータのみからは過去走の1着馬の着差は構築できませんね。数量化用のデータは先ずフルセットアップから入ります。馬毎データでは140万レーコード以上有りますが、この中から2000年以後に実走データのある馬コードを引き抜きます。大体4万数千頭になります。この中で一番古いものは1994年あたりが初出走になりますが、実際に数量化に利用するのは2004年以後のデータです。今週の馬の過去走1着着差を完全に近づけるには4万数千頭の2着データを保持する必要が有る訳ですね。。。。

| | コメント (3) | トラックバック (0)

2008年6月 4日 (水)

記号の劣化 競馬予想は進歩していたのか?

     

_7910_image001 今年2008年のダービーの馬連も万馬券になりましたが、最近万馬券の発生件数が多くなったようです。昔に比べれば3連複、3連単など券種が増えたので、万馬券の絶対数が増えるのは当然なのですが、券種を馬連あるいは枠連に限定しても増えているのではと思い、ここ十数年の万馬券数を調べたのが左のグラフです。

グラフを見て驚いたのは増えている事実でした。中央競馬の年間レース数は288日に12レースかけた3456レースを基準にして台風や雪などで中止される数レースから十数レースを引いたレース数で略一定しています。2000年以前は馬連で350本程度だったのが近年では400本を越していますし、枠連でも70本程度から100本程度まで増加しています。

この増えている原因をどう捉えるかです。近年インターネットの進歩普及により競馬情報は溢れていますし、予想技術も飛躍的進化を遂げたとする論調が支配的ですが、そうであるならば、馬連・枠連万馬券は減少してもいい筈なのに何故?本当は総体としての競馬予想力は劣化しているのでは?。

予想力が劣化しているかどうか別として、ここ十数年で確実に起こった事は”競争原理”の導入でしょう。有力地方騎手の中央への移籍、昇級ルールの見直しによる弱い馬の排除、メリット制導入による厩舎の選別等など、これらにより生じるのは同一レースに参加する総体としての馬の能力(単に馬の能力だけでなく騎手、調教師、生産牧場などの能力を含めて)の均等化が起こり、結果として偶然性により強く支配され万馬券の出現が多くなったのではと考えています。均等化はレース内での事で、騎手、調教師、生産牧場間の能力は近年ますます拡大して二極化していると感じています。

もう一つの万馬券の多発の原因かも知れないのは、3連複特に3連単へのシフトで馬連・枠連市場が急速に縮小した事ですね。大きな市場と小さい市場では効率化の程度に差があるとおもわれますので、この影響かも知れません。

| | コメント (5) | トラックバック (0)

2008年4月14日 (月)

記号のXP  WindowsXP SP3残酷物語

     

021_2 現在私の使っているPCは3台、OSはVista、Windows2000とXPです。VB6の開発環境は無事にVistaに移行でき、管理者権限とも折り合いが付き、今のところ快適です。ところで先日、VistaのSP1が公開されましたので、SP1にアップデイトを試み上手く行きましたので、動作が不安定なXPもSP3にアップデイトと試みたのです。キャンディデイトと言うのが、即ち候補版と言うのが引っかかったが、強引にインストールしてしまいました。そして起動させたところ、STOP C0000139のブルースクリーン、何度再起動させても同じC0000139でストップ、観念して近くの持ち込み修理へ、しかし、そこでの回答はC0000139はSP3が原因であり、リカバリーするかSP3をアンインストールしてSP2に戻すか選択する事になり、一応まずSP3のアンインストールを選択して家に持ち帰る事にしました。

家に持ち帰り、修理チェックで頂いた情報を元にSP3をアンイストールしようと思い、確認の為google検索したところ、まずXP-SP2の起動ディスクが必要との事、しかし、ホワイトボックスPCには起動ディスクは元々ついていなかったのを思い出し起動ディスクの作成方法をgoogleで検索しましたところ”Windows XP のインストール用起動ディスクを入手する方法”が見つかり、これは簡単と思ったところ良く読むとフロッピーディスクが6枚必要とのこと、今時1.44MBのFD等手持ちが無くCD-R(W)に焼く事は出来ないかと、さらにgoogleを検索、すると”CDブートの回復コンソールディスクを作る”が見つかりその指示どおりにVisata上で作業してbootdisk.isoを作成、作成途中で引っかかりそうなのはwin51ipをリネイムしてwin51ip.sp2を作るところが少しトリッキーかなと思います。最後に躓いたのはCD-R(W)に焼きこむソフトです。どうも単純にCDにコピーすれば良いと考えていたのですが、やはり手順がありました。ISOファイルを焼きこむにはと、googleで検索すると”「CD manipurator」を使ったISOイメージファイルの書き込み方法”が出てきて別のDLしたCDmanipuratorを起動させCD-Rに焼きこみました。ただ実際に焼きこんだのはDVD-R(W)でしたが問題なく回復コンソールが起動しました。

さらに最後の回復コンソールで分からなかったのはSP3のアンインストールの方法でした。RでC:WNINDOWS>までは行き着いたのですが、その後がよく分からず、またまたgoogleで検索すると”Windows XP SP2 を回復コンソールからアンインストールする方法”が見つかりそのとおりするとSP3が削除され再起動で見事SP2が立ち上がりました。あとはコントロールパネルでSP3を削除して完了しました。ただ、元々の動作不良は解決せず、これで修理に出せる状態に戻っただけです。原因はどうも物理メモリの欠陥のようですが、手持ちのmemtest34aでは異常を検出できず、まだ断定できません。3Dベンチのように負荷の大きそうなソフトでは落ちませんが、何故か私の自作VB6ソフトは相性が悪く70%くらいの確率で落ちます。

後日談として、結局メモリーに加えてMBにも不具合があり、自力で修理しようと思ったのですが。しかし、昨今は自作系あるいはホワイトボックスは下火になっているようです。価格的にはDELL、e-machine等の完成品の安くなっているようです。自作は経済的な事より趣味の世界になったようですね。考えて見れば当然の傾向ですね。それにしても国内のメーカー品はどうなっていくのでしょうか。

さらに、後日談MBもダメなら、新しくWindowsXP専用のPCの購入を考えたのですが、壊れたマイクロATXに刺さっているメモリーを思い出し、メモリーを差し替えてみました。古いメモリーはサムスン製で512MBしか有りませんが、今のところ、遅いところを除けば、相性の悪かった私の自作ソフトも問題なく動き、その他のソフトも動きます。何故なんだろう?

さらに、さらに、自作のソフトとNEXTなど4本のソフトを同時起動させたら、とうとう落ちました。落ちたと言っても、ブルースクリーンでは無く、フリーズしてしまいました。従って、ひょっとしたら仮想メモリーが少ないと思いタスクマネジャーを起動させ確かめたら、物理メモリは確かに512MBになっているがコミットチャージの制限値は490MBにしかなっておらず。仮想メモリーを操作して制限値を1GBにしたところ、自作ソフトと標準的な競馬ソフトさらに3Dベンチを同時に稼動しても落ちません。利用可能物理メモリーは現在32KBで動いています。

Ver2 5月7日 Microsoft UpdateよりSP3へのアップデイトにとうとう成功しました。現在順調に動いています。C0000139の原因については定かではありませんが、GDI32.DLLのバージョンとか?何れにしましても、無事インストールできた訳ですので、これからメモリーのチェックをしようかと思います。現在DDR PC2100(多分)の215MBの2本指しですが、問題を起こしたメモリ-はDDRPC3200512MB4本の内多分1本か2本と推定しています。

| | コメント (5) | トラックバック (0)

2008年4月 6日 (日)

記号の感情 行動馬券学?

     

025 最近と言うより昔から存在していたようですが、経済は感情で動くと言う”行動ファイナンス理論”が再注目されています。経済理論は”効率的市場仮説”に代表されるように”人”は常に合理的判断の元に経済活動を行っているとしていました。しかし、実際にはノーベル経済学賞受けた人物がチームの一員であったLTCM(Long Term Capital Management)の破綻に代表されるように現実社会では理論通りには行きません。即ち、経済が何故理論通りに動かないかを理論的に考察したのが行動ファイナンス理論になる訳ですが、皮肉な事にこちらも2002年にノーベル経済学賞を受賞しています。

そこで、競馬予想にも行動ファイナンス理論的なものを導入できないか考えました。即ち、感情や非合理的判断を予想に使えないかをです。結果2つほど現在使っています。一つ目は僅差で負けた騎手は次走では頑張るのでは?、2つ目は血統に目がくらんだ競馬関係者(おもに馬主)は能力の低い当歳馬を高額で購入しているのでは?と言う物です。

| | コメント (0) | トラックバック (0)

2008年2月21日 (木)

記号の市場 市場取引価格の怪

     

_14131_image106 市場取引価格のデータが公開されてから暫く経ちますが、市場取引価格の意義について解説した物は余り見かけません。市場取引価格は単純で子馬(当歳、1歳、2歳)の値段です。ここまでは分かりますが、知りたいのは値段が競走馬の能力に見合ったものであるかないかです。

結果は左上のグラフの様に、一寸不思議な物でした。当歳では1億円以上の馬の能力が数百万の馬より劣っていました。1歳では価格に見合った能力を示しているようです。2歳では数百万の馬も数千万の馬も同じような能力でした。なお、この傾向はダートでも略同じでした。

| | コメント (2) | トラックバック (0)

記号の土日 芝コースの土日の内枠外枠

     

過去、土日で的中状況が激変する事を何度も経験してきましたが、なかなか原因が特定できずにいました。と言うより薄々土曜日の芝の内枠は早い即ち有利ではないかと言う思いはあったのですが、これを数的に処理するモデルが中々良い物が思いつかず今まで本格的には手を付けていませんでした。競馬予想の経験が長い方は、例えば芝コースであれば馬場悪化はタイムが悪くなると言う経験則は持っている筈です。まあ、競馬の常識ですね。でもこの悪化を具体的に科学的な数値として捉えている方は皆無かと思います。さらに微妙な土日の内外の有利不利は、存在すると認識される方は多いと思いますが、科学的に正確な数値として捉える事は不可能ではないかと思われていました。

結果は左上のグラフの様に芝コースでは土曜の内枠(4枠あたりまで)有利と8枠不利が浮かび上がってきました。日曜日は余り有利不利は見られませんが強いていえば中間枠が有利なる傾向が見られます。ダートコースについては明確な傾向は見られませんでした。

| | コメント (1) | トラックバック (0)

2008年1月 6日 (日)

記号の深層 騎手の深層心理?パート2

     

騎手の深層心理?に迫ってみました。では、騎手は余り人気を気にしない傾向が見られるとしましたが、考えてみれば当然ですが、騎乗馬のレースでの調子を一番知る立場にあるのが騎手ですので人気にかかわらず出来には納得しているのではないかと推察されます。ところが、ハナ差、頭差での勝ち負けは騎手の心理に大きく係わっているようです。ハナ差、頭差はタイム的には同タイムになってしまいタイム指数理論的には手におえませんが、数量化理論では追求出来ます。

_17352_image103 左の棒グラフは1着馬とのタイム差(当該馬が1着の場合は2着とのタイム差)の次走への影響を見た物です。ハナ差、頭差はタイム差は00になりますが、勝った場合-00となり、負けた場合+00となります。グラフから読み取る事が出来る現象はタイム差00で負けた馬(+00)の次走は、タイム差00で勝った馬(-00)の次走の速度より0.2Km/hr程速くなります。1000mの芝では1馬身強の差なります。サンプル数は十分大きいので確かな事象と考えられます。さらに、この傾向はタイム0.5秒(+05)まで続きますのでより確かな現象と考えられます。騎手にとっては僅差の勝ち負けは技量に直結したところがあり勝ち負けに拘るものと推察します。

| | コメント (3) | トラックバック (0)

記号の深層 騎手の深層心理?に迫ってみました。

     

今回は騎手の深層心理?に迫ってみたいと思います。予想が外れた場合に騎手の不手際のせいにする事があると思います。しかしながら本当のところはどうなのでしょうか? 騎手は人気をどのように捉えているのか、人気を裏切った騎手はその事を負い目に感じているのか等を考察してみました。最初に考えたのが人気馬に騎乗して惨敗した騎手は、次回その馬で汚名を濯ぐべく頑張る筈であり、逆に不人気馬に騎乗して勝ってしまった場合、その馬に続けて騎乗する時に気が緩むのではないかと言う事でした。

_14669_image101 でも実際のところは、この仮説は違うようです。左の棒グラフは前走人気着順が今走の速度にどのように影響するか調べたものです。単純に人気と着順を組み合わせたものを予想因子にすれば良いようですが、人気にしてしまうとオッズ1.0倍のダントツの1番人気もオッズ3~4倍のそこそこの1番人気も同列に扱う事になり、少々不合理なので人気の代わりにオッズの逆数の100倍して支持率に近似させたもの(1=1%以下から8=80%)を使用しました。結果の着順に関しては1着を1、2~4着2、5着以下を3として3分類を用いました。具体的には11は支持率1%以下で1着、83は支持率80%で5着以下を意味します。数量化の結果は強い馬がやはり次走も速いと言う常識的な結果で、とくに騎手の心理を反映した物ではないようです。即ち、勝利騎手インタビューなどのコメントとは裏腹に騎手は人気のプレッシャーを感じていないようです。

| | コメント (0) | トラックバック (0)

2008年1月 4日 (金)

記号の脂肪 競走馬の体脂肪率を調べていたら。。。パート2

     

_21346_image097 競走馬の体脂肪率を調べていたら。。。からするとウオッカとかダイワスカーレットの大活躍が説明出来ないのではと思われます。しかし、左の雌雄馬の成長曲線を見てください。月齢にして36ヶ月までは雌馬の基本能力は雄馬を上回っています。

_21346_image099 基本的には雌馬の方が早熟と言えます。グラフの起点である27ヶ月、即ち2歳と3ヶ月の時点以降で時速として少なくとも約0.25Km/hr程雌馬が勝っています。即ち1000m(芝)地点で約1.7馬身程雌馬が雄馬に対して先行している訳です。ただし、雌馬は雄馬に比べて成長余力が無いようです。

| | コメント (0) | トラックバック (0)

2008年1月 3日 (木)

記号の脂肪 競走馬の体脂肪率を調べていたら。。。

     

久しぶりの書き込みになりますね。ところで、競走馬の体脂肪率を調べていましたら、非常に興味深い資料に突き当たりました。それは日高育成牧場の馬体重に関するレポート中で”生まれ月”により”総獲得本賞金”が違うと言う物でした。具体的には生まれた月が遅くなるほど総獲得本賞金が高くなる事です。言い換えると1月生まれの馬より5月生まれの馬の方が能力が高い事になります。考えてみると一寸不思議な事象です。

_17570_image091 そこで私の数量化分析の結果を見ると左のグラフのように1月から6月まで綺麗な右肩上がり(遅い月生まれの方が速度が大きい)になっておりレポートと同じ傾向を示していました。

_17570_image093_3 さらに驚くのは雄馬と雌馬の馬体重の変化に関する記述です。レポートの中では雌雄ともに2歳時から月を追う毎に馬体重は増加しますが、体脂肪率から見ると雌馬の増体重は主に脂肪によるもので筋量(正確には除脂肪体重)の増加による物では無いとしています。

_17570_image095_4 その事を踏まえて左の二つの数量化分析の結果グラフを見ていただくと解かると思いますが、雄馬は馬体重が重くなるほど速度が大きくなる傾向が見えるのに雌馬では見られない事です。

| | コメント (0) | トラックバック (0)

2007年11月 1日 (木)

記号の天気  天気予報と競馬予想

     

天気予報に用いられる数値予報のロジックが競馬予想のロジックに援用できると考える方は非常に少ないようですね。競馬は基本的にエンターテイメントであり、100人いれば100通りの予想が正当化される世界です。即ち、ギャンブルとしての透明性、公平性が損なわれない限り何でもありです。競馬を仕組む事は違法ですが、競馬が仕組まれていると考え予想を行うのは何の問題もありません。先に書きましたように何でも有りのエンターテイメント、即ち娯楽であるからです。

一方天気予報はどうでしょうか、確かに最近の天気予報番組はエンターテイメント化されていますが、テレビ会社が100社あれば100通りの天気予報が正当化されている訳では有りません。明日の天気が雲一つ無い晴天から台風並の暴風雨まで認められてしまったら、大変な事になります。ある場所の明日のある時点での天気予報は一通りである事が、求められる最終的な予報となるのは明らかです。この観点から気象庁が国民の税金を使い高額なスーパーコンピュータを購入して使用できる所以である訳です。

スーパーコンピュータの予測は、まず外れない事が要請される訳ですが、外れるのを恐れて競馬で言うところの展開予想の様に何通りの予報を出されても困りますね。ただ、確率予報と言うのも曲者です。降水確率30%を考えてみると残りの70%は何かとなりが、多分曇りか晴れで35%、35%とすれば、明日の天気は晴れか曇りか雨となり、天気に晴・曇・雨しか分類が無ければ必ず的中している事になります。何か変ですね、この場合、正確な予報は”明日の天気は分かりません”ですね。でも、こんな予報を何度も出したら天気予報にスーパーコンピュータを使用する事の正当性が疑われてしまいます。だから確率なのかも知れません。

ところで、天気と競馬には共通点が有ります。競馬の決着は基本的(同着は有りますが写真判定の分解能の限界から生じているだけです)には一通りしかありません。一方、天気ですが、ある地点のある時点においての天気は当然の事ですが一通りです。即ち、起こり得る事は沢山有りますが、実際に起こる事は一通りでしか無い訳です。即ち、一通りである事が競馬と天気の共通点です。

ここから、最初に書きました事とは違った展開となります。競馬はエンターテイメント、それもギャンブルと言う人間であれば多分に持ち合わせているであろう射幸心を刺激する強力な娯楽である訳ですが、しかしながら、競馬はエンターテイメントである前に天気と同じく自然現象である事も事実です。自然現象の自然とは何かですが、常識的には自然とは人為ではない物、人が係わった事は自然でないと言うのが自然な考え方です。しかし、人も自然の一部であり、人が馬を使う競馬も広く考えれば自然現象と言えなくはないでしょうか。

競馬も自然現象であれば、天気と同じく科学的分析対象となり、数値解析の対象となり得る訳です。即ち、理論的にアプローチできる100人が居れば、その予想は一通りに収束してくる訳です。

| | コメント (0) | トラックバック (1)

2007年10月23日 (火)

記号の仮想  Windows Vistaの仮想化とは

     

私が使用してきたwindows2000並びにwindowsXPは既に購入してから5年から7年近く略連続使用を行っていますので、各部品が大分ヘタッテ来ているようです。2台とも面白い事に使用1年弱でマザーボードが壊れてしまい保証期間中でしたのでMBを全交換しています。また2台ともHDを換装してOSを再インストールして今日に至っています。Windows2000に至っては電源ファン、CPUクーラーも怪しくなり、PCケースを外し、外側からターボファンで冷却しています。Windows2000はアスロン2400+ですが一時80℃まで上昇していたCPU温度は今は54℃まで下がり、現在は一応安定して連続稼動しています。しかし、何れにしても危うい状態であるのも事実なので、後継のPCを購入する決心をして選んだのがGateWayのAthlon64x2 6000+ Windows Vista home premiumのプリインストール(OEM)でハードに5年間の保証を付けました。ホワイトボックスからメーカー品への回帰ですが要らないソフトが沢山ついてくる日本のメーカー品は止めました。

ところで、仮想化の問題ですが、VB6の開発環境としてはハード的に不安のあるwin2000、XPを諦め少なくともハードとしてメーカー保証があるvistaマシン(gateway)に乗り換えた訳です。最初は順調に動いたvistaのvb6開発環境でしたが、ある日突然コードが読めなくなってしまいました(ファイルが見つかりません)。色々サイトを調べたところ管理者権限による仮想化が原因らしい事が分かり、プログラムコードがとんでもないところへ飛ばされていました。仮想化の概念は何となく分かるのですが、実際に遭遇して見るとvista初心者にとってはなんとも腹立たしい現象です。win2000、XPではコンパイルするとProgram Filesにexeが出来るのですが、vistaではユーザー名のフォルダに飛ばされ何となく変だなと感じていましたが、プログラムコードも飛ばされるとは思っておらず。慌てました。一応プログラムコードの保存フォルダをユーザー名フォルダにして何となく収まっていますが、正しい対処方法が分からず戸惑っているのが現状です。

| | コメント (0) | トラックバック (0)

2007年9月13日 (木)

記号の破壊  オブジェクト指向?

     

Hrptv5c0_2 やっと涼しくなって来ましたね。私自身少々夏ばて気味ですが、開発用に使用してきたPCの調子もおかしくなり、この半月ほどはその手当てで時間を食ってしまい。ソフト開発は遅れてます。

今回の開発用PC(XPPen4)のトラブルは原因が判らず困りました。最後はハード(多分HD)もおかしくなり、HDを新しく購入してOS(XP)を再インストールしてもらいました。そこで問題は解消するかと思ったのですが、まだ”問題が発生しました。。。。。”が出現してVBがとまるので、ハードとソフトの問題を切り分ける為と将来の開発環境という事でVista(アスロン64x2)を購入してVB6(2008年4月までサポート)の開発環境を構築しています。将来的にはVB2005となるとはおもいますが、当面はVB6で行いたいと考えています。

問題が発生したPCの原因の切り分けですが、当初ハードの故障かと思っていたのですが、Windows インストーラを弄り始めた時点から変になったようですので、どうも同じオブジェクトを頻回に使用して、メモリーを完全に解放しないで、使い続けるとメモリーリークを起こして”問題が発生しました。。。。。”でVBが停止するようです。従いまして、毎回新しいオブジェクトを作り破壊する方法に切り替えたところ、上手く動き出しました。また、VistaでのVB6の開発環境はフルセットアップソフトも含め順調に動きはじめました。これでWIN2000、XP、Vistaと3代のOSを使うようになったのですが、皮肉にももっとも古いWIN2000(SP4)がもっとも信頼できるようです。

オブジェクトの問題であるとヒントを与えてくれたのは、馬吉のソースでした。多分分割してコーディングを行う為、オブジェクトを完全に破壊するするようにしないとデバッグが効率的に出来ないのではと感じています。今回、公開しているソフトでは明示的なメモリー解放を行っていませんので、ひょっとしてトラブルを起こすかもしれません。また、Visual Studio Installerはどうもレジストリーを書き換えるみたいで、少し心配です。現在はEXEpressのイントーラが使われているようですが、まだ今ひとつ使い方が分かりません。プロのプログラマーではない私には公開用ソフトの開発は非常に難しいです。

ところで肝心のソフトの予想成績ですが、馬インフルエンザ後の成績は本線6点馬連で的中率33%以上、回収率100%以上を達成しています。開発用のPC(XPとVista)が順調に稼動すればロジックをもう一段精緻化して一応必勝状況に突入できるのではと感じています。ただ、競馬ファンが期待しているものとは微妙に違うかもしれませんが。

| | コメント (0) | トラックバック (1)

2007年8月23日 (木)

記号の再開  馬インフルエンザ

     

三十数年ぶりの馬インフルエンザとは驚きました。インフルエンザと言えば鳥インフルエンザ、古くはスペイン風邪などのイメージが有り、大変な出来事のような風評が有りますが、コントロールされたインフルエンザは決められた手順を守っていれば、それ程の事では有りません。今回の出来事はJRAが見識を有するのか”ただの無作為”なのか見極めるには良い試験紙でした。例えばディープインパクトの薬物事件の原因は帯同日本人獣医師の無作為であったと感じていますが、JRAが唯一日本で罰の対象としたのはこの獣医師であったのにはJRAの見識を感じます。

今回の馬インフルエンザについては2007年8月18日19日の中止はJRAの無作為を感じましたが、25日よりの再開は見識在る行為であると思います。本当の正解は18日19日も粛々と開催を継続する事だったような気がします。

| | コメント (0) | トラックバック (3)

2007年7月20日 (金)

記号の残差  真の競走馬の能力とは?

     

_9286_image088 道悪適性が無いので凡走した。あるいは道悪適性が有るので好走した。血統から距離適性への言及など、競馬解説は一見明快のようです。従って、そのような解説ができる競馬予想家は前提として言及した競走馬の真の能力を理解している事になります。そうであれば言及した競走馬が出走するレースは略100%的中して、必ず100%以上の回収率を示す筈ですが、現実にはそのような事は起きないようです。真の競走馬の能力を見極めるのはやはり非常に難しい事のようです。

ところで、速度理論と数量化分析では真の競走馬の能力をどのように定義しているかですが、左上の概念図に注目して下さい。まず、能力とは速度であると仮定します。芝であれば約10,000パラメータを調整してディープインパクト型の能力を求めます。ここで重要なのは求められるのはディープインパクトそのものでは無くディープインパクトを含めたディープインパクト型の能力である事です。この型であることが過去走のデータが無い新馬でも予想できる事に繋がる訳です。

それでは、ディープインパクトの真の能力とはなにかですが、それは”残差平均”です。即ち真のディープインパクトの最適推定値=Σ(ディープインパクト過去走-ディープインパクト型)/過去走数で求める訳です。つまり、ブラックタイドの最適推定値=Σ(ブラックタイド過去走-ディープインパクト型)/過去走数として全兄であるブラックタイドと差別化する訳です。

理屈としては道悪だけの残差平均や近走(過去2,3走)の残差平均も求まる訳ですが、何故か的中パフォーマンスが悪くなります。過去走を出来るだけ多く取った方が精度が良いようです。過去走は当然標準馬が受ける道悪補正は行っています。道悪で起こる事は偶然による不確実な出来事として速度理論と数量化分析では処理しており最適推定値は天候晴,馬場状態良で得られるものとしています。

| | コメント (1) | トラックバック (1)

2007年7月11日 (水)

記号の騎手 ダートコースにおける各騎手の経年能力変化

     

コース取りの不利、道中両側を塞がれた、折り合いが着けられず、前半ハイペースになり最後ばてた、出遅れ等等。これらは敗因としてよく語られるます。また、競走馬が第一人称になることが多いですが、本当でしょうか?競走馬は位置取りあるいはコースの内外を考えて走るのでしょうか?馬は動物としては頭が良い方であることは確かですが、レースで起こる事を戦術あるいは戦略的に競走馬自身が考えて走っているとは思えません。レースでの出来事の大部分は馬の操縦者である騎手の特性によると考える方が合理的,論理的ではないでしょうか。そんな事を考慮に入れていただき,下のダートコースにおける各騎手の上がり速度、ペース速度を眺めて見れば面白いアイデアが浮かぶかも知れません。

「dirtjockyspeed.xls」をダウンロード

| | コメント (0) | トラックバック (0)

2007年7月 9日 (月)

記号の騎手 芝コースにおける各騎手の経年能力変化

     

今年は騎手のパワーバランスに大きな変化が起きたとされます。即ち、武豊騎手の能力の絶対値と相対値の変化です。下のエクセルファイルは2004年前半~2007年前半までの芝コースで出走した全ての騎手の年毎の影響速度(Km/hr)です。考え方としては影響速度が大きい程、技量・能力・実力が上と考えて下さい。最終的な能力値は走破速度に対する影響速度で比較して頂くのが、妥当です。上がり速度とペース速度は騎手個々人の脚質を現しています。実は脚質は競走馬では無く騎手が持っています。

エクセルの簡単なでも無いかも知れない活用法を紹介します。今ここにA,B2頭の競走馬がいるとします。さらにA,Bともに2000mを2分で走りきる能力(60km/hr)を持っているとします。ここでA馬には2007年の武豊騎手が騎乗しますと走破影響速度が0.091Km/hrですので、A馬の速度は60.091Km/hrとなります。B馬には2007年の岩田康誠騎手が騎乗するとしますと走破影響速度が0.111km/hrですので、B馬の速度は60.111km/hrとなります。従って2000mのタイムはA馬が1分59秒82、B馬が1分59秒78となります。即ち、岩田康誠騎手が騎乗するB馬の方が0.04秒ほど先着します。具体的には”頭”差程度先着する事になります。

「turfjockyspeed.xls」をダウンロード

| | コメント (0) | トラックバック (0)

2007年6月27日 (水)

記号の別人  武豊騎手は武豊騎手ではない?

     

表題は禅問答のようですが、理屈と言うか仮説なのか別として、2006年の武豊騎手と2007年の武豊騎手を別人として数的扱っていると言う意味です。実際に導出された影響速度は、下のグラフの如く、正しく別人のような違いを見せています。しかし、データとしては非常に綺麗で、また、表出した成績とも良く整合していると言えると思います。ただ、現実の競馬に適用して有効なのかどうか難しいところです。Over-fitingの気配もあり今しばらく見守る必要が有りそうです。

_27190_image001_1 

| | コメント (0) | トラックバック (3)

2007年6月21日 (木)

記号の下落  やはり武豊騎手の能力は落ちていた

     

116 前の記事で、3年間と言う比較的長い期間で騎手の能力は変わらないとする仮説が微妙である事に触れましたが、武豊騎手の今年(2007年)はやはり特別な節目の年のようです。現在検討中のモデルでは、下のグラフのように2006年までの約3年間は走破速度に対する影響度は02Km/hrより少し上で安定(一般的な仮説として3年間一定は妥当とも言えます)していましたが、2007年前半では0.08Km/hrまで低下しています。

さらに、上がり(ゴール前3F)速度をみますと、2004年後半をピークに徐々に低下してきています。これはディープインパクトの存在を考えるとやや不思議な事です。2004年から2006年に掛けてはディープインパクトの成長に合わせて、特に上がり速度上昇しても良い訳ですが、逆に低下していますので、この数値は武豊騎手自身の力の低下と考えるのが至当と思われます。

今年(2007年)の状況をグラフから読み取ると”後ろに控えて差し切れない”状態が続いているようです。別の感想としては思いのほか綺麗なと言うか理屈を立て易いデータが得られたのには驚きました。しかし、実際のレースを予想してみると意外とダメな事も有りますので、難しい物です。

さらに下のグラフは最近活躍が目立つ若手の松岡正海騎手の足かけ4年のデータです。最終的なパフォーマンスの指標である走破速度に対する影響速度は武豊騎手の0.08Km/hrを越して0.12Km/hrを示しており、2007年前半時点では武豊騎手の技量を上回っています。ただ、2004年後半から絶対値としての松岡正海騎手の影響速度は殆ど動いていません。従って、大筋としては騎手の能力は3年間位は安定していると言う仮説は採れると考えています。短いスパンで、サンプル数を少なくしてして解析した場合、オーバーフィッティング(過剰適合)の危険性も有り、悩ましいところです。

_6220_image001

_27528_image001

| | コメント (3) | トラックバック (0)

2007年6月18日 (月)

記号の岩田 陰謀説はさておき

     

124 陰謀説はさておき、前記事の検定は有る意味正しく無いと言えます。統計学は往々にして難しい言葉を使い、もっともらしい体裁を装いますが、よく考えてみるとおかしな事が多いのも事実です。武豊騎手の成績が去年より低下している事は明白ですが、成績の低下が武豊騎手自身の馬を速く走らせる能力の低下によるものとは決して言えません。即ち、エージェントのせいかどうかは別として、騎乗している今年の馬の能力が全体的に低い事により低下したとも十分考えられます。競馬を予想する観点から考えると騎手の能力と競走馬の能力を切り分ける事が重要です。従って、検証対象とした勝率は予想には殆ど役に立たないと言えます。

*勝率に関するリンク

阪神タイガースは何故優勝したか薬物のお話(背景の同一性確保)、お医者さんと患者さんを盲目にする千兆分の一一兆円の無駄使い競馬予想に勝率・連対率は役に立たないなど参照頂ければと思います。

ところで、騎手の能力と競走馬の能力を切り分けて評価する事は簡単そうで実は非常に難しい事です。過去色々調べて見ましたが、理論的なレベルで納得できるものは有りませんでした。そこで速度(km/hr)を能力値として目的関数にすれば、騎手と競走馬の能力を切り分けられるとして考えたのが速度理論でした。そして、その数的解析手段として使用したのが数量化1類と言う多変量解析手法です。数量化1類では、その特性から騎手の能力のみを取り出す事ができます。即ち、各騎手が騎乗している競走馬の能力は同一(別の言い方すれば消されている→仮想的な幻の標準馬を想定する)とされますので、純粋に騎手の技量(どれだけ速く馬を走らさせるか)を比較できる事になります。

下のグラフは、そのようにして4人の騎手の走破速度(全距離-例えば芝1600m-を走破した場合の速度)への影響速度を調べたものです。色違いの2つの棒グラフは共に3年間のデータを使用したものですが、採録期間を約半年ずらしています。即ち、右側は今年(2007年)の1月より5月を含まない3年分のデータを、左側は武豊騎手の不調が話題になった今年(2007年)の5月までを含む3年分のデータを使用しています。

結果は武豊騎手自身の能力の低下は余り見られず。特にライバル視されている岩田康誠騎手との技量の差には殆ど変化は見られません。しかし、安藤勝巳騎手に対しては影響速度の大きさが逆転しましたので、その意味では武豊騎手自身の不調があるのかも知れません。さらに、この分析の問題点としては3年と言う比較的長いスパンで騎手の能力は一定であるとの仮説を採用しています。従って、もう少し短いスパン(例えば年度毎-但し算出した影響速度の信頼度が低下するリスクが有ります)にすれば、もう少し違った結果がでるかも知れません。これからの課題として追求してみたいと思います。

_30673_image001

_22126_image001

| | コメント (0) | トラックバック (0)

記号の武豊 武豊騎手は本当に良い馬ばかりに乗っていたのか?

     

126 今年(2007年)になって武豊騎手と他の騎手との力関係の話題が上がる事が多くなってきています。具体的には武豊騎手の勝利数並びに勝率が去年(2006年)に比べて大幅に落ち込んでいる事です。これらにより本人の不調説あるいはエージェント(騎乗する馬を斡旋する騎手の代理人)陰謀説(能力の低い馬に乗らされている)等言われていますが、まず、勝率などが本当に落ちているか検討していました。

下の表は武豊騎手を中心に主な騎手の2007年と2006年の成績に差があるかどうか、列カテゴリー(着順)に順序があるマン・ホイットニーのU検定を試みて見ました。結果、武豊騎手の成績の落ち込みはP値=0.8%で明白でした。逆に岩田康誠騎手はP=0.6%で上昇している事が確認されました。中舘英二騎手は2006年と2007年の成績が殆ど変わらない事のベンチマーク(P値=61.6%)としました。

ただ、今年度における武騎手と岩田騎手は勝利数こそ、岩田騎手の方が29も上回っていますが、成績のパホーマンスを検定してみますとP値=65.8%と全くと言って良いほど差はありません。もし陰謀説が正しく本当に武騎手が岩田騎手より能力が低い馬に乗っており、前述の成績(2007年)であれば今年の武豊騎手の馬を早く走らせる能力は向上している事になり、見方が180度変わってきます。特に今後の予想に取っては非常に重要な視点となります。従って、武豊騎手が本当に不調であると結論出来ません。(続く)

_28258_image002

| | コメント (0) | トラックバック (0)

2007年6月13日 (水)

記号の因果 相関関係と因果関係

     

121 相関と因果は別物であると言われています。この問題は残念ながら十分説明出来るレベルに達していませんが、一応競馬に限定して考えて見ますと、単勝のオッズの逆数と競走馬の勝率の間には高い相関関係があります。相関係数で言えば0.9以上にもなります。従って、オッズあるいはオッズから導出される人気順位を解析すれば競走馬の能力が判り、必勝法もあるのではと考えるのも無理からぬ事とは思います。

しかし、因果関係を想定しますと馬の能力(原因)→オッズあるいはオッズから導出される人気順位(結果)と言う一方向しか有りません。オッズ(人気順位)→馬の能力と言う方向は存在しない事になります。ただ、遺伝・環境要因→馬の能力→着順と言う因果関係は想定出来ます。また、この事を数学的にアプローチしますと主成分分析と因子分析、さらには仮説のモデル化などに関連して来ますが、なかなか難しいようです。仮説が出てくるとベジアンとなり、ますます訳がわからなくなりますね。

| | コメント (0) | トラックバック (0)

2007年6月 4日 (月)

記号の昇天 朝起きたらPCがダウンしていた!

     

134 朝起きて常時インターネット接続しているパソコンの連結機のランプが消えており、いよいよ昇天したかと思い詳しく点検したところ空冷ファンに代わりに使用している家庭用扇風機が止まっていました。リモコンスイッチも扇風機の根元のランプも点灯しているのに羽根が動いていない。そこで横倒しで突っ込んであったスタンド部分を掴んで引っ張ったら、なんと首のところでポッキリ折れてしまっていました。

ところで私のパソコンの1台は前にのご紹介したようにAthlonXP 2400+ OS Windows2000、MM 1.5GBです。CPUは82℃で電源が落ちるようになっているようです。家庭用扇風機では58℃まで下げる事が出来、この一年は快適に動いていました。今回のダウンでは、さすがにCPUもダメになっているのでは思いましたが、まずは扇風機を新調して見る事にしました。近所のヤマダ電機に行き、扇風機売り場を物色していたところHoneywellのターボサーキュレータなるものを見つけ、値段も2,980円と安く早速購入しました。これはスタンドレス、ファンとモータだけの扇風機です。

結果は非常に良好でした。コンパクトでCPUに風を当てる角度も取り易いので、CPU温度は何と50℃まで下がり、パソコンも快調に稼動しています。これで当面PCの新調をしなくても済みそうです。現在データのバックアップは2台のPCのHDと一台の外付けHDで行っていますが、大丈夫でしょうか。ついでにメールのバックアップが不十分である事に気が付き、今回真剣に考えて、インターネットを探したら、やっと分かりました。少なくとも単純にLANで繋いでメールのDBXを上書きすれば良い訳では無いですね。考えて見れば当然ですが、続きはまた。

| | コメント (0) | トラックバック (1)

2007年5月20日 (日)

記号の数値  数値計算技法

     

Scan001 プロ棋士の棋譜・手筋はは宝の山の続きを書きますとしながら時間が空いていまい申し訳有りません。機械学習のルーツを探るべく一つの古本を読み返しています。本は昭和47年(1942年)オーム社から第一版第1刷が出版されている 「コンピュータ実践実務技法講座 監修 魚木五夫 戸川隼人 著 数値計算技法」がそれです。左上にに機械学習あるいは数量化理論に通暁する「極値問題」を中心に関連を纏めたものを本書からコピーしたものです。極値問題の解法は「評価関数を最大にする点の求め方」と「制約条件の処理」に分けられるようです。そして後者は多分に連立方程式的性格を持つ問題であるようです。古本としましたが、私が30年近く前に実際に購入したもので、最近になって古書として購入したものでは有りません。また、仕事に関連して購入した物ではなく、当時は趣味としての競馬予想理論を構築する為の参考書として購入したものです。さらに.....(続く) 

ところで、数量化1,2の結果ですが、考えて見れば予想エクセルファイルで簡単に確認出来ますので、今後は申し訳ないのですが、割愛させて頂きます。

| | コメント (0) | トラックバック (0)

2007年5月 5日 (土)

記号の宝山  プロ棋士の棋譜・手筋はは宝の山

     

125 機械学習(Machine Learning-応用例-将棋ソフト・ボナンザ)、ニューラルネットワーク(Neural Network-応用例-競馬JRA-VAN NEXTのDM)、データマイニング(Data Mining-多数)並び数量化分析(林の数量化理論-これは日本発の手法ですが、ダミー変数を使用した重回帰分析と同じ結果をもたらすため欧米では中々受け入れられませんでした)、これらは同じものでは無いのですが互いに夫々重複したところが有ります。しかし、それぞれを平易に分かり易く説明するのは非常に難しいところが有ります(私も全てを理解出来る訳でも無いので)。その中では一番世俗的に理解し易い言葉はData Miningかと思います。<続く>

| | コメント (0) | トラックバック (0)

2007年5月 2日 (水)

記号の誤解   Bonanzaの開発者は将棋を知らないのか?

     

106 2007年4月21日HNK・BS2で放映された運命の一手 渡辺竜王VS人工知能・ボナンザで終局近くに将棋ソフト・ボナンザの開発者の方が投了の作法を良く知らなかった事(一寸訂正、知ってはいたがソフトに実装しなかったようです)や人間としての将棋が非常に弱い事から将棋の本質を理解していないのではと思われている節が有ります。特に将棋での感性や大局観など、凡そ人間的な部分を持ち合わせていない、ただただコンピュータのハードに詳しく機械的で温かみの無いロジックを操る人と見られているようです。しかし、本当は真逆です。ボナンザの開発者はプロ棋士以上に将棋の感性や大局観もっている訳です。即ち、ゲームとしての将棋の本質を誰よりも理解している事になります。将棋の本質を理解する上では投了の作法など瑣末な事ですが、どうも将棋の美学などを持ち出されて別の方向へ持って行かれる議論が多いようです。

ところで、何故ボナンザの開発者に将棋の感性や大局観が有るとしたかですが、一にも二にも機械学習を有効に作動させたからです。ボナンザの画期的なところは機械学習にあります。本当は機械学習が主役で全幅探索は脇役なのですが、コンピュータを前面に押し出したいのか説明がややこしい機械学習(全幅探索と不可分な部分もあるのですが)は脇にどけられているようですね。今日(2007年5月2日)Bonanza Classic1.0 (無料です)が発表されましたが、その説明の中で10,000以上の特徴パラメータを機械学習で求めたとされていますが、そもそも特徴パラメータに何を設定したら良いかを決めるには高度な将棋の感性並びに大局観がなければ出来ません。将棋の感性と大局観などを人間として実現させたのはプロ棋士ではあるのですが、感性ならびに大局観はプロの専売ではありません。感性とか大局観はもっとグローバルなもので生身の人間としての棋力とは別なものである訳です。チェスも将棋もまだオセロのように完全探索が完了していませんので、その時が来るまでソフト開発者には鋭い感性と大局観が要求される訳です。

| | コメント (0) | トラックバック (0)

2007年4月30日 (月)

記号の価値  歩と金の価値は同じなのか違うのか?

     

100 渡辺竜王VS人工知能・ボナンザ考の続きです。機械学習となるとその近縁にあるニューラルネットワーク、データマイニングあるいは数量化分析などに絡んで来るのですが、共通しているのは教師データにより質的データに量的データを与えている事です。話を前に進める為に、質的データとは何かですが、例えば、男と女、ABO血液型、競馬では毛色(青鹿毛など)、天候(晴れとか雨)、馬場状態(良~不良)また血統、即ち父馬がサンデーサイレンスであるかブライアンタイムスであるかなど、数字として足したり引いたりの四則演算が出来ない物を言います。量的データとしては体重(Kg)、身長(cm)、速さ(Km/hr)、競馬では負担重量(Kg)、馬体重(Kg)などがありますが、これらには通常物理的な単位(Kgなど)が有り、数字として四則演算が可能な訳で質的データとは違うと言う事はご理解いただけると思います。

ところで、将棋における歩と金は質的データでしょうか、量的データでしょうか。足したり引いたり出来ませんので、男と女の区別のような質的データで原理的にはある訳です。しかし、少しでも将棋を指せる人なら歩と金に価値の差があるは当然の事と認識されていると思います。即ち、歩と金を無意識に量的データとして扱っている訳です。今までの将棋ソフトは、その製作者の棋力に応じて歩と金に量的価値を与えていた訳ですが、ボナンザ(Bonanza)では機械学習(将棋のルールによる制約条件は別)によってのみ量的価値を与えている訳です。今までの棋力がある程度高い将棋ソフト制作者にとっては衝撃的な事であるはずです。Bonanzaの開発者の生身の人間としての棋力が低い事(実際には将棋の勝ち負けには興味が湧かない、それより面白い物を見つけてしまったから?....)が、機械学習が上手くいっている事を裏付けている訳です。機械学習が与える量的価値は記述可能なデータではありますが、人間には理解出来ない種類のものであるのです。この辺の事は、明解に説明するのは難しいかも知れません。

| | コメント (0) | トラックバック (0)

2007年4月29日 (日)

記号の2位  数量化2位はやはり面白いかも?

     

「20070429tnfk2.xls」をダウンロード 2007年4月28日(土曜)は数量化2位を事前公表しましたが、結果は非常に良かったようです。そこで、4月29日(日曜)の数量化2位について単勝・複勝の的中状況を調べたところ、さすがに東京・単勝はダメでしたが、複勝については左上のエクセルファイルの如く非常に好調でした。

| | コメント (0) | トラックバック (0)

2007年4月28日 (土)

記号の運命   の一手 渡辺竜王VS人工知能・ボナンザ考

     

101 記号の将棋の続きですが、今回は一足先に人間のチャンピオン(GM-グランドマスター)が人工知能・コンピュータに負けたチェスと比較して見ましょう。まず、一般に誤解されている点を明らかにしなければなりません。日本の将棋ファン(と言うより普通の人)が将棋はチェスと違って、敵の駒を再利用でき複雑であり高級なゲームで、コンピュータ側は手を出せない、まず弱いレベルの低いチェスが標的にされたと思い込んでいる事です。一寸考えて見れば自明ですが、コンピュータのハード及びソフトを作る側の動機を考えて見ると、極東の日本と言う国だけに存在する将棋に勝ったところで、全世界に与える衝撃はそれ程大きくない、即ち、コンピュータのハード並びにソフトを全世界に売るメーカーとしては莫大な開発費に比べて将棋コンピュータ・ソフトの宣伝効果は低い訳です。マーケティング戦略としてはグローバルなゲームであるチェスを狙うしか無い訳で、基本的には将棋は相手にされていなかった事になります。これは現在でも状況は同じです。

ところで、コンピュータを離れて、人間のチャンピオンを比較してみましょう。即ち、チェスのグランドマスター(GM)と将棋のプロ棋士のどちらが強いかです。答えは両方とも強くて弱いという事になります。チェスではGMはプロ棋士には絶対(ミスが無ければ)に負けません。逆に将棋ではプロ棋士はGMに絶対負けません。GMになるにもプロ棋士になるにも5歳位からチェス漬け、将棋漬けで10年以上修行しないとなれないと言われております。人間として一旦完成してしまったGMなりプロ棋士のチェス脳、将棋脳は多分互換性が無いのではと考えられます。GMでありプロ棋士になるには言語と同じようにバイリンガルになる環境が必要ではないかと考えられます。

コンピュータに話を戻しまして、コンピュータのチェス脳と将棋脳は互換性はあるのかと言われると、恐ろしい事にある訳です。今回ボナンザ(Bonanza)が、その一端を証明した事になります。チェス・チャッピオンが最初に負けた頃のスパコン並びにソフト開発費は天文学的数字になるでしょうが、現在ではハードは100万円以下になり、個人の趣味の範囲で開発が可能になった訳です。そして、個人の趣味の範囲でプロ棋士に勝てるソフトの開発ができる環境が整いつつある訳です。IBMとかIntelとかが大袈裟ですが社運を賭けて開発する時代は終わったようです。

| | コメント (0) | トラックバック (2)

2007年4月23日 (月)

記号の将棋  機械学習による評価関数

     

07311718_007 私は囲碁は少しやりますが、それでも1級に届くかどうかです。将棋となると殆ど解かりません。しかし、2007年4月21日HNK・BS2で放映された将棋のトッププロと将棋ソフトのトップが平手で対戦した記録「運命の一手 渡辺竜王VS人工知能・ボナンザ」は非常に面白いものでした。約1時間半の長尺のドキュメントですが、時間を感じませんでした。人間のチャンピオンが”人工知能”と称されるコンピュータに負けたのは1997年当時のChessの世界チャンピオン・ガルリ・キモビッチ・カスパロフ(Гарри Кимович Каспаров, Garry Kimovich Kasparov)がIBMの当時のChess専用スーパーコンピュータ・Deep Blueに1勝2敗3引き分けと負け越したのが最初です。何故当時莫大な費用かけIBMが専用スパーコンピュータを製作した理由ですが、表題に掲げた機械学習にも絡んで来るのですが、現在注目を浴びつつあるデータマイニングの有用性を実証するためだった訳です。そして数量化予想にも関係して来るのです。

ところで、私がChessソフトに触れたのは、恐ろしい事に、そうでも無いかも知れませんが、APPLEⅡを購入した1978年の翌年の事です。ソフト名はmicro chess 2.0です。今でも手元にガリ版刷りの解説(The magazine for 6502 computer families! Lab.letters march 1979 Vol3 No3)が有りますが、一応対戦可能ソフトになっています。アンパッサン(通過捕獲)、Castling、check、check mate、Stale mate、パーペチュアル・チェック(千日手)などが取り上げられています。あれから約28年、感慨深いものがあります。後日談として、詳しくは知りませんが、APPLEⅡのハードを使用したプログラムで当時のスパーコンピュータと互角に渡り合った猛者もいたようです。

話が横道にそれて申し訳ない。本筋に戻して、番組に一点疑問があります。番組では全幅検索がコンピュータの能力として強調されていましたが、この将棋ソフト(Bonanza)の真に衝撃的なところは機械学習の成果を実装して有効に働かせた事です。Bonanzaが出現する以前は”評価関数”に関して人力あるいは簡単な数式で求めていたのですが、Bonanzaでは人間の主観によって評価値を決めるのでは無く、プロの手筋を自動学習して決めていた訳です。私としても機械学習を完全には理解できませんが、ラグランジェの未定乗数法が使われているとされていますので、これは大規模な連立一次方程式を解く事に繋がり、ここで私の競馬予想に使用している数量化1類の解法と通暁してくる訳です。余談ですが、Bonanza自身に機械学習のプログラム(評価関数)が組み込まれている訳では無いでしょう、組み込まれているのは高速アクセス可能なユニーク数(重複の無い唯一の整数---これもややこしい概念です)を使った評価値のハッシュテーブルとなるかと思います。

※画像は内容とは無関係ですが、長めの文章の時に味付けとしてアップします。画材は野地温泉に行く途中の何とか...忘れた...と言うところです。

| | コメント (0) | トラックバック (0)

記号の毛色  毛色はDNAマーカーになれるか?

     

105_1 馬の毛色は質的形質であって、能力のような量的形質では有りませんが、遺伝子としての存在形式に差があるとは思えません。従って、量的形質を決める複数の遺伝子の座位(ロカス)が毛色の遺伝子座位近くに存在している可能性は否定できません。このような考えもあり要因に毛色を設定して何度も数量化分析を試みたのですが、毛色の影響(父馬などに比べて)は僅かなものでした。現在では因子としては使用していません。

とろろで、最近、ディープインパクトの全兄ブラックタイドが、まだ現役で走っている事に気づき、両馬の差を考察して見ました。ブラックタイドの成績は決して悪い訳では無いのですが、ディープインパクトとは比べるべくも有りません。血統は全く同じ、生産牧場も同じですが、遺伝が関与していると考えるデータで相異があるのは、まず一つ目は馬体重です。ブラックタイドは500Kgに迫る大型馬ですがディープインパクトは440Kgと牡馬にしては非常に小さくブラックタイドより60Kgも軽いのです。2つ目は毛色です。ディープインパクトは鹿毛ですがブラックタイドは黒鹿毛です。因みに父馬であるサイデーサイレンスは青鹿毛、母馬のウインドインハーヘアは鹿毛です。

ここで、競走馬の能力はどちらかといえば母馬から引き継がれている印象があります。ディープインパクトの毛色は鹿毛で母馬のウンドインハーヘアと同じですが、ブラックタイドの毛色は黒鹿毛で、さらにサンデーサイレンスの毛色・青鹿毛とも違っています。ここで仮説ですが母馬の毛色と一致するかしないかがディープインパクトと全兄ブラックタイドとの能力差を説明できるのではと考えています。馬体重も候補ですが取り扱いが難しいようです。これはメモランダムです。

 ※画像は内容とは無関係ですが、長めの文章の時に味付けとしてアップします。画材は家の近くの面白い造形です。

| | コメント (0) | トラックバック (0)

2007年4月22日 (日)

記号の2位  数量化2位も面白いかも?

     

「20070422rstnfk2.xls」をダウンロード 単勝・複勝候補をソフトウエアで自動的に出せるようになりましたので、数量化2位を試しに出力して見ました。2007年4月22日に関しては左のエクセルファイルの如く非常に良い結果となっていますが、数量化1位に比べ出入りが激しいようです。今のところ事前公表の予定は有りません。

| | コメント (0) | トラックバック (0)

2007年4月18日 (水)

記号の人気  人気順もベンチマークも只1行として存在している訳では無い

     

直近の2週間の予想結果纏め(~4月15日)の下の2行に人気順とベンチマークが有りますが、これらは単純に数値存在しているのでは無く下の表の様に細かいデータを持っています。

6_619_image002

| | コメント (0) | トラックバック (3)

2007年3月27日 (火)

記号の仮柵  中山はカオスか

     

中山の的中パフォーマンスが3月17日から急に低下した原因をあれこれ考えています。一つの原因として仮柵移動(AコースからBコースへ)を考えたのですが、Bコースへの移動は来週(3月31日)からのようですので、原因としては考え難いところが有ります。一般的には連続開催による馬場の荒れが考えられます。ダートでも荒れていますので春先特有の気温急変なども考えられます。何れにしても2週続けて100万馬券がでるのも珍しいかも知れません。芝に関しては来週より良くなる感じはしますが、どうでしょうか。

ところで仮柵そのものでも悩んでいます。即ち、開催場所x距離x内外・左右x馬番x仮柵(コース)として特に馬番と仮柵に交互作用を認めるか、仮柵は単に速度(タイム)の大小に影響するだけで馬番に対しては公平に影響するとするのか難しいところです。交互作用を認めるとカテゴリーが細分化されて過剰学習が起こっているような気がします。来週の中山のパホーマンスを見ればある程度見通しが立つかも知れません。

| | コメント (0) | トラックバック (0)

2007年3月22日 (木)

記号の結果 2006年全3453レースの結果詳細

     

「20061028mmkRCM.lzh」をダウンロード 左のファイルは2006年の全レース3453Rの結果詳細を圧縮したものです。解凍後エクセルで文字列として呼び込めば細かい解析が出来るかと思います。買い方の検討の一助にして頂ければ幸いです。

| | コメント (0) | トラックバック (0)

2007年3月 5日 (月)

記号のBOX  100万馬券を効率的に狙う為に

     

3連単100万馬券を狙って獲るでお話した予想順位1,2を軸に予想順位3以下に流すマルチフォーメイションによる買い方ついて、2007年3月3日と4日に、予順1,2を軸に予順3,4,5,6,7に流すMF(マルチフォーメイション30点買い)で検証して見ました。結果は下に示しましたが、一応両日ともにプラスを計上しました。しかし、結果を良く調べて見ますと予想順位5位までのボックス買い(60点)により多くの万馬券が的中しており、回収率もMFより遥かに良かった訳です。

_16689_image002_4

しかしながら、20万馬券の的中がもし無かったらどうでしょう。実際に2つの20万馬券を外して見ると一気にマイナスとなってしまいます。即ち、逆の見方をすると的中すれども無駄な買い目が多く、所謂”トリガミ”となりトータルではマイナスになる危険性が大きい訳です。その点からすると予想順位1,2を軸としたMFは、ワイド1点目的中が必須になりますが、予想順位を10位まで手を広げても以下の表に示しますように48点で済みます。ボックスは7頭BOXで210点、10頭まで手を広げれば実に720点買いとなります。従って、100万馬券を効率的に狙うには予想順位1,2を軸としたMF流しが数量化予想ではお勧めです。

なお、参考までに買い目点数を求める式は予想順位1,2軸の流しMFは、nを対象馬数とすると、(n-2)*6になります。ボックスの場合は(n-2)*(n-1)*nとなります。

_22407_image002

| | コメント (0) | トラックバック (0)

2007年3月 1日 (木)

記号の阪神  改修後の阪神コース考

     

前回の阪神の新コースの解析はどうも旧バージョンの要素モデル設定では上手く行かなかったようでです。具体的には仮柵を同じ要素内に交絡させたのが悪さをしてたようです。今回(新バージョン)は仮柵A、Bは別の要素に移動させて分析を行いました。結果として新設されたコース(1600m外を中心に)はペース速度は遅く(所謂スローペース?)なっているが、上がりはゴール前直線が長くなったためか、非常に速く、即ち上がりタイムは良くなっているようです。全体としての走破タイムは旧コースより早い時計になっているようです。

_28502_image008

| | コメント (0) | トラックバック (0)

2007年2月21日 (水)

記号の数量  数量化1類の例題

     

今回は非常に基礎的な事ですが、数量化1類の実際の計算の例題を上げてみました。サイトを色々探して見ましたが、適当なものが見つかりませんでしたので、私の種本、応用多変量解析のp87~p91の選挙の投票率のデータを引用しました。参考になれば幸いです。なお、桁数は適当に切り揃えています。

ところで、以下の数字のの具体的な意味ですが、例を投票率から引いていますが、競馬に焼き直して解説したいと思います。競馬のタイムは芝2000mであれば2分掛かるようですので、これを分速に直すと1分間に1Km即ち、60分間で60Kmとなり、この前後が馬の時速となります。少し荒っぽいですが、投票率の絶対値が丁度時速に近いところにありますので、この例題を競馬の速度を求める事例に切り替えて説明します。61.7は馬の時速と考える訳です。

アイテム1は距離として、1600mと1800mと2000mの3つのカテゴリーがあり。

アイテム2にコースとして芝とダートの二つカテゴリーがあり

アイテム3には武豊騎手と岩田騎手と安勝騎手の3カテゴリーがあるとします。

***数量化1類***

標本数  15
アイテム数 3

アイテム 1 :距離     1600m(100)、1800m(010)、2000m(001)
アイテム 2 :コース    芝(10)、ダート(01)
アイテム 3 :騎手     武騎手(100)、岩田騎手(010)、安藤騎手(001)

***入力データ***

1   61.7   2   2   1 
2   65.2   3   2   2 
3   59.6   2   2   3 
4   70.1   2   2   1 
5   67.7   2   2   2 
6   67.5   2   1   3 
7   72.4   1   1   2 
8   67.3   3   1   1 
9   55.2   3   2   1 
10   48   3   2   2 
11   70   3   2   1 
12   65.3   1   2   3 
13   43.8   2   2   2 
14   55.5   1   2   1 
15   88.2   2   2   3 

***入力データ(0/1)***

1   61.7   010 01 100   
2   65.2   001 01 010
3   59.6   010 01 001
4   70.1   010 01 100
5   67.7   010 01 010
6   67.5   010 10 001
7   72.4   100 10 010
8   67.3   001 10 100
9   55.2   001 01 100
10   48    001 01 010
11   70    001 01 100
12   65.3  100 01 001
13   43.8  010 01 010
14   55.5  100 01 100
15   88.2  010 01 001 

X 'Xの正則行列  21:52:54

3   0   0   2   1   1 
0   7   0   6   2   3 
0   0   5   4   2   0 
2   6   4   12   4   3 
1   2   2   4   5   0 
1   3   0   3   0   4 

X 'Xの逆行列    21:52:54

0.6974   0.4400   0.3290  -0.3129  -0.1967  -0.2696 
0.4400   0.6800   0.4000  -0.4000  -0.2000  -0.3200
0.3290   0.4000   0.5483  -0.3548  -0.1612  -0.1161 
-0.3129  -0.4000  -0.3548   0.4354   0.0161   0.0516
-0.1967  -0.2000  -0.1612   0.0161   0.3709   0.1870
-0.2696  -0.3200  -0.1161   0.0516   0.1870   0.5187 

X'Y行列        21:52:54

193.2   458.6   305.7   750.3   297.1   280.6 

カテゴリースコア

68.206   69.804   67.910  -6.349  -4.227   5.507

カテゴリースコア(カテゴリ-1を入れる)

アイテムとカテゴリー纏め

アイテム1距離    カテゴリー1-1600m   68.026km/hr

             カテゴリー2-1800m   69.504km/hr

             カテゴリー3-2000m   67.910km/hr

アイテム2コース   カテゴリー1-芝コース  0.000km/hr

             カテゴリー3-ダート   -6.349km/hr

アイテム3騎手    カテゴリー1-武豊     0.000lm/hr

             カテゴリー2-岩田     -4.227km/hr

             カテゴリー3-案勝     5.507km/hr

ここで芝2000mの武豊騎手の速度を知りたい場合2000m速度 =67.91(2000m)+0.00(芝)+0.00(武豊)=67.91km/hr となります。                                   

| | コメント (0) | トラックバック (1)

2007年2月20日 (火)

記号の競走  競走記号の影響

     

下の表は来週より用いる新しいバージョンに導入した競走記号の影響速度(時速km/hr)です。データは2004年~2006年の全てレースから採録した延べ頭数、約14万頭より求めたものです。競走記号の意味はJRAのホームペイジの競馬番組・一般事項・Ⅰ定義を参照して下さい。特に定義と走破速度の関係に注目して見て下さい。

_20229_image002

| | コメント (0) | トラックバック (0)

2007年1月29日 (月)

記号の大荒  3連単100万馬券を狙ってとる

     

2007年の競馬は何か今までとは違う感じがします。つかみ所も無い大荒れのレースが続いています。数量化分析による予想でも馬連本線6点とか3連複本線7点以内になかなか良い的中が来ません。しかし、点数の幅をもう少し大きくとるとトンでもない超万馬券が掛かっているようです。特に3連単に面白い例が多いようです。

最も際立った例は、2007年1月20日京都11R石清水ステークスです。このレースでは3連単14→13→12の配当は1,786,180円、単勝13番人気→3番人気→10番人気の順で入線し、3連単の当たり目は1633番人気でしたので、常識的には取れません。ところが速度理論と数量化分析による予想では1着に入った単勝13番人気のヒシハイグレードを予想順位7位に2着に入った単勝3番人気のゴッドスマイルユーを予順1位に3着に入った単勝10番人気のムーンシャインを予順2位に指名しています。即ち、予想順位7→1→2で決まった訳です。本線的中としては取れませんが、予順1,2を軸に予順3,4,5,6,7に流すマルチで3連単を購入すれば30点(3000円)で178万馬券を仕留められた訳です。

100万馬券的中に至らなくても、予順1,2を軸に予順3以下に流すマルチによる超高額万馬券例は今年は多くなっています。2007年1月21日中山9レース若竹賞では378,230の3連単が予順1,2を軸に予順3,4,5,6,7,8,9に流すマルチ42点で、2007年1月27日京都10レース木津川特別では73,490円の3連単が予順1,2を軸に予順3,4,5,6に流すマルチ24点で、2007年1月27日京都11レース橿原ステークスでは30,540円の3連単が予順1,2を軸に予順3,4,5,6,7に流すマルチ30点で、2007年1月27日小倉9レースでは63,330円の3連単が予順1,2を軸に予順3,4,5,6,7,8,9,10に流すマルチ48点で、2007年1月28日東京9レースでは286,000円の3連単が予順1,2を軸に予順3,4,5,6,7,8に流すマルチ36点で的中しています。

| | コメント (0) | トラックバック (0)

2007年1月25日 (木)

記号の消失  母系の影響力(ミトコンドリア仮説)

     

遺伝学的に見ると核内遺伝子に関しては、母と父から50%づつ遺伝情報を引き継ぎますが、ミトコンドリアに代表される核外遺伝子は100%母から子に伝わります。従って、もしミトコンドリアに係わる遺伝子が馬の競走能力に影響しているのであれば父馬より大きな影響力が母馬にあるはずです。数値解析の対象としては父馬より価値はありそうですが、残念ながら一頭の繁殖牝馬から生まれる頭数には限りが有り、解析出来たとしてもデータの絶対数が足りず、得られた数値の信頼性は殆ど望めません。しかし、母の母、その母の母と辿って、9代くらい遡った時点のでの特定牝馬(基礎牝馬)の母系子孫は数百から千以上になり、数値解析に耐えうると考えられます。例えばディープインパクトの母馬はウインドインハーヘアですが全産駒の全出走回数は、現在35回です。数値としては解析出来ますが、果たして意味のある数値となるでしょうか。そこで、ウインドインハーヘアを一代母として、その母Burghclere(2代)、Highclere(3代)、Highlight(4代)、Hypericum(5代)、Feola(6代)、Aloe(7代)、Alope(8代)、Altoviscar(9代)まで遡り、Altoviscarの母系子孫の数を2004年~2006年の全てレースから採録しますと下の表のように、芝コースでは682走にダートコースでは692走になります。ウインドインハーヘアの代わりにAltoviscarを分析すれば結果に意味をもたせられると思われます。分析対象とした根拠はミトコンドリアDNAは母系遺伝である事とミトコンドリアが競走能力に強い影響があるとする仮説です。

_15393_image002

| | コメント (0) | トラックバック (7)

2007年1月21日 (日)

記号の年齢  騎手の年齢による走行パターンの変化

     

騎手の技量に関して色々な要素を検討しましたが、余り上手く行きませんでした。特に新人騎手の特典となる減量(1Kg~3Kg)の効果が今ひとつ掴み切れませんでした。そこで馬と同じように成長曲線が抽出出来ないかと考えました。そうしましたら、下のグラフのように見事に成長パターンが浮かび上がって来ました。意外であったのは騎手の成長は馬の成長より遥かに遅い事が分かりました。ただ、馬は満4歳付近で能力のピークを迎え、以後衰えていきますが、人間である騎手は30才を超えても僅かですが成長しています。なお、このデータを作成するには、略完全な減算データベースを構築する必要があります。また、騎手の能力は個々の騎手別に捉えております。従って、個々の騎手の能力を比較する場合、18才の騎手は30才のベテラン騎手より必ず劣ると言う意味では有りません。

_7179_image002

| | コメント (0) | トラックバック (0)

2007年1月20日 (土)

記号の新装  新装なった阪神競馬場、なかでも特異な形状であった芝1600m

     

2006年12月に新装なった阪神競馬場、なかでもポケットと呼ばれる変則的な位置からスタートする芝の1600mが、新阪神では外回りに新設され、スタート位置は極常識的なものとなり、ゴール前は長い直線が用意されました。従って、想定される新コースのタイムは旧コースに比べ波乱・特長のないと予想されるのだが、実際には下のグラフのように興味深い状況になっています。上がりはゴール前3ハロン、即ち600mの時速です。新コースはゴール前の直線が長くなった為に上がり速度は相当速くなっています。これは想定内ですが、スタートから1000mまでのペース速度では新コースの仮柵移動により大きく変化しているようです。これは旧コースでは見られませんでした。全1600mの走破速度で見ると、さらに意外な事に新コースの仮柵Aの内側の馬番は旧コースと余り違わない走破速度(タイム)になっています。何れにしましても新阪神コースのデータはまだ非常に少ない為、決定的な事は言えませんが、平凡なコース設計と言われ、面白みに欠けると思われていましたが、データ上では波乱含みの面白いコースになっています。なお、影響度ゼロの基準は新潟芝直線1000mの馬番1となっている為、阪神の芝の1600mは全てマイナス(距離が長いので当然ですが)になっています。

Sibacategorynameoption1n3rd20070117_2642

| | コメント (0) | トラックバック (0)

2006年12月27日 (水)

記号の試行  試行回数1000レースを越しても回収率100%を維持できるか?

     

2006年8月から数量化1位を全てのレースについて事前公開して来ましたが、結果は下の表のようになりました。馬連本線6点についても回収率を計算しましたが、1000レースを超えても100%維持しています。この結果をどのようにご評価頂けるか分かりませんが、参考までに最終人気順位で買った場合を比較の為に計算しましたので、ご評価の一助にして頂ければ幸いです。

6_25298_image002

| | コメント (0) | トラックバック (0)

2006年12月22日 (金)

記号の複勝 複勝1点の破壊力

     

下の表は、2006年12月9日~12月17日までの全レース144Rを開催場所、日次毎(12レース単位)に馬連数量化本線6点と数量化単勝1点について纏めたものです。的中率についてはース単位で、33.3%であれば12レース中4レースが的中していた事を意味します。回収率は均等買いとして、馬連については12レースで7200円配当があれば100%(600円x12レース)となり、単勝及び複勝については12レースで1200円配当があれば100%(100円x12レース)になります。なお、個々のレースの詳しい予想内容は各プロバイダーのリンクを辿れば得られす。複勝1番人気でも回収率を100%以上に持って行くのは不可能に近い事です。

6_23974_image002

| | コメント (0) | トラックバック (0)

2006年12月 2日 (土)

記号の領域  3連単的中領域

     

下の表は2006年12月2日中山9レース・イルミネーションJSのタイム合計法による予想状況です。不確定要素の多い障害レースでタイムを推定する予想が可能なのかと驚かれる方もいるかも知れませんが、可能なわけです。競走中止が2頭もいる中で3連単的中のロジックを説明するのは・・・・。馬連1-7・1630円は6番人気で本線6点目での的中ですので、それ程のことではありません。馬単7-1・4970円は17番人気ですが6番人気→1番人気ですので人気順位では取り難い組合せです。一方速度理論と数量化分析による予想では予想順位3位→4位ですので取り易い組合せです。このレースではタイム合計法では取り難いと思われている予順3,4の組合せを6点以内に取り込んでいます。即ち、買い目の最適化が起こっているとも考えられます。

3連複1-2-7・34020円は72番人気ですが、速度理論と数量化分析による予想では伏兵6点目で的中です。大した事では無い的中のようですが、最適化された最上位から数えると20点目の的中になりますので人気順位に比べれば大分上位に持ってきている訳です。さて、問題は3連単7→1→2・206140円です。人気順位では367番人気ですので、多分理屈的に狙って獲れるような馬券では無い気がします。

しかし、速度理論と数量化分析による予想では理屈によって的中させようとする訳です。3連単 本線3第6順的中何?では、第何順と言う定義を行い、一応本線は3頭BOX=6点x7点で42点とし、これを的中領域とするのは問題ないと考えます。さらに、3連単 本線3第6順的中何?では、第1順が最も高い的中確率であるとしましたので、準本線以下伏兵までの第1順も狙って獲れる馬券の範囲、即ち3連単的中領域としましょうと言うものです。結局42点+14点=56点を3連単の標準買い目数とするものです。下の表では太線の枠内が3連単的中領域になる訳です。イルミネーションJSでは20万円の3連単を56点以内で捉えられた事になります。

なお、商用サイトでは表示の制限および冗長さを避けるために3連単のあるレースに付きましては第1順のみを表示しています。また、具体的には 7→ 1→ 2(10バイト長)と表示すべきところを 7- 1- 2(8バイト長)になっています。3連複までしか無いレースでは1-2-7の表示になっています。馬単についても同様で全てのレースで馬単正順で表示しています。例えば、7→1を7-1として表示しています。

Ilumination20061202060501l_23097_image00

| | コメント (0) | トラックバック (0)

2006年11月30日 (木)

記号の順番  3連単 本線3第6順的中何?

     

下の表は2006年11月26日京都第11レースアンドロメダステークスの3連複、3連単の予想状況(未発表)です。右端の合計時速はタイム合計の最小値(時速の場合最大値)と同じロジックに基ずくものです。馬連・馬単では2頭の合計ですが3連複・3連単は3頭の合計値となります。このレースでは97番人気の3連単12→9→1・27250円が3点目第6順(第1順第2順第3順・・・とすれば18点目)で的中しています。13番人気の3連複1-9-12・3420円は3点目で的中しています。

さて、3連複と3連単ですが、最もバランスの良い買い目点数は中々決めづらいですね。一応3連複は本線7点としましたが、馬連6点との的中バランス(我慢できる的中率と回収率との関係)比較では10点辺りが適当と思いますが、馬連5頭BOXが4*5*/2=10点、3連複5頭BOXが3*4*5/6=10点となる事から少し絞り過ぎのきらいが有りますが7点を本線としました。3連複においても馬連と同様にタイム合計の最小値と言うロジックが有効と考え、これを買い目算出に使っています。

ところで、問題は3連単です。買い目は一気に3連複の6倍に増えます。5頭BOXを例に取りますと10点から60点に増えてしまいます。従って3連単を1点単位で買い目をコントロールするのは非常に難しい事ですし、また手間の掛かる事でもあります。しかし、速度理論と数量化分析による競馬予想では、これに挑戦してみました。

馬単までは一点一点を区別する表現は、どうにか有りますが、3連単については一点一点を区別する認知されたものは無いようです。そこで勝手ですが、以下のような定義をさせてもらいました。

馬番をA、B、Cとして予想能力最上位の馬番A、中位の馬番B、下位の馬番CとしてA→B→Cの順番で1着、2着、3着になった場合を第1順と名付け、A→C→Bを第2順、B→A→Cを第3順、B→C→Aを第4順、C→A→Bを第5順、C→B→Aを第6順と名付けました。また、的中確率も第1順>第2順>第3順>第4順>第5順>第6順と考え、3連単の一点一点を区別する事にした訳です。

従って、理屈上は3連単4点目的中とか15点目的中などと的中順位を表現できるようになります。マルチやフォーメションなど3連単を簡単に購入できる手段が有りますが、購入点数が60点とか120点に簡単に達してしまい無駄があるような気もしますので、ギリギリまで購入点数が絞れるタイム合計法による買い方もあるのかなと思っています。本線は3頭BOX=6点x7点で42点となります。

20061126080608andoromeda_9891_image002

| | コメント (0) | トラックバック (0)

2006年11月29日 (水)

記号の表裏  正順的中、逆順的中何?

     

下の表は2006年11月26日東京第7レースオリエンタル賞の馬連、馬単の予想状況(未発表)です。右端の時速合計はタイム合計と同じ同じロジックに基づくもの(時速では最大値となります)です。速度理論と数量化分析による競馬予想は完全コンピュータ予想ですのでソフト内部では時速ベースで計算を行っています。予想結果の表示には理解し易いように、分速あるいはタイムに変換している訳です。

なお、タイム合計で使用しているタイムはレース後の結果としてのタイムを使用していますので、タイム合計の最小値が当たり目になるのは自明な事です。下の表の合計時速は、あくまでもレース前に予測・予想したタイムから算出したもので、最良の予測・予想は限りなく最上位1点目に近づく事を示したものです。具体的には、13番人気の単勝5330円を予想順位1位に持ってきているのは”予想のタイム合計”の表で示した通りですが、下の表では32番人気の馬連6-8・8510円を6点目に、88番人気の馬単8→6・28310円を6点目正順(表裏表裏・・とすれば11点目)持って来ています。

ところで、正順・逆順と言う言葉ですが、これは私が勝手に作った造語です。馬単が始まった頃、馬単の的中馬券の表現に表・裏的中がある事には気がついたのですが、この定義が良くわからなかったのです。例えば、オリエンタル賞では馬連では6-8が当たり目になるのですが、馬単の当たり目8-6が表なのか裏なのか判らなかった訳です。馬番の若い順に記した馬連6-8が表と取れるような表現も散見されたので、いっそのこと、独自な表現を作ってしまおうと考え、能力上位と予想した馬番から順で的中したものを正順的中とし、能力下位と予想した馬番から的中したものを逆順的中と表現する事にした訳です。

ただ、矢印(→)表現を使えれば表・裏とか正順・逆順とか考えずに、オリエンタル賞の場合、単に8→6とすれば済みます。言い換えると1byte長の-しか使えない時に馬単の的中表現をどうするかと言う技術的な面も有ります。

それはそうとして、下の表の馬連6-8の的中順位・本線6点目と”予想のタイム合計”の表中の1番人気(オッズ2.4倍)で2着に敗れたイントゥザグルーヴの予想順位7位との関連に違和感を感じませんか?例えば、ボックス買いを常用している方にとっては予想順位7位を買い目に入れる為には、6*7/2=21点の購入が必要となります。

しかし、タイム合計の最小値による買い目では馬連6点で的中に至っているのです。これはタイム合計の最小値による買い目決定の利点を示しています。即ち、個々の馬の予想タイムによって買い目が1頭1軸流しからボックス買い近くまで変化し、予想タイムの精度が高ければ高いほど効率的な買い目が得られる訳です。速度理論と数量化分析による競馬予想の買い目は、ただ意味も無く順番に並んでいるのでは無く、最適化された買い目の順番に並んでいる事になります。

しかしながら、例えば、4頭ボックス6点では必ず6点以内に入る予想順位2,3と3,4並びに2,4の組合せが6点以内に入らない事も多々起こるのも事実ですので、表示された買い目を選ぶかボックスを選ぶかは自己責任(?)でお願いします。理屈上最適化された買い目が表示されると言う事です。実際にも馬連6点に買い目を固定した場合、タイム合計法の方が的中率は2%前後、回収率は5%前後高くなるようです。それと加えて、馬単ですが正順6点とさらに絞ってしまえばハイリスク・ハイリターンになりますが回収率をさらに高く出来る可能性は有ります。

Orient20061126_1492_image002

| | コメント (3) | トラックバック (0)

記号の合計  予想もタイム合計

     

タイム合計は最小値のネタばらしです。どこかのレース場(例えば府中-東京など)芝の2000m・16頭立てのレースとは2006年11月26日東京第7レース・オリエンタル賞の事でした。このレースでは13番人気の馬番8のガンメタルブラックが1着となり、単勝は5330円の高配当、馬連6-8は8510円、馬単8→6は28310円の万馬券となり、3連複4-6-8は21610円とやはり万馬券となりました。3連単は発売されていませんが、8→6→4となります。

ところで、もし、個々の競走馬の正確なタイムが予測されている場合、タイム合計による買い目の算出が最も合理的且つ理論的とは思いませんか?それを実際に実行しているのが速度理論と数量化分析による競馬予想なのです。下の表はオリエンタル賞の各馬の予想タイムを秒に直して良いタイム順にソートしたものです。見事に馬番8番を最上位に持ってきています。即ち、配当5330円の単勝を1点で的中させている訳です。

Orient20061126_25342_image002

| | コメント (0) | トラックバック (0)

2006年11月28日 (火)

記号の合計  タイム合計は最小値

     

タイム表記は日本では十分の一秒単位で行われます。タイム合計って何?の馬番1番のタイム2.01.3は2分1秒3と言う事になるのですが、馬は平均1秒間に16mも走りますので、0.1秒では1.6mになります。十分の一秒単位での表記では1.6mもの誤差出てしまい、結果として同タイム馬が多数生じてしまいます。そこでゴールライン上で時間にシンクロナイズした写真を撮り、精度的には千分の一秒単位くらいまで読み取りが可能になる訳です。ただ、ここまでの精度で表記しても分かり難いし、タイムとしても実測では無いので、写真上で読み取れる大体の目安として、ハナ、アタマなどと表記していると思います。

タイムとして大小関係を比較するには、百分の一秒、さらに千分の一秒の数値が必要になりますので、ハナ差、アタマ差を秒数に変換する必要があります。変換式は、例えばハナ差であれば3cm、即ち0.03mを16mで除したものが、ハナ差の秒数となります。即ち約千分の2秒、0.002秒となります。下の表は、この様にして求めた着差の秒数に分を秒に変換したタイムと足して千分の一秒まで求めたタイムを良い(小さい値)順番に並べたものです。表を見れば分かると思いますが、一番上に来た馬番(この場合8)の馬が1着であり、2番目に来た馬番(6)の馬が2着で有り、3番目に来た馬番(4)の馬が3着である訳です。

また、この表から自明な事になるのですが、馬連の組合せの数は15*16/2で120通りが有りますが、その全ての組合せの2頭のタイム(秒/着差)を足したものを良い(小さい値)順番に並び直せば、一番上に必ず6-8が来ます。これが馬連の当たり目になりますし、2頭のタイム(秒/着差)の良い方から並べると8→6となり、これが馬単の当たり目になります。同様に3連複の組合せ数は14*15*16/6で560通りが有りますが、その全ての組合せの3頭のタイム(秒/着差)を合計して、良い(小さい値)順番に並び直せば、一番上に必ず4-6-8が来ます。これが3連複の当たり目になりますし、この3頭をタイム(秒/着差)の良い順番に並べれば8→6→4となり、これが3連単(後半の4レースであれば)の当たり目になります。即ち、単勝、複勝、馬連、馬単、3連複、3連単はレース後の結果のタイム(秒/着差)ないしレース後の結果のタイム合計の最小値が当たり目になる訳です。

Orient20061126_11596_image002

| | コメント (0) | トラックバック (0)

2006年11月27日 (月)

記号の合計  タイム合計って何?

     

速度理論と数量化分析による競馬予想で提示される買い目が、何か変と違和感を持たれる方がおられるかもしれません。速度理論系であるJRA-VAN NEXTのデータマイニングによく”タイム合計”って何と言う質問もみられますので、多分、一般の競馬ファンには奇異に、あるいは理解しにくい概念であるようです。ここで簡単な(でも無いかもしれません)クイズを出しましょう。今ここに、どこかのレース場(例えば府中-東京など)芝の2000m・16頭立てのレース結果があります。具体的には下の表ですが、これから馬連、馬単、3連複、3連単の当たり目を求めて下さいというものです。但し、条件として馬の平均秒速を16m/sec、ハナは3cm、アタマは30cm、クビ1mとしてと仮定して下さい。

Orient20061126_31002_image002_1

| | コメント (0) | トラックバック (0)

2006年11月26日 (日)

記号の現実  JRAホームページでリアルオッズ提供

     

2006年10月4日にJRAのHP(ホームページ)がリニューアルされましたが、その中でも一番驚いたのが出馬表です。あまり注目されていないのですが、当日の単勝オッズ、当日の馬体重、馬場状態、騎手変更など略リアルタイムで表示されている事です。一般の予想紙に当日の馬体重が載っていると勘違いしている方もいるようですが、そのような情報は当然当日でなければ得られない訳ですし、オッズにしても予想紙に載っているのは想定オッズであってリアルオッズでは有りません。ところが、JRAのHPの出馬表はリアル、即ち現実のオッズな訳です。従って、JRAは自ら究極の予想紙を無料で公開している訳です。

この究極の予想紙であるJRAの出馬表(IPATでは以前から可能でしたが誰でもと言う訳では有りませんでした)の予想パホーマンス(能力)にふれる(解析する)のは、予想を提供する者、特に商用サイトで提供する者に取って、地雷原を強行突破するようなもので、爆死の可能性も高く、多分トライする予想家は少ないと思います。何れにしましても、現在では何方でもレース直前までリアルオッズ並びにリアル人気順位を入手可能な時代になっています。従って今後、予想を提供する者は最低限リアルオッズ並びにリアル人気順位より高い予想パホーマンスを示している事を明示する必要が有るのではと考えています。

より高いパホーマンスである事を示すにしても、例えば先日の天皇賞を全知全能を傾けて徹夜で出した4頭でBOX的中したとして、最終人気順位では4番と7番ですから究極の予想紙に勝ったと言われても困ります。理屈を言い出すと少々難しくなりますが、一般的な理解でも比較するサンプル数が多い方が、その結果の信頼性が高いと言えます。天皇賞の1レースのみでより高いパホーマンスと結論出来るとは言えない訳です。

ただ、広告の常道としてはハロー効果を狙って、良い事は最大限に強調告知して、悪い事は隠蔽するか最小限に告知する。今回のソフトバンクの想定外-通話料無料はこの典型です。しかし、この様な事が通用するとなると、結果的に消費者の利益が損なわれますので、禁じ手である筈です。それでも、日頃、携帯通話料金の高さに悩まされている身に取っては、通話料(メールも)無料は魅力的に感じてしまいますね。トラブルが起きなければ術中に嵌ってしまうところでした。

前置きが長くなりましたが、高いパホーマンスを示すと言っても、1レースや2レースを比較しても意味が無い訳です。出来る限り大きなサンプル数が望ましい訳です。中央競馬の場合最大サンプル数は一日で3個所36レースが最大であり、年間では288回即ち、3456レース(実際には雪や台風あるいは大レースの日程などによりこれより減ります)となります。速度と数量化による予想では全てのレースを予想していますので究極の予想紙、即ち最終人気順位(単勝だけでなく馬連なども含めて)とのパホーマンス比較は全レースを対象に行えます。

2006年10月28日29日の結果表では人気順とした行がJRAの出馬表のパホーマンスを表しています。数量化馬連本線6点は人気順位上位6点との比較であり、数量化1位単勝1点は単勝1番人気との比較です。競馬予想は未来の予測であり、的中率100%とか回収率1000%にはなりませんが、事前予想を提示した過去の実績では人気順位のパホーマンスを上回っている事が判ると思います。また、10月21日から144レースについては個々のレースの予想パホーマンスが判るように単勝・複勝フィボナッチ数列買いに人気順のシート(人気については単勝2番人気を使用、1番人気では的中時配当が低すぎる為)を付けて見ました。

| | コメント (0) | トラックバック (0)

2006年11月25日 (土)

記号の複雑  効率的市場による経済現象から複雑系の生命現象へ

     

馬券は工夫しても儲からない、複勝とかワイドを購入して的中率を上げても回収率はなかなか100%以上行かない。と言った原因にJRAが控除(20%-25%)であることと”大数の法則”によって理論的に儲からないと考えている方が多いと思います。しかし、実際には馬券市場に効率的市場仮説の"weak form”が成立しているからです。特に日本では"プール”(合計)される勝馬投票券数が大きい為、効率化の程度が進んでおり、オッズ並びにオッズから導出された人気順位で過剰利益を得る事は非常に難しいと思われます。

ところで、通常2日間の全てのレース(72レース)を予想し、その予想により各レース馬連6点均等買いして回収率を100%以上に持って行くことは極めて難しい事です。単勝1点買いでは不可能に近い事だと思います。速度理論と数量化による予想では、2006年11月4日5日の全てのレース(72R)予想して馬連6点でも単勝1点でも回収率100%以上を達成しています。また集計を開始した8月以降の全960レースを平均しても馬連6点、単勝1点ともに回収率100%以上を達成しています。また的中率は馬連6点約33%、単勝1点は約25%とバランスが取れたものになっています。即ち、必勝状態にあるとも言える訳です。

全レース予想して回収率を100%以上に持って行くことが出来るのであれば、もっと高い的中率並びに回収率が得られるように厳選予想が、さらに絶対的中する予想を提供出来るのでは考える方も多いのではと思います。しかし、速度理論と数量化による予想をもってしても、このような厳選予想あるいは絶対的中(絶対と言っても95%以上とかですが)する予想は不可能です。もっと言えばこのような予想は存在していないのです。厳選予想や絶対的中予想は夢(幻想)を売る手段である訳です。

厳選予想がたまたま成功して高い的中率、高い回収率を得られてたとしても、厳選予想の試行回数が1000回に達しても回収率100%を果たして維持出来ているでしょうか?何れにしても、回収率100%を超えるとしても、収束していると思われる試行回数(多分1000レース以上)行って回収率が140%とか150%とか得られる訳では無く、せいぜい数%です。速度理論と数量化による予想をもってしても104%から106%です。約4ヶ月間で100万円の元手で5万円の利益しか得られない訳です。

馬券の買い方としては普通は1レースづつ個別に考え自信度(主観的であれ、オッズに支配されるにしても)によって買い点数を増減させたり、あるいはどのオッズの馬券が的中しても利益が出るような資金配分を行います。しかし、往々にして、その予想したレース自体が外れる事(当たり目を含んでいない)を念頭に置いていない気配を感じます。馬連6点を基準にすれば、概ね66%のレースは外れる訳です。何れにしろ、難しい考察を後にして、意外ではあるかも知れませんが、外れる事を前提(前提にしないと言われればそれまでですが、外れない予想は存在しないと考える方が自然と思います)にした場合、均等買いが多分最大利益収束点と思われます。そして究極は1点買いが最大利益が得られるものと考えます。

| | コメント (0) | トラックバック (0)

2006年11月20日 (月)

記号の改善 イプラトロピウムによる改善は無い

     

以下の文献抄録はイプラトロピウムを健康な馬に、運動30分前に吸入させ、肺機能などが向上するか調べてものですが、結果は運動能力は改善されなかったと言う事です。

詳しい内容の入手はこちらへ

Equine Vet J 33: 302 - 310 2001
Effects of inhalation of albuterol sulphate, ipratroprium bromide and frusemide on breathing mechanics and gas exchange in healthy exercising horses
Bayly, W. M., Slocombe, R. F., Schott, H. C., Hines, M. T., Sides, R. H., and Hakala, J. E.
Department of Veterinary Clinical Sciences, Washington State University Pullman, USA

The possibility that pre-exercise inhalation of a bronchodilator by healthy horses could improve their mechanics of breathing and enhance performance was investigated. Ipratropium bromide (0.35 microg/kg bwt; n = 7) was administered by nebulisation 30 min before exercise and frusemide (1 mg/kg bwt; n = 6) was given in the same manner 2 h before exercise. Albuterol sulphate (360 and 720 microg; n = 7) were administered with a metered dose inhaler 2 h before exercise. Each drug was investigated independently of the others using cross-over protocols. Horses completed incremental exercise tests and oxygen consumption, carbon dioxide production, arterial blood gases, heart rate and measures of breathing mechanics including total pulmonary resistance (RL) and nasopharyngeal resistance (RU) were determined for each exercise intensity. The resistance of the lower airways was calculated subsequently from the difference between RL and RU. None of the drugs tested had an effect on any of the variables measured, possibly because maximal bronchodilation is stimulated in healthy horses by the normal sympathoadrenergic response to exercise. Therefore, the pre-exercise inhalation of a bronchodilator by a healthy horse is unlikely to improve performance capacity

| | コメント (0) | トラックバック (2)

2006年11月17日 (金)

記号の乾草  対症療法

     

CHRONIC OBSTRUCTIVE PULMONARY DISEASEに記されているものの大意は馬の喘息の原因は人間と同じく空中に浮遊するダストを吸い込んでアレルギー反応を示すもので、Ipratropium bromide (Atrovent)はアレルギー症状を抑える為に用いるものであると言う事です。

馬の場合、アレルギー反応の原因となるアレルゲンは何かと言うと乾草に含まれる微生物(バクテリア、黴、胞子など)ないし微生物の死骸です。これらが鼻から吸引され気道ないし肺でアレルギー反応(炎症)を引き起こす訳です。従って、根本的な対策はアレルゲンの除去、具体的には乾草あるいは敷料のアレルゲンを含まない物への交換です。

これから考えるとデープインパクトの調査結果の7の中の”それら敷料、乾草を入れ替えずに放置し”た理由が不明です。Ipratropiumの作用機序を理解せず、微生物を殺す殺菌作用が効能であると誤解したならば分からん訳では無いですが、もう少し合理的、論理的説明が必要かと思います。

| | コメント (0) | トラックバック (0)

2006年11月16日 (木)

記号の薬物  CHRONIC OBSTRUCTIVE PULMONARY DISEASE

     

ディープインパクトの処分は残念な事ですが、CHRONIC OBSTRUCTIVE PULMONARY DISEASEにIpratropium bromide (Atrovent)の詳しい作用機序が載っています参考になれば幸いです。なお 馬のCOPDには異論が有り、現在では若い馬の非化膿性疾患についてはIAD(Inflammatory Airway Disease)が使われているようです。

| | コメント (0) | トラックバック (0)

2006年10月28日 (土)

記号の薬物  治療的な投薬の限界値

     

ディープインパクト号の尿から喘息の治療薬イプラトロピウムが検出されたとして大きな問題になっていますが、今回はこの検出と言う問題にふれて見たいと思います。以前、二重盲検(ダブル ブラインド)の説明に関連して一千兆分の一?で検出限界の事を書きましたが、現在ではいかなる化学物質も検出されてしまう事になります。欧州では「生体中で生成されないあらゆる物質の検出」がダメとなると、現在の環境の中で化学物質に暴露されていない馬は存在しえないと考えられますので、その気になれば全ての馬から化学物質を検出できる事になります。この検出感度が高すぎると言う問題は、10年以上前に議論されています。以下は”Equine Disease Quarterly Vol.3,No.3(1995年4月号)”からの引用です。

--------------------------------------

治療的な投薬の限界値 

 競馬界にELISA(酵素結合免疫測定法)検査が導入されるようになってから、馬の薬剤検査における精度が劇的に向上した。効力の強い、不法な薬剤の検出には、精度の高い検査を行なうことが必要不可欠だが、そのような検査技術が合法的な投薬治療の形跡を発見するために使用する際には、いくつかの問題が発生することになる。(中略) 問題は、(中略) 治療的な効果が消滅した後でも、それら薬剤の痕跡がかなり長期間にわたって発見できることは、規制の有効な適用という目的にそぐわなくなり…

--------------------------------------

薬物という言葉が先行してしまっていますが、今ひとつ科学的に論理的に考えてみる必要がありそうです。

| | コメント (0) | トラックバック (1)

2006年10月27日 (金)

Multiple Regression with Dummy Variables (Quantitative Applications in Racetrack Betting)

     

You  would like to read this Weblog with English, please use the language tool of google under.

google  translator

| | コメント (0) | トラックバック (0)

2006年10月26日 (木)

記号の失敗 芝からダートへ、1200mから1000mへ

     

夏が過ぎれば秋、そして冬が来ますね。今回は冬にまつわる失敗談です。それは58年振りの大雪に見舞われた2005年12月18日(日曜日)中京8Rで起きてしまいました。前日の夜よりの大雪の為、日曜日の中京の芝のレースがダートに変更され、それに伴い距離も変更されました。具体的には4Rの芝2000mがダート1700mに、8Rの芝1200mがダート1000mに変更された訳です。

従って、まず前日に提供した4Rと8Rの予想の無効をアナウンスしました。ここまでは良かったのですが、無効をアナウンスした時点から8Rまではまだ時間があると思い、ダート1000mの条件で再予想を行い、8Rが行われる約2時間前に再予想をアップロードして、予想の有効をアナウンスしたのですが、これが余計な事になってしまいトラブルを引き起こしてしまった訳です。

8Rの予想が外れてくれれば、多分問題は起こらなかったと思いますが、運が良かったのか悪かったのか判りませんが、馬単の万馬券が的中してしまったのです。それも1点目の裏でです。基本的には、翌月曜日に結果詳細をアップロードしなければならないので、結果詳細発表前の何れかの時点でコースと距離の変更をする必要があります。それで当日の事前変更を強行した面もあるのですが、案の定、前日予想と違うと言うクレームが届いてしまいました。

冷静に考えて見ればコースも違い、距離も違いますので、予想も違って当然なのですが、外れている筈の物が的中になっており、さらに1点裏で万馬券的中となればクレームの一つも言いたくなるのも当然とは思います。このクレームには、前述の経緯を説明させて頂き、納得してもらいました。この時の教訓としては一度出したものは、どんな理由があろうとも変更しない方が、信頼は得られると言う事でした。

| | コメント (0) | トラックバック (1)

2006年10月18日 (水)

記号の発生 万馬券の的中発生例

     

20061015050404tekichu_15508_image002 左の表は2006年10月15日の日曜東京の12レースの的中状態を示したものです。

| | コメント (0) | トラックバック (0)

2006年10月17日 (火)

記号の発生 万馬券の発生(的中)メカニズム考

     

万馬券とは100円の勝馬投票券が10000円以上になる事です。即ち、元金が100倍以上になる訳です。従って、万馬券の発生メカニズム(原因)が判れば、非常に素晴らしい事です。多分、多くの方は万馬券の発生には色々な原因があると考えていると思います。例えば、ハンデ戦であるとか、能力がドングリの背比べでどの馬が来るのか判らないとかが考えられます。全ての馬が全く同一の能力であり、且つ全ての馬券購入者が同一である事を理解していれば、16頭立てでは馬連は120通り(15*16/2)になり、的中確率は1/120、即ち1%以下なり、全ての馬連投票券は1万円以上となり万馬券は必ず発生します。

しかし、これでは宝くじと同じになってしまいます。全く偶然性のみに支配される宝くじは、残念ながら予想行為は無意味ですが、競馬では馬の能力には偏りが有り、その偏りを示す情報(例えば勝率など)により予想行為は有効なものになります。競馬では予想が可能であり、有効なのです。

ところで競馬は予想が可能であり、有効であるが故に非常に厄介な性質を示します。オッズ及び人気順位を手がかり(例えば人気馬と人気薄を組み合わせるとか)にする限り、期待値が同一(75%前後)になってしまい利益が出ない状態になってしまいます。

勝率とかタイム解析(巷間に普及している)はオッズとか人気順位には直接関係しないので利益が出るのではと思われるかも知れませんが、オッズ及び人順位を形成するメインストリーム(主役は競馬新聞の予想->ネットの予想)になりますので利益は出ません。何故利益(回収率100%以上)が出ないのかの理由ですが、効率的市場仮説のウイークフォームが成立しているからです。

さて、万馬券の発生理由ですが、一つしか有りません。誰も(1%以下の人しか)その馬が1位になるとは思わなかった、単勝。誰も(1%以下の人しか)その組合せの対象馬が1位または2位になるとは思っていなかった、馬連。誰も(1%以下の人しか)その組合せの対象馬が1位または2位または3位になるとは思っていなかった、3連複。以上の理由は、誰かが本当の必勝法を開発して普及させても不変です。

効率的市場仮説では3つの状態(ウイークフォーム、セミ-ストロング、ストロング)が有る(詳しくはリンクを辿って下さい)とされていますが、状態の作り出す本体は、正しい情報の伝達拡散スピードでは無いかと言われているようです。この考え方は競馬にも適用できそうです。

巷間に流布している競馬予想は、かなり正しい情報であり精度の高いものあり、さらに、勝馬投票を行う人々の大部分に共有(伝達)されています。だからこそ、効率的市場仮説が成立してしまう訳です。

従って、利益を出す為には人と同じ行動をしていてはだめな訳ですが、ならば人とは違う買い方、人気薄を中心買えば良いかと言うと、そうでは有りません。前提として大部分の人が”かなり正しい情報”により勝馬投票をしている訳ですから、単に人気薄と言う理由だけでは、例え万馬券を的中したとしても、トータルではかなり酷い負け組みになってしまいます。

最後に利益を出す方法ですが、あります。勝馬投票を行う大多数の人に共有(伝達)されていなくて、且つ、かなり正しい情報より正しい情報を得る事です。例えば、厩舎からなどのインサイダー情報、異常オッズがインサイダーによるものとして、その馬番などが考えられますが、残念ながら裏(検証)がとれませんので、より正しい情報とは言えません。より正しい情報を得る方法は、まず検証(裏を取る)手段を理解しなければなりません。

| | コメント (0) | トラックバック (1)

2006年10月12日 (木)

記号の新馬  2006年10月7日京都6R新馬戦予想詳細(2)

     

_27411_image002 左の画面は買い目表示画面で結果を反映したものです。数量化予想では、各要因のパラメータ(影響速度)だけでは無く、最終的な買い目まで求めます。数量化分析では目的変数は速度です。速度が求まればタイムに変形できます。個々の馬のタイムが求まれば一義的に買い目が決まります。従って、数量化予想の最終表示は買い目になります。

また、予想順位は的中確率が高い順番です。しかし、的中確率がどのくらいかは考えていません。速度の高い、推定タイム(合計推定タイム)の良い馬(組み合わせ-馬連、3連複)が勝つ(当たる)確率が高いと言う極常識的な考え方に立脚して買い目は算出されています。

| | コメント (0) | トラックバック (0)

記号の新馬  2006年10月7日京都6R新馬戦予想詳細(1)

     

_354_image002 左の画面は馬単132190円が4点目で的中した2006年10月7日京都6R新馬戦の予想詳細です。この画面上段では父馬と母父馬の影響速度が見えるようにしてあります。ただ、影響速度はKm/hrでは無く分速(m/min)に変換してあります。時速ですと影響速度が1km/hr以下になり数字として細かくなりますので、分速、例えば1km/hrであれば1000m/60min=16.7m/minと分かり易い数字となります。

画面下段は過去走が無い事を示しています。”数量化予想の基本は新馬戦”では過去走を直接参照しないとしましたが、それでは具体的にどのように扱われているかですが、全ての過去走は再予想(再予想されるのは速度だけで、その馬が勝ったか負けたかと言う情報は使いません)され、実速度と推定速度の差、即ち、誤差を求めて解析し、新馬と同様に求めた合成タイムの補正に使用しています。過去走がある場合は推定タイムと合成タイムは一致しませんが、新馬戦の場合は推定タイムと合成タイムが一致します。それ故、新馬戦の予想では血統即ち、父馬、母父馬、消失点母(母系)の影響速度が重要な意味を持つ訳です。

| | コメント (0) | トラックバック (0)

2006年10月11日 (水)

記号の新馬  数量化予想の基本は新馬戦

     

_15783_image002 新馬戦の予想が得意だと言う予想家は少ないと思いますし、特にタイムを理論の中心にした予想の場合、新馬戦は過去のタイムが存在しないと言う理由から、予想は出来ないとするスタンスを取るのが普通と思われます。しかし、数量化予想はタイムを扱いながら、新馬戦の予想を苦手とはしません。

数量化予想の、そもそもの基本は新馬戦の予想にあります。数量化予想では”個々の馬の過去走のタイム”は直接的には使用していません。即ち、過去走タイムが多い古馬も一旦は過去走無しとして新馬と同様に扱われます。それでは何故新馬戦が予想できるのか、しかもタイムまでも予想可能なのかですが、理由は血統を”影響速度”として評価しているからです。具体的には父馬、母父馬と消失点母(母系)の現役馬に対する”影響速度”となります。2006年10月7日8日の東京と京都の競馬では全48レース中6レースの新馬戦が組まれていましたので、その数量化予想の結果を左上の表に纏めて見ました。

表中注目して頂きたいのは、6レース全てで着順上位の馬が数量化予想順位上位である事です。数量化予想は、どうも穴馬にフォーカスしているのではと言う印象をもたれる方が多いのでは思います。確かに土曜京都の6Rでは馬単の127番人気132190円をたった4点目で的中していますので、穴馬に焦点を合わせている感じがします。しかし一方、同じロジックベースで土曜京都5Rあるいは日曜東京6Rの本命サイトをキッチリ抑えていますので、穴馬のみを探すロジックでは無い事になります。

もう一つの印象としては、例え数量化理論をベースにしたとしても、予想の最終段階にアナログ的調整(所謂独自特別情報を基に)というか操作が入っているのではと考える方も多いのではと思います。幾ら複雑に組み上げたとしても同じロジックで土曜京都5Rと6Rの的中が同時に得られるとは考えられないと言う事です。

一般論としてアナログ的に修飾された予想は、結果が良ければ、研ぎ澄まされた感性などと評価されるでしょうが、そのような修正は今後の予想に未来永劫維持されるとは思われないのも一般の方の思いではないでしょうか。

言い換えれば、アナログ的修正がたまたま偶然に上手く行って土曜京都6レースのような万馬券が的中しただけで必然の的中では無いと考える事です。従って、そう(偶然)であるならば、特に注目するには値しないと言う結論に至ってしまう?うーん、少し悲観的な考えかたな。

数量化1類、ダミー変数を用いた重回帰分析は、グーグルを検索すれば相当なレベルまでの解説はありますし、大きめの書店に行けば詳しい手法に関する知識を得られます。ソフトウエアとしてはSPSS、SAS、フリーのRなど幾らでも有ります。従って、予想理論に有りがちな理屈の詳細は秘密では無い訳です。

但し、秘密ではない代わりに、思考回路を変更しなければならないかも知れません。例えば種牡馬としてのサンデーサイレンスの価値は中山芝1200mの馬番1と等価である事を認識して理解する必要は有ります。この辺りから理解が怪しくなりますが、特にタイムの感触・概念から速度の感触・概念への思考回路の切り替えは難しいと思います。

| | コメント (0) | トラックバック (0)

2006年10月 1日 (日)

記号の血統 ディープインパクトの速度理論的血統解析

     

Sanndysilence_27903_image002 今日と言うか明日と言うべきかは判りませんが、ディープインパクトがいよいよフランスの凱旋門賞でその走りを見せてくれます。ディープインパクトの強さの根源がどこからくるのか数量化分析によるアプローチをして見ました。

まず、最初にお断わりしなければならないのは、ディープインパクトの自身の強さはディープインパクトの中に発生した遺伝子プールの独自の良い組み合わせによるもので、偶発的なもので先祖から受け継いだものでも、これから出現するであろう産駒のものでもない可能性が有る事です。ここで、お示しするのは数学的モデルと言う仮説に押し込めた場合の事であり、真実は別にあるかもしれない事をお断わりしておきます。

まず第一ディープインパクトはサンデーサイレンスの産駒である事です。これにより、サンデーサイレンス以外の産駒より高い能力を獲得できている事です。母父のalzaoからは上がりの鋭さを受け継いでいるようですが、記号の相関でも示しましたようにペースが遅くなる(出足が遅い)のに寄与しているようです。注目すべきは消失点母(母系)のAltoviscarです。上がりもペースも高い値を示し、特に上がりは記号の相関でも関連性が強く、驚異的な上がりの一つの原因で有るかもしれません。参考として海外G1を勝った地方馬の星コスモバルクの分析表もあげておきますので比較して見て下さい。

| | コメント (0) | トラックバック (2)

2006年9月29日 (金)

記号の複勝  9月23日24日のベンチマークテスト

     

_14455_image002 ベンチマーク考では、9月24日の中山一日だけ示しましたが、これだけで判断できる訳では有りませんので、この日を含めた6日72レースでの結果を左に示しました。馬連、単勝では芳しく無い成績ですが、複勝まで広げた基本的な予想の質は高いのではと思います。

| | コメント (0) | トラックバック (0)

2006年9月27日 (水)

記号の複勝  ベンチマーク考

     

20060927_29586_image002_1 今回から、趣向を変えてみます。今まで予想を事前提供し、さらに的中状態を公開してきました。しかし、予想の提供を受ける側の方に速度理論による予想の質を判断できる材料を提供して来たかと言う観点に立つと問題があるようです。

即ち、予想の質を判断していただく為には、基準となるものを提示しなければいけません。また”基準”は誰でも自由に入手でき、且つ理解し易いものである方が望ましい訳です。競馬予想の予想の質をあらわす基準とは何かと言われると中々適当なものが有りませんね。多分的中率や回収率を使えば良いと思われる方も多いと思いますが、現実には役に立ちません。そこで、パソコンやスパーコンピュータの評価に使われているベンチマークテストの概念の導入を考えて見ました。

比較材料として”数量化1位の複勝”、”最終確定1番人気の複勝”、”最終確定2番人気の複勝”を100円から始まる公比3(100、300、900、2700......)の数列買いで1日12レース目の収支の動きをベンチマークとする事にしました。的中リセットは配当額に係わらず行う事(100円元返しでもリセット)にします。左上の表は2006年9月24日の中山の場合です。”最終確定人気”はJRAの公式ホームページで誰でも確認出来ます。ただ、実際のレースでは最終確定人気は使えないと厳密に考える向きもありますが、締め切りギリギリまで待ってオッズ(人気)を確認する行為は最終確定人気(オッズ)を知りたいが為に行うものですので予想の質を評価する為のベンチマークテストの材料とする事は問題ないと考えます。数量化1位は実は前日固定で変更はありませんので、もし最終確定人気に対して質的に優れるものであれば使い勝手は人気より遥かに良いものになります。

| | コメント (0) | トラックバック (0)

2006年9月21日 (木)

記号の相関   芝とダートとの相関(非カテゴリカルデータ)

     

_15211_image002 競馬の基本的な構造を推測するのに芝とダートでもともと線形(直線)関係を期待できる項目について相関係数を求めて見ました。平均賞金額、レース経験数、月齢(馬の成長は年単位では捉えられない)では高い相関係数が得られ、これらの要因は芝ダートで同じように影響していると考えられます。

レース間隔,、即ち休養期間の長短は上がりタイムに現れると考えられます。母馬の出産馬齢に関しては逆相関になっており、何故なのか(元々関係ない要因なのかも知れません)不明です。騎手年齢は要因としては意味が有るようです。

| | コメント (0) | トラックバック (0)

記号の相関   芝とダートとの相関

     

_4060_image002 競馬の基本的な構造を推測するのに芝とダートで同じ区分(カテゴリカルデータ)となる影響速度の相関係数を求めて見ました。考え方として騎手であれば、上手い騎手はダートでも芝でも高い影響速度が得られ、下手な騎手は逆に芝でもダートでも低い影響速度が得られ、相関係数としては高くでるのではないかというものです。また、各項目(アイテム-騎手、調教師など)における相関係数の大小から、競馬(予想)では何が重要なのか推定してみました。

結果は、やはり騎手が最も影響力が大きいようです。次は調教師となりますが、上がり(後半3F)にのみ影響しているようです。そしてやはり父馬です。上がり、ペース共に大きな相関係数を持っており、とくにペース速度で大きな値となります。母父馬はペース速度で大きな値になり、孫馬には主にスタミナを与えている印象を受けます。最後に、現在検討している消失点母です。これは一般的には母系の評価になります。意外であったのは、上がりの相関係数が母父馬より大きく、ペースの相関係数では逆に小さかった事です。母系はスタミナ(ペース速度)に影響するかと思っていましたがスピード(上がりの切れ)に影響するようです。なお、消失点母を入れたバージョンは現在、調整中です。影響力が最も小さかったのは生産牧場でした。これは、同じ牧場であってもコード番号が違ったりしていますので、生産育成の場が生産牧場(コード)と乖離している可能性が有ります。

| | コメント (0) | トラックバック (0)

2006年9月14日 (木)

記号の原因 理由は不明?

     

20060909010201tekichu_22876_image002 勝つには勝つ理由が有る筈だ。負けるには負ける理由が有る筈だ。

| | コメント (0) | トラックバック (0)

2006年9月13日 (水)

記号の理由 勝つには勝つ理由が!

     

20060902010107tekichu_24529_image002 勝つには勝つ理由が有り、負けるには負ける理由がある。競馬予想で言えば、的中するには的中する理由が有り、外れるには外れる理由がある。と99%とは言いませんが、90%近くの方は、結果があれば原因があると考えていると思われます。

私自身、その昔、微生物を扱っていましたので、その培地を作るのに超純水を使用していました。作り方はは先ず水道水をイオン交換樹脂カラムに通し、脱イオン水を作ります。その後は大変で、確か5回程再蒸留を繰り返し、超純水を得ていました。この行為は実験に錯乱要因が入らなくするためですし、最終的には原因と結果の因果関係を明確にする手立てです。従って、私の基本的思考は原因と結果の間には因果律が存在するものとしています。

しかしながら、原因と結果の因果律を確かめる実験は、考えて見ると予め原因候補あるいは要因候補が厳密に吟味された実験計画に基づくものではなかったかと言う事です。実験の失敗は予め用意した原因候補ないし要因候補の設定の失敗に帰せられていた訳です。

| | コメント (0) | トラックバック (0)

2006年9月 8日 (金)

記号の消失 消失点母2

     

消失点母より。一方、核外遺伝子の代表であるミトコンドリアDNAは競走能力に係わる遺伝子が乗る確率は小さいが、母系では略100%と同じ遺伝子が維持されますので、血統上のキー(Key)となる母の重要性は名種牡馬より上と考えられます。

即ち、10代、20代遡ってキーとなる母を探すのは意味があります。問題なのはどのようにしてキーとなる母馬を求めるかです。今回は、非常にその場しのぎ的ですが、使用している血統データベース上で母系を遡り、母の母が消失した時点の母をキーの母としました。従って、消失点母は使用しているデータベースによって変わります。

ただ、具体的にプログラムを動かしたところ消失点母は小岩井農場の基礎輸入牝馬に行き着き、日本のグランドマザー(キーとなる母)はフロリースカップ(現役馬の約4%が母系子孫)と判りました。その他アストニシメント、プロポンチス、ビューチフルドリーマ-(実際にはReposo)が上位に来ましたので消失点母のロジックは一応成功したものと考えています。

今走っているか、今走っている馬と比較可能な時期が存在する抹消馬のデータによってのみ血統は評価出来るのであって、血統書上に残っている成績は血統を評価する科学的な材料にならない事を理解しなければなりません。

| | コメント (0) | トラックバック (0)

2006年9月 4日 (月)

記号の消失 消失点母

     

競走馬の走る能力が如何なるものか不明あるいは誰でも認める定義が出来ないにしても、遺伝学的重要性は父馬と母馬とを平等に見るべきである事は自明です。

しかし、競馬においては、特に血統については、話題にされるのは父馬が圧倒的に多くなります。理由は産駒の数の差にあります。父馬は評判さえ良ければ、産駒は数百から千頭(サンデーサイレンス)を越すことも可能であり、産駒の残す延べデータ数は数千を越す事も可能であり、その優秀性を示す材料も豊富に得られ、理屈や物語を創生し易いと思います。一方母馬については産駒の数(多くても20頭)が少なく、産駒の残す延べデータ数は制限(100を越す事は殆ど無い)され、理論の材料としては取り扱い難い対象です。

競走能力の実態は良くわからなくても、量的形質すなわち、多くの遺伝子が関与して、さらに遺伝子間の相互作用、また環境(牧場、調教、騎手など)も作用して競走能力が発現するものである事は確かです。

ところで、遺伝するものの実体としては核内遺伝子と核外遺伝子の2つが大きく分けて考えられます。核内遺伝子は、馬の場合、32対64本の染色体に別れて存在する訳です。馬の競走能力に関係する遺伝子は量的に多い常染色体(31対62本)に乗っている確率は非常に高いのですが、競走能力が量的形質として多数の遺伝子(ポリジーン)関与していること、減数分裂時に遺伝子の組替えが起こる事など考えると5代10代を経て同じ競走能力が伝わる事は無いと考えられます。消失点母2に続く。

| | コメント (0) | トラックバック (0)

2006年8月27日 (日)

記号の惑星 冥王星とファミリーNo

     

冥王星がとうとう惑星の座から滑り落ちました。ハッブル宇宙望遠鏡など観測技術の発達、太陽系の誕生シミュレーション理論の高度化などにより、冥王星を理論的なレベルで惑星とする事が不可能になったものと思います。実際には惑星の定義が21世紀になっても定まっていなかったのも原因です。ただ、ロマンを求める一般の人の心の中には冥王星を惑星にと留めるべきとする思いもあるのも事実です。

競馬でもこれと似た事実が有ります。遺伝子、特にDNAに関する分析技術の長足な進歩によりヒトゲノムの塩基配列が解明されましたが、ヒト以外の動物でも解析は進んでおり、競走馬も例外ではありません。特に母からのみしか伝わらない核外遺伝子であるミトコンドリアDNAの研究は進んでおり、

その成果として競走馬の血統書は訂正されるべきと言う科学者が増えています。具体的には3大始祖馬と同じくらい重要な基礎種牝馬(ファミリーNoの元)の半数以上が正しく無い事が確認された訳です。しかしながら、この事実は公式には受け入れられていません。競馬の血統に関しては、占星術師が冥王星は惑星でなければ困ると言った意見が科学者の意見を封殺して冥王星が惑星の位置に留まるような事態が生じている訳です。

| | コメント (0) | トラックバック (0)

2006年8月16日 (水)

記号の速度 第3の候補

   

click="window.open(this.href, '_blank', 'width=677,height=476,scrollbars=no,resizable=no,toolbar=no,directories=no,location=no,menubar=no,status=no,left=0,top=0'); return false" href="http://seedtheory.cocolog-nifty.com/.shared/image.html?/photos/uncategorized/_12393_image002.gif">_12393_image002 ワイドは3着までに入った馬の2頭の組み合わせ馬券です。単純に言えば馬連の3倍当たり易くした馬券ですが、速度理論の予想では馬連とも単勝とも違った的中パターンを示し、さらに、数量化ワイド1位は単純ワイド人気順位1位の的中時配当とは全く違ったものになっています。左のグラフの様に単純ワイド人気順位1位の的中時配当は500円に至る事は殆ど有りませんが、数量化ワイド1位は500円を超え2150円まで伸びます。この性質はリスクヘッジの第3の候補として役に立ちそうです。

| | コメント (0) | トラックバック (0)

2006年8月10日 (木)

記号の数列  フィボナッチ数列エクセル表

     

「fibonacci.xls」をダウンロード _14305_image002 左のファイルはフィボナッチ数列のエクセル表です。ごく単純なものですが、良かったらコピーしてお使いください。また、左の表は2006年8月6日に行われた全36レースにおける数量化馬連本線6点と数量化単勝1点の的中状況です。参考になれば幸いです。

| | コメント (0) | トラックバック (0)

記号の数列  馬連と単勝の非シンクロ

     

_15135_image002 左の表は2006年8月5日に行われた全36レースにおける数量化馬連本線6点と数量化単勝1点の的中状況です。シミュレーションで示しましたようにどちらも高率にプラス計上しましたが、的中状況は殆ど食い違っています。即ち、同期していない訳です。的中(赤)は何れか一方のみ的中した場合を、的中(黒)は両者同時的中を示しています。このようになる理屈は中々説明し辛いのですが、この様な性質は非常に有り難いものです。即ち、同時に進行させれば、お互い(馬連と単勝)にリスクヘッジしあう事になるからです。ただ、上下の振幅が違いますので、単勝の方を100円では無く1000円スタートにすれば釣り合うと思います。なお、小額からのスタートですが、1日-数十万から+数百万円まで上下しますので、あくまでも自己責任でお願いします。

| | コメント (0) | トラックバック (0)

2006年8月 9日 (水)

記号の数列  シミュレーション

     

_14672_image002 2006年8月5日6日の全72Rの結果は速度理論と数量化理論の予想結果としては平凡なものです。しかし、数列買いを適用して見ると、左の表のように非常に高率にプラスを計上します。中でも面白いのは馬連本線6点でマイナスになっても単勝1点ではプラスを計上している事です。逆の場合も有りますが、この現象はリスクヘッジから見ると非常に重要です。後で詳しく検討します。なお、個々のレースの詳しい予想内容はHRPTV5C HOME PAGEのリンクを辿れば得られます。

| | コメント (0) | トラックバック (0)

2006年8月 8日 (火)

記号の速度  数列買い

     

Fivo_16857_image002 このブログでは、実践的な、あるいは即物的な話は意識的に避けて来ましたが、競馬がギャンブルである面からすれば、実際にプラスになるのかどうかは検討するべきかなと思いはじめました。

過去の記事の中の様に本線6点と言う少ない点数で万馬券などの高配当的中できるのであれば、その予想が当たるか外れるかの判別位は簡単に出来るのではと思われている方も多いのではと感じています。しかしながら、万馬券が当たるかどうか高率に区分け出来れば、完全な必勝法になってしまいます。従って、的中不的中の区分けと高配当的中を同時に実現させる事は非常に難しい事で、多分不可能ではないかと思います。

そこで、次善の策として数列による追い上げ法を考えて見ました。的中不的中の区分けは出来ないが、第1Rから順番連続して第12Rまで買えば、例え6点と言う比較的少ない点数でも、どこかで万馬券などの高配当を的中出来ると言うものです。順番に連続して買う事は非常に大事です。第10レースまで外れた事にして第11レース、第12レースを買うと言うのはダメです。

問題なのは、どのような数列買いを使用するかです。基本的には2種類あります。1番目は単純に数列に従って掛け金を増やしていくもの、2番目は数列とさらにオッズを考慮に入れ、掛け金を増減させるものです。2番目は具体的にはオッズが低い本命サイトの場合、的中率も高くなり、ローリスク/ローリターンになるので掛け金を数列より高く設定し、逆に、オッズが高い穴サイトの場合、的中率が低くなり、ハイリスク/ハイリターンとなるので数列より掛け金を低く設定するものです。

ところで、速度理論による予想はオッズとは乖離した的中状況を示しますので、2番目の方法は採用できません。従って1番目の数列の中から選び出す訳ですが、中でも左上に上げたフィボナッチ数列が、掛け金も穏やかにしか上昇しないし、数列の求め方(100,100,200,300,500と前と前前の数字を足すだけで求まる)が単純と言う事もあり、今回は、この数列を利用したいと思います。

| | コメント (0) | トラックバック (1)

2006年8月 7日 (月)

記号の速度  仮説

     

2006080506fibotansho_13065_image001 速度理論による数量化馬連本線6点の的中時配当の分布の形は非常に特殊です。通常の事象は分布の形は色々ありますが、単峰性を示します。人気順位によるものは典型的な単峰性を示しますが、人気を飛び飛びで取ったものは基本的には3峰性になりますが、実際には人気1,2、人気7,8、人気13,14のそれぞれには単峰性で対応しています。

ところが、数量化本線6点に関しては2峰性を示しているようです。この理由ですが、今のところ仮説としては速度理論は競走馬(厳密には馬番)の真の能力を捉えており配当が低い(本命)ところは競馬のプロも含めた一般の競馬ファンも真の競走馬の能力を捉えていると考え、的中のメカニズムは一般的な競馬予想と同じものと思われます。配当が高い(所謂穴)ところは競馬のプロも含めた一般の競馬ファンが真の競走馬の能力を見逃している事を表していると考えます。ただ、どんなところを具体的に見逃しているかは数量化理論をある程度、細かく理解(多重共線性の回避など)しないと中々説明し辛いところが有ります。

この現象は馬連だけでなく単勝の的中状況に、さらに強く現れるようです。左上のグラフは2006年8月5日6日の全72レースの1番人気の的中時配当と数量化1番の的中時配当を比べてたものです。単勝人気1番では的中時配当が300円台が上限ですが、数量化1番では500円を遥かに超し1500円まで伸びています。

| | コメント (0) | トラックバック (0)

2006年8月 3日 (木)

記号の速度  マイニング

     

6_7997_image002 左のグラフの数量化本線6点での万馬券並びに高配当的中頻度は、ある意味信じられないところが有りますが、事実であれば正しく宝の山です。

ところで、今まで速度理論と数量化理論とに分けて説明してきましたが、この二つを統合して表す言葉があります。"データマイニング”と言うものです。

マイニングはマイン(鉱山)を掘ると言う意味で金などの鉱物を探す方法ですが、所謂宝捜しです。その意味的な部分を転用して、有用なデータを宝物に見立てて、それを探し当てる手法をデータマイニングと称したものです。基本的には従来からある手法を寄せ集めているだけで、それほど新規性は有りませんが、競馬予想を組み上げる意味では、踏むべき手順が明示されており、参考になると思います。

| | コメント (0) | トラックバック (0)

2006年8月 2日 (水)

記号の速度  再現性

     

6_7997_image001 速度理論による数量化本線6点の特異なパターンが再現性が有り、維持されるか見たのが左のグラフです。このようになる仮説は当然持っていますが、何れにしろ注目すべき性質だと思います。

| | コメント (0) | トラックバック (0)

2006年7月26日 (水)

記号の速度  速度理論

     

6_4119_image001 速度理論と名前を付けたために、何か難しい考え方が背景にあるのではと思われる方が多いかと思います。しかし、考え方は至って単純なものです。速度の高い(早い)競走馬は速度の低い(遅い)競走馬に勝つ可能性が高いと言う、極々単純なものです。また、具体的に早い馬の勝つ確率を求めるなど複雑な、或いは多分意味の無い事はしていません。もちろん、予測の結果論として何らかの数字が出てくるとは思いますし、その数字を検討する事は意義のある事ですが、予測を行う為に確率は必須なものでは有りません。

予測の対象として速度を選んだのは、その論理性に理由の一つは有るのですが、専ら期待したのは”オッズ”の頸木(変換機能がめちゃくちゃですね)から逃れられるのではと思ったからです。

競馬予想の自己矛盾は"オッズ”に有ります。即ち、"オッズ”の大小に従って-->人気順に、例えば馬連を6点購入した場合、そのレース単位では平均して50%前後(12レース中6レース前後的中)の的中率、回収率は75%から80%を示すと思います。この的中率と回収率は比較的再現性の良いもので、馬券購入者に一種の安心感、これ以上悪くはならないだろう、オッズベースは強固な岩盤に例えられ、この上に色々な工夫を加えれば回収率100%以上で利益が出るのも夢では無いと感じさせるでしょう。

しかし、色々な工夫あるいはロジックを組み上げ100%に届けと試行錯誤を行いもがき続けていて、ふと足元を見ると岩盤だと思っていたオッズベースが足も動かせないような泥田に変容しているのではありませんか。そうです"オッズ”ベースは岩盤であると同時に泥田でもあると言う矛盾に満ちた存在である訳です。

孫悟空がお釈迦様の前から逃げ出し、逃げ果せたと思い、雲間から見える山々を見ると、それはなんとお釈迦さまの指であったと言うお話が有りますが、オッズはお釈迦様の手のひらにも例えられると思います。

ところで"速度理論”は"オッズ”の頸木から放たれたでしょうか、はたまた”オッズ”と言うお釈迦様の手のひらから逃げ果せたのでしょうか?結果は左上のグラフをご覧下さい。

グラフの見方ですが、500~1000は的中時配当が500円以上1000円未満と言う意味です。人気6点は馬連の最終確定人気順位です。人気12781314は人気最終確定順位を1,2番人気、次に7,8番人気、さらに13番14番人気と人気順位を飛び飛びに6点選んだものです。度数は6点で的中したレース数で72レース中で、人気6点では42レース(58%)、数量化6点では28レース(40%)、人気12781314では24レース(33%)が的中した事を示しています。

人気6点は当然ながら的中率が高いです。しかし、的中時配当が1500円以上になる事は殆ど有りません。人気を飛び飛びにチョイスした場合は高い配当は得られるのですが5000円以上になる事は少なく全体として的中数は余り多くはなりません。速度理論による数量化6点は人気基準に比べて非常に特異なパターンを示します。本線6点でも的中時配当が10000円を超える事が多く、この性質が継続するので有れば夢も見られるのではと思います。

| | コメント (2) | トラックバック (0)

2006年7月19日 (水)

記号の数列  モンテカルロ・シミュレーター

     

「MonteCarlo.xls」をダウンロード 最近、数列の性質を利用した馬券法が流行ってきています。しかし、その効果、即ち、儲かるか否かについては、定かでは有りませんが、賛否両論、あるようです。そこで、結論を下す前に、シミュレータを作って見れば面白いのではと思いエクセルで作ったのが左上のファイルです。

今回対象としたのは馬法の方程式ですが、もちろんフィボナッチ、マーチンゲールも対象にできます。今回は面白そうなので馬法にしました。使い方は簡単でDLしましたら、K列全体をコピー、ペーストを繰り返して見て下さい。結果がどんどん変わると思います。シート全体も書き換え可能ですが、黄色の数値ラムダ、オッズ、的中率は書き換えて見ると面白いと思います。的中率は18%ならば0.18を使って下さい。収束させる版は別に作る予定です。

エクセルファイルを再アップしました。再計算はF9でしたね。これを押すと全体が面白いように変わります。1日12レースを10回同時に動かしていますが、的中率18%と言っても、1日12レース単位でみると0%ときも50%ときも有るのが判ると思います。また10回120レースの合計を取る事により、一応の収束具合も確かめられます。

ところで、馬法の掛け金計算は少々面倒ですが、このモンテカルロ・シュミレーターの的中部分をクリアーしてオッズを毎レース上書きし、的中の場合は的中列のレースに対応する場所に1を書き込めば、そのまま運用シートになります。100円で始められる場合いはそのままで宜しいですが、1000円で始められる場合いは10倍するかシートに埋められている100を1000に直して下さい。お役に立てば幸いです。

| | コメント (0) | トラックバック (0)

2006年7月16日 (日)

記号の血統  競走能力遺伝子

     

現在、ミトコンドリの遺伝子に期待して、7代母の影響を調べていますがイギリスで競走能力に関係する遺伝子を確認「Geneticists Identify Speed Gene Combination」と報告されていますので、予測能力の向上になるのではと期待しています。ただ、7代母の生年は1900年代の前半になりますので、記録が正しいかどうかは少し心配です。

| | コメント (0) | トラックバック (0)

2006年7月10日 (月)

記号の騎手  年齢(芝)

     

_18988_image002 見習い騎手あるいは若手騎手、減量騎手など色々表現が有りますが、騎手学校を卒業直後の18歳を最年少する新人の事です。レース経験の少ない新人の騎手は技量が劣るとされ、経験年数と勝利度数により普通の騎手より1Kgから3Kg少ない負担重量となります。しかしながら、技量が劣るとは具体的には何を示すか明確にはされて来ませんでした。そこで、今回、騎手の年齢が競走馬の速度にどう影響しているか調べてみました。左上のグラフのように上がり速度は21歳でベテラン騎手に追いつきますが、ペース速度は年齢とともにダラダラと上昇して行きました。このパターンは競走馬と同じですが、人間の方が成長が遅いのは面白いですね。ペース速度の上昇が遅いのは馬ごみを捌く技量はなかなか身につかない事を意味していると考えています。

| | コメント (0) | トラックバック (0)

2006年7月 1日 (土)

記号の血統   基礎牝馬

     

基礎牝馬の抽出には、苦労しています。先日アップしたデータのみでは、思い描いたデータが抽出出来ません。やはり、現役馬とリンクしないと上手く行かないようです。現役馬とリンクして出した7代母の芝の上がり速度に対する影響度の結果がでました。直接分析結果が得られた148頭の中では1936年生Infra Red、1932年生フォーラン、1928年生Firetop、1933年生Flaming Swords、1927年生Cristar等が高い値、即ち、その子孫は芝の上がりが切れる事になります。子孫の多かったフロリスト、La Troienneはどちらかと言うと低い値になってしまいました。血統論的にはどうなるかは、良くわかりませんが、Firetopの子孫にはニジスキーがいますし、Infra Redは有名な基礎牝馬のようです。フジキセキはInfra Redの母系子孫です。

| | コメント (0) | トラックバック (0)

2006年6月29日 (木)

記号の血統   母の母の母の母の母の母の母の母

     

「FL20060612.LZH」をダウンロード 左のファイルは6月14日までに登録された牝馬の母の母の母の母の母のリストです。馬データには母の母の母までのデータがありますので、このリストとリンクすれば最大8代母の繁殖登録番号が得られます。

データ構造はファイル名(A、B、C)とする時、Aはリストされた頭数、約10万頭ですが、実際の頭数はdo while eofで捕捉して下さい。Bは0,1….11でゼロの母から始まり、1が母の母、2が母の母の母、3が母の母の母の母となり、一応12代母まで格納できるようにしました。Cは、0が繁殖登録番号、1が馬名、2が生年、3が産地、4が父繁殖登録番号、5が母繁殖登録番号です。データ区切りは","ですが、まずワードパッドなどでデータを眺めてからお使いください。

私は7代母の影響を現在調べています。ミトコンドリアに代表される核外遺伝子の影響を捉える事ができれば面白いですね。

なお、ファイルは圧縮されています。解凍後の大きさは約66MBとなります。

ちなみに、7代母でこの3年半に芝コースで出走履歴のある子孫が最も多いのが、1927年生まれの第弐フロリスト、2番目が1926年生まれのLa Troienne、3番目が1919年生まれのフロリストになります。多いと言っても、全体の1%程度です。8代母では3番目に多かったフロリストが1番になり、全体の約2%をしめます。また、フロリストは明治40年の小岩井牧場の基礎輸入牝馬 フロリースカップに繋がるのも面白いですし、近年種牡馬として注目を浴びているスペシャルウイークの母系であるのも興味を引きます。

ただ、今回の分析は、あくまでも7代母に限定したものです。核外遺伝子は母からしか伝わらないものとしているため、本来であれば世代に関係なく分析する必要があります。具体的には8代母にフロリストを持つ子孫と7代母にフロリストを持つ子孫ならびに他の代母のフロリストの子孫を同一に扱う事が必要ですが、ロジックと計算時間を考える一寸大変なので、これからの課題とします。

これからのロジックの考察です。先ず第一にしなければならないのは基礎牝馬の抽出です。思い入れで決めてしまうのも一法ですが、科学的とは言えませんね。例えば、今回アップした牝馬で1985年以後の生年の馬の1代母から5代母までで出現頻度の高い馬を基礎牝馬とする等は一案と思います。何れにしても現役馬の1代から8代母をサーチするにはマスターのマージ等ハードルは高そうです。

| | コメント (0) | トラックバック (0)

2006年6月22日 (木)

記号の賞金   非減算と減算

     

非減算データと減算データが具体的にどのようなものかですが、どんな競馬データベースでも宜しいですが、例えば、2006年6月4日の安田記念(G1)の出馬表を開き、アサクサデンエンをクリックして過去走も合わせて見て下さい。今日(6月22日)の時点では結果が出ていますので過去走は安田記念、ドバイDF、香港マイルと多くのデータベースではなっています。しかし、考えて見れば安田記念の出馬表が欲しかったはずですので、過去走はドバイDF、香港マイルとなっていた方が良い訳ですが、そうはなっていません。従って、この状態で表示されるのを非減算データと呼びます。一方前走が2006年3月25日ドバイDF、前々走が205年12月11日香港マイルになっていれば減算データとなる訳です。

ところで、完全と不完全とは何かですが、例えば前年2005年6月5日の安田記念(G1)のアサクサデンエンをクリックするとします。完全減算ですと馬齢は7歳から6歳に、藤田伸二騎手の年齢も34歳から33歳になど、全てのパラメータが減算される状態を指すわけです。目指したのは完全減算でしたが、前述しましたように収得賞金減算ゼロを達成出来ませんでしたので、残念ながら私のデータベースも不完全減算データベースです。

| | コメント (0) | トラックバック (0)

2006年6月17日 (土)

記号の賞金   減算データベース

     

賞金について少し考察したいと思います。ここでは、競馬の賞金システムについて詳しくふれませんが、競馬データの中での賞金システムについて解説したいと思います。賞金には3種類あります。即ち、本賞金、付加賞金と収得賞金です。この内、本賞金と付加賞金には、各競走馬には累計金額と都度レースにおける金額の両方が有ります。従って累計金額を減算して過去の過去走の累計金額を自由に再構築できますが、収得金額に関しては累計収得金額のみ存在しており、都度レース情報には存在しません。その代わり本賞金からの変換ルールあるいは収得賞金の取り扱いルールが存在しています。

今回の”平成18年度夏季競馬開始時点から4歳以上の全ての馬について、その時点の収得賞金2分の1の額を新しい収得賞金にする”と言うのもその一つであり、過去にも、その時代を反映する変換ルールが存在しています。従って、過去走の減算累計収得金額を得る為には”本賞金からの変換ルール”あるいは”収得賞金の取り扱いルール”をプログラム化しなければなりません。

ところで、表題の減算データベースとは何かですが、例えば、過去のある時点まで視点を戻した場合、その時点より過去のデータは存在するが、その時点より先のデータは存在しないデータベースと言う意味です。そして私が今まで作成し、目指していたたデータベースは完全減算データベースです。完全減算データベースとは、競馬の場合、何かですが、それは過去の出馬表を完全に再構築できるデータベースを意味します。

競馬のデータベースソフトには3種類あると思います。第1は非減算データベースで、これは一番多いと思います。第2は不完全減算データベース。第3が完全減算データベースですが、今のところ存在していないと感じています。

前世紀末、完全減算データベースの作成に挑戦していて最後に残ったのが収得賞金でした。累計収得賞金を色々なルールでプログラム化して減算を行ってもゼロになってくれなかった訳です。減算がゼロにならないのはどうも本賞金から収得賞金への算入ルールに明文化されていないものがあったようです。具体的には地方競馬と中央競馬の間に明文化されないルールが存在しているようです。結局、収得賞金の減算ゼロ達成は諦め、考え方を改めました。

当時も今もそうですが、クラスの概念を使用しない、あるいはクラスは直接には馬の能力には関係しないと考えていましたので、収得賞金の替わりに本賞金を直接使えば良い事に気が付いた訳です。

クラスの定義(振り分け)は馬齢と収得賞金によって行われます。しかし、競馬データ上は実は一般的に使われて500万クラスとか名称は有りません。存在しているのは最若年条件、2歳条件、3歳条件、4歳条件、5歳以上条件と競走条件コード(収得金額を100万円単位並びにオープン、未勝利、未出走、新馬を区別するコード番号)の2つだけです。また、面白い事に今回の変更によっても変更が無い事です。この部分のデータ構造は変化が無い訳です。即ち、構造は変化せず、データ(コード番号の入る位置が変更)のみが変更される訳です。

| | コメント (0) | トラックバック (0)

2006年6月15日 (木)

記号の賞金   賞金の怪

     

このたび実施(基礎データが更新されたのは6月14日)された競走条件制度の変更(平成18年度夏季競馬以降)により、競馬予想に使用する基礎データが大幅に変更されます。なかでも一番大きな変更は収得賞金です。具体的には平成18年度夏季競馬開始時点から4歳以上の全ての馬について、その時点の収得賞金2分の1の額を新しい収得賞金にすると言うものです。これはデータベースに収録されている馬の半分以上にあたります。これだけでも大事ですが、収得賞金の変更に伴い、競走条件区分(所謂クラス)も変更されます。従いまして、基準値の母集団の定義にクラスを用いている場合、今後大きな影響が出るのではと思います。

ところで、数量化理論の場合、過去の記事で解説しましたように収得賞金(本賞金情報を使用)を基礎データに使用していない事、クラスの概念を使用していない事により理論的には、今回の変更の影響を全く受けません。

| | コメント (0) | トラックバック (0)

2006年6月11日 (日)

記号の血統   父馬(ダート)

     

_23622_image001 左のグラフはダートコースにおける父馬の影響速度を求めたものです。サンプル対象は2003年1月より2006年3月までの全ての中央のダートレースです。延べ頭数は77349頭になります。結果はブライアンズタイムが一頭地抜けた存在でした。いかし、サンデーサイレンスも悪くはない父馬でした。サクラバクシンオーは芝でもダートでも同じように驀進する産駒が多いようです。

| | コメント (0) | トラックバック (0)

2006年6月10日 (土)

記号の血統   母父馬(ダート)

     

_28337_image001 左のグラフはダートコースにおける父父馬の影響速度を求めたものです。サンプル対象は2003年1月より2006年3月までの全ての中央のダートレースです。延べ頭数は77349頭になります。結果はMr.Prospectorとブライアンズタイムが優秀でした。Mr. Prospector は父父馬と母父馬の両方で優秀でした。上位15頭の全体に占める割合は30%弱でした。

| | コメント (0) | トラックバック (0)

2006年6月 4日 (日)

記号の血統   父父馬(ダート)

     

_25876_image001 左のグラフはダートコースにおける父父馬の影響速度を求めたものです。サンプル対象は2003年1月より2006年3月までの全ての中央のダートレースです。延べ頭数は77349頭になります。結果はMr.Prospectorの父父馬としての優秀さを裏付けるものでした。Mr. Prospector  の延べ孫馬数は9434頭、サンデーサイレンスの孫駒の延べ頭数は8980頭、Haloの孫馬は3493頭でした。上位15頭の全体に占める割合は約45%でした。サンデーサイレンス並びにHaloのダートコースでの父父馬としての影響度は低いものでした。

| | コメント (0) | トラックバック (0)

2006年6月 1日 (木)

記号の血統   父馬(芝)

     

_21475_image001 左のグラフは芝コースにおける父馬の影響速度を求めたものです。サンプル対象は2003年1月より2006年3月までの全ての中央の芝レースです。延べ頭数は72915頭になります。結果はサンデーサイレンスの種牡馬としての優秀さを裏付けるものでした。サンデーサイレンスの産駒の延べ頭数は5906頭、上位15頭の全体に占める割合は約35%でした。

サンデーサイレンスの父馬として、母父馬として、そして父父馬としての産駒並びに孫馬への影響度は同じでは有りませんでした。特にサンデーサイレンスが父父馬となった場合は、芝の場合マイナス評価をした方が良いかも知れません。一方母父馬になった場合はプラス評価をして良いようです。

サンデーサイレンスの産駒の血統をざっと見てみると、ディープインパクトやフジキセキなどの優秀な産駒の5代血統表にクロスあるいはインブリードが見られない事です。サンデーサイレンスが日本で種牡馬として成功した一因は、日本で供された繁殖牝馬とは5代血統にクロス、インブリードが起こらなかった事によるのではと考えています。

近年POGが流行っているようですが、将来有望な芝POG馬を選ぶのであれば、第1は5代にインブリード、クロスが無い事、第2はサデーサイレンスが父父馬でない事、第3はサンデーサイレンスが母父馬である事が上げられます。また6代以上に名馬がいるかいないかは余り関係ないと思います。

| | コメント (0) | トラックバック (0)

記号の血統   母父馬(芝)

     

_10063_image001 左のグラフは芝コースにおける母父馬の影響速度を求めたものです。サンプル対象は2003年1月より2006年3月までの全ての中央の芝レースです。延べ頭数は72915頭になります。結果は父父馬と比べて頂けると面白いと思いますが、サンデーサイレンスの影響がプラスに出てきました。サンデーサイレンスの孫馬の延べ頭数は1838頭、上位15頭の全体にしめる割合は30%弱となりました。

| | コメント (0) | トラックバック (0)

2006年5月31日 (水)

記号の血統   父父馬(芝)

     

_8889_image001 左のグラフは芝コースにおける父父馬の影響速度を求めたものです。サンプル対象は2003年1月より2006年3月までの全ての中央の芝レースです。延べ頭数は72915頭になります。結果は興味あるものでした。即ち、サンデーサイレンス及びサンデーサイレンスの父Haloの影響が低いとでました。何故低くでたのか、原因はこれから考えますが、サンデーサイレンスの孫馬は延べ10616頭、Haloの孫馬は6716頭、サンデーサイレンスを含む上位15頭の全体に占める割合は50%近くに達しています。

| | コメント (0) | トラックバック (0)

2006年5月27日 (土)

記号の能力 場所と距離と馬番の特性値

     

_19166_image002 左は2003年1月より2006年3月までの芝コースにおける場所(ダービーであれば東京)、距離(ダービーであれば2400m)と馬番の影響速度(上がり速度とゴール前600m地点までのペース速度)をプロットしたものです。どのように利用するかは説明しづらいのですが、東京と新潟の2400mは良く似ていると言えますし、京都の2400mはゴール前600mまではタイムを要するが、上がりタイムは早い傾向があると言えます。

| | コメント (0) | トラックバック (0)

2006年5月22日 (月)

記号の能力 オークス結果

     

_11419_image002 左は2006年5月21日のオークスの結果詳細です。桜花賞の上位3頭が、ごっそり落ちてしまったのは意外でした。桜花賞とオークスの基本的な差、例えば距離差などにもっと注目しなければならないとかあるかも知れません。しかし、アサヒライジングの頑張りには驚きでした。すくなくとも2着に残ってくれれば面白かったですね。カワカミプリンセスの無敗の3連勝を高い評価に出来なかったのも痛かった。

一方、全体としては全72レース本線で回収率155%(的中率28%)を確保出来たのは、なによりでした。不良馬場の最尤値は良馬場を少し説明できたかなと思います。

| | コメント (1) | トラックバック (0)

2006年5月19日 (金)

記号の能力 オークス

     

_28718_image002 左は2006年5月21日のオークスの予想です。全体としては穏当な予想ですが、微妙なのがアサヒライジングの予想順位1位、前回大敗したフサイチパンドラの予順6位などです。ところで、現在、父の父馬にスポットを当てて解析を進めています。驚いた事には、と言うより当然なのですが、父馬、母父馬に比べて圧倒的に数が少ない事です。3年3ヶ月の間では一桁少ないですね。それと当然な事ですがサンデーサイレンスとHaloに集中しています。また、父馬と共線と言うか重なり合い多く、非常に苦労しています。面白い結果でましたら報告したいと思います。何故に数量化で書きましたように、競走馬の能力の発現に多数の遺伝子が関与している事の裏には、能力の発現に意味のある形で影響(量的形質として)があるのは母父、父父まで位(それすら怪しい)で、それ以上の先祖は物語の世界になりますと言う意味になります。

| | コメント (0) | トラックバック (0)

2006年5月18日 (木)

記号の能力 巨大ファイルへの対応

     

今まで、ソフトウエアやプログラムについては殆ど言及しませんでした。理由はプログラム手法について専門的な教育を受けていないからです。また、受け様にも、適当なものが存在しなかったのも事実ですが。競馬データを取り扱うようになって、気が付いたのですが、競馬データは趣味的な興味の対象としては非常に巨大です。競馬データの全てを一元的に同時に扱うにはExcelでは当然ダメですが、データベースソフトであるAccessでもデータ分割しなければ使えない巨大さです。そこで、今回は私の場合どうしているかを紹介したいと思います。

先ず第一はDBソフトを使わない事です。これはDBソフトに限りません。統計ソフトにも言える事ですが、アプリケーションソフトには必ず上限(ハードにも当然あります)が存在している為です。また、経済的な上限もありますね。

第二はFAT32をNTFSに切り替える事、これによりFile数を気にしなくて済みます。具体的にはFAT32ではフォルダ内のfile数の上限は65536個ですので、競走馬1頭に1ファイルを与えますと10万ファイル近くになりアクセス不能となります。NTFSでは上限はたしか2TBですので事実上上限は気にしなくても良い事になります。

第三はクイックソートを使う事です。これにより120万個以上のfilesの整理も一応耐えられる時間以内でこなせます。また、毎回リセットしますので、想定外のデータ不備に強いのとデータ蓄積のロジックに煩わせられないのも利点と考えています。

第四は構造体を上手く使いこなす事です。これにより細かいディレクトリ構造を取らなくても大量のデータを扱えますし、データを常に新鮮に保つのも容易です。構造体は再設計してさらに大きなものにして使用しています。

| | コメント (0) | トラックバック (0)

2006年5月17日 (水)

記号の能力 CPU 82℃

     

現在、私が使用しているPCは2台ですが、先日ルーチン処理で使用しているFaithのホワイト ボックスがMBM5のCPU温度82℃時点で落ちてしまいました。スペックはAthlonXP 2400+ OSはWindows2000、MM 1.5GBです。購入して多分5年目に入っていると思います。このPCは購入後1年直前でマザーボード(ASUS)のコンデンサーが蒸発してしまい、MBを交換してもらい、その後は安定していたのですが、約2年前にHDがクラッシュして、データサルベージを行いました。その後一応落ち着いたのですが、去年の夏頃から頻繁に落ちだしたので、ケースを明け、60cmほどの距離から家庭用扇風機で冷却したところ、つい先日までなんとか動いていたのですが、最初に書きましたようにCPU82℃でダウンしてしましました。そこで、今度は扇風機を20cmまで近づけてみました。そうしたら、CPU温度は高負荷時でも70℃未満を維持して、安定しました。原因はどうもMB、CPUでは無く電源がヘタって来ているようです。そろそろ寿命かもしれませんね。VB6もそろそろ終わりに近づいていますので、新しいPC、新しいOS(Windows Vista)、新しいソフト(VB2005 コンパイルしてネイティブで走るようでのでスピードは期待できそう)に切り替えを考えなけば、でも大変そうです。なお、開発とバックアップはVIPのホワイト ボックス、Pentium4-HT3.2GHz、OSはWindowsXP、MMは2.0GBで行っています。

| | コメント (0) | トラックバック (0)

2006年5月15日 (月)

記号の能力 ヴィクトリアマイル結果

     

_28785_image002 左は2006年5月14日のヴィクトリアマイルの結果です。1着ダンスインザムード予想順位2位(2番人気)、2着エアメサイヤ予順3位(3番人気)、3着ディアデラノビア予順5位(4番人気)とまずまずの予想でした。ただ予順1位、人気でも1番であったラインクラフトが惨敗したのは、一寸理由がわかりませんが、前走,、前々走の残差も大幅プラスですので、調子が落ちてきた訳でもなさそうです。今回は何か予期できない不運に見舞われたのでしょう。

| | コメント (0) | トラックバック (0)

2006年5月12日 (金)

記号の能力 ヴィクトリアマイル

     

_19895_image002 左は2006年5月14日のヴィクトリアマイルの予想です。内容は人気になるであろう馬を予想順位上位にもってきていますので穏当なところです。ただ日曜日は相当馬場が荒れそうです。従って結果に波乱も考えられます。

| | コメント (0) | トラックバック (0)

2006年5月11日 (木)

記号の能力 何故に数量化?

     

競走馬の能力の遺伝及び発現については、最近、正しく認識されるようになって来たようです。Web百科事典のWikipediaの血統理論では所謂血統理論に対して疑問を呈し、競走馬の能力について、まだ実態は判らないが”量的形質”であると指摘しています。また最近ブルーバックスより出版されたJRA競走馬総合研究所編の”競走馬の科学”では競走能力の発現には多くの遺伝子(単一では無い)関与しているとしていますし、また、その発現には遺伝と環境の影響の合計としています。ミトコンドリアDNAについては競走能力への関与はまだ推測の域を出ないが、その分析により”DNAで修正すべき血統書”があることは判っています。ところで何故に数量化ですが、遺伝と環境の影響を分離する為にです。この面での競走馬の研究はまだ進んでいないようですが、強烈な解説としては”集団遺伝学講座”があります。参考になれば幸いです。

ところで、現在多くの競馬データベースソフトが存在しますので、例えばA種牡馬とB種牡馬の勝率などは簡単に求められると思います。ここで競走条件は適当に絞ってA馬の産駒の勝率が35%、B馬の産駒の勝率が30%と結果がでたとします。競走条件(例えば芝1600mなど)は絞って揃えてあるので、勝率35%のA種牡馬の方が遺伝能力値は高いと判断される方が多いと思います。しかし、さらに調べて見るとA種牡馬の産駒の騎手は全走武豊騎手(仮のお話です)であり、B種牡馬の産駒の騎手は全て武豊騎手以外の騎手であると判明したとします。多分この情報が判れば種牡馬の評価は逆転するのではないでしょうか。

| | コメント (0) | トラックバック (0)

2006年5月 9日 (火)

記号の能力 正規分布

     

競馬の能力を指数化して予想を行う場合、非常に重要な事があります。指数化された数値の分布が平均値の左右で均等である事が要請されます。即ち、正規分布でなければならないのです。もし平均値の左右が理由も無く非対称である場合は能力指標としては役に立ちません。具体的には芝の不良馬場の補正値が5となった場合、指数115となった馬は110に、75の馬は70にしなければなりませんが、左右非対称である場合、論理的に破綻します。

正規分布であるかどうかは”正規分布への適合度の検定”等を参照して下さい。しかし、現実のデータでは正規分布であるかどうか判定は非常に難しいと思います。競走馬の能力指数はどうしても低能力側がだらだらしてしまいますが、これを強引に正規化するか否かは極めて主観的な要素が入ります。個人的にはデータが本質的に正規分布が期待されていれば適合度の検定で正規分布が棄却されても正規分布とします。

| | コメント (11) | トラックバック (0)

記号の能力 NHKマイルカップ結果

     

_6498_image002 左は2006年5月7日のNHKマイルカップの結果です。ロジックを僅かに引っ掛けた程度に終わってしまいました。全体(全72R)としては100%を超えたので良しとしましょうか。

| | コメント (0) | トラックバック (0)

2006年5月 5日 (金)

記号の能力 NHKマイルカップ

     

_31010_image002 左は2006年5月7日のNHKマイルカップの予想です。逃げに異能を発揮するサクラバクシンオー産駒のアドマイヤカリフ、天皇賞で外人騎手として特徴を見せたボス騎手が鞍上であるステッキシンスケクンあたりが面白いようです。

| | コメント (0) | トラックバック (0)

2006年5月 4日 (木)

記号の能力 天皇賞(春)結果

     

_21776_image002 左は2006年4月30日の天皇賞(春)の結果です。今回はディープインパクトの強さを捉える事は出来たようですが2位以下は上手く行かなかった。ディープインパクトはサンデーサイレンスの最高で最後の産駒であるとされていますが、左上の表中残差平均を見るとディープインパクトのみ大きな値(11.85)になっています。これはディープインパクトの能力がディープインパクトの背景因子(血統など)によるものでは無くディープインパクト自身による能力が高い事を意味しています。ディープインパクトはひょっとするとサンデーサイレンスの血を繋げる馬では無く、別の次元の競走馬が出現したのではないかとも思います。

| | コメント (0) | トラックバック (0)

2006年4月28日 (金)

記号の能力 天皇賞(春)

     

_25228_image002 左は2006年4月30日の天皇賞(春)の予想です。今回は母父の影響速度が見えるようにしました。ディープインパクトの強さの根源は血統的に見れば母父馬Alzaoに由来すると考えられます。

影響速度の単位はm/分です。具体的にはAlzaoの孫馬(ディープインパクト)はトニービンの孫馬(リンカーンとアドマイヤモナーク)に対してゴール前600mの地点から以後1分当たり約9mの差を着けられるを意味しています。ただ、上がりは600m-35秒前後ですので5mくらいになります。ただし、ゴール前600mまでにAlzaoの孫馬はトニービンの孫馬に1分当たり約2.6mの差を着けられますので、天皇賞の場合(2600m)を考えると少なくとも5m以上には相当します。従って、母父馬のみの能力ではディープインパクトはリンカーン達には相当遅れを取る事になります。何れにしても、血統情報のみで予測は出来無い事を認識して下さい。

| | コメント (0) | トラックバック (1)

2006年4月26日 (水)

記号の能力 騎手の年齢

     

数量化理論では全ての要素を等価であると言う条件から出発していますので、騎手と競走馬を入れ替えても問題ありません。具体的には、今度の天皇賞において武豊騎手がディープインパクト号と言うエンジンでディープインパクト型の車に乗り出場すると考えても良い訳です。

そんな事で、現在、騎手の年齢の影響速度を検討しています。何故年齢なのかですが、始め経験レースを取ろうとしたのですが、地方騎手・外人騎手と中央の騎手との間に不揃いが生じてしまい予想としても不偏性が保てないと考え、一方年齢であれば一応外人・地方騎手にも不公平になら無いと思い採用しました。今のところ途中経過ですが新人騎手とベテラン騎手との差が検出されており、かなり面白い結果がでるようです。また、騎手の年齢を要素に加える事により減量騎手あるいは斤量のカラクリがより一層明らかになるのではと期待しています。

| | コメント (0) | トラックバック (0)

2006年4月24日 (月)

記号の能力 万馬券は2種類有る。

     

_9502_image003 左は2006年4月23日京都10R橘スーテークスと11Rアンタレスステークス(G3)の結果詳細です。橘ステークスは1着セレスダイナミック予想順位2位(14番人気)、2着ウインレジェンド予順1位(1番人気)、3着ナンヨーノサガ予順3位(4番人気)、4着エイシンアモーレ予順4位(2番人気)で決まり、アンタレスステークスは1着ヒフティーワナー予想順位2位(2番人気)、2着ヒシアトラス予順1位(1番人気)、3着サカラート予順3位(3番人気)、4着フィールドルージュ予順4位(7番人気)で決まりました。速度理論と数量化理論による予想内容は両レースとも同じで準パーフェクト(1着から4着までが予順1位から4位に入っており、順番は1着2着が入れ替わっただけ)でした。しかし、大きく違うところが有ります。それは配当です。3連単は両レースともに3点目(本線1第3順)で的中していますが、アンタレスSでは5240円、橘Sでは370790円でした。配当の差は実に71倍あります。

万馬券の1種類目は、偶然性、ランダムネスによるものです。この場合、当然理屈によっては取る事はできませんが、低人気馬を組み合わせて網を張っておけば引っ掛ける事はできます。ただ、どのレースが荒れるのか事前に判りませんので、本命サイドと穴サイドを両方買う必要があります。従って、回収率は望めません。2種類目はオッズを形成する予想が的外れである場合です。的外れと言う事は、的を正確に捉える理屈が存在する事を意味します。

一般に競馬予想の目標にされるのは、どの競走馬が勝つ確率高いのかとか、馬券術としてオッズを如何に上手く処理して回収率を上げるのかとか、さらには投資の手段としてどうなのかを工夫する事と考えられているようです。一方”競馬の記号学”の背景にある考え方は、前述の工夫する事とは無関係です。基本的には、馬番の記号としての能力をより科学的に正確に求めるにはどうすれば良いかだけを考えています。

さらに、71倍の配当の差は、速度理論と数量化理論が真の記号としての馬番の能力を捉えつつある証ではないかとも考えています。ところで現在、第3の万馬券の種類を考えています。その3番目とはカオスです。先日の皐月賞はカオスが原因で万馬券が出現したとも思います。カオスは偶然あるいはランダムネスとは違います。予測の範囲に入って来ます。

| | コメント (0) | トラックバック (0)

2006年4月20日 (木)

記号の能力 情報の爆縮

     

多変量解析の目的とは何かと言うお話です。難しく言うと多次元空間に浮かんでいるデータを情報の損失を最小限にして低い次元に爆縮させる、即ち、大小比較が可能な一次元データに出来れば落とし込む事です。

| | コメント (0) | トラックバック (0)

2006年4月17日 (月)

記号の能力 皐月賞結果

     

_24255_image002 左は2006年4月16日の皐月賞の結果です。1着メイショウサムソン予想順位5位(6番人気)、2着ドリームパスポート予順4位(10番人気)、3着フサイチジャック予順11位(2番人気)と馬連が13980円となる波乱の決着でした。的中とまでしませんでしたが、予想順位4,5ですから、まずまずでしょう。予想順位上位5頭に桜花賞では1,2,3,4着の4頭が、皐月賞では1,2着の2頭が抽出されています。両レースとも18頭のフルゲートであること考えると、この様な結果を連続して得るのは簡単では無いような気がします。

桜花賞では上がり速度能力上位の騎手がそのまま予想順位に反映された形になっていますが、皐月賞では上がり速度能力下位の騎手を予想順位上位に持ってきています。この事は数量化理論による予想が、所謂競馬予想が一般的に持つ傾向とは違っている事を示しているのではと考えています。

| | コメント (0) | トラックバック (0)

2006年4月14日 (金)

記号の能力 皐月賞

     

_7373_image002 左は2006年4月16日の皐月賞の予想です。今回は騎手の能力と過去走の残差が見えるようにしてみました。特に騎手の上がり速度能力に注目して頂ければと思います。皆さんが普段感じている騎手の印象と何処まで合っているかと言う視点で眺めて見てください。

| | コメント (1) | トラックバック (1)

2006年4月11日 (火)

記号の能力 不良馬場の最尤値は良馬場

     

今ここに、過去11戦して1着3回 2着1回、3着1回、5着3回、10着3回の競走馬がいるとします。そして、過去11走は全て芝で内7走が良馬場、1走がやや重、1走が重、2走が不良馬場で有り、3回の1着と2回の10着は全て良馬場であり、不良馬場の時は5着と10着で、さらに、前走が不良馬場で10着に大敗しているとします。

予想対象である今走は、あいにくの雨の不良馬場です。このような場合、たいていの解説者は、この馬には道悪適性が無いとして切ってしまうでしょう。解説者が前走も解説してしていて大敗する様を見ていれば、確信を持って道悪適性が無いと解説するでしょう。さらに解説者がこの馬の蹄の形が不良馬場には向かないなどの薀蓄を加えるような事をすれば、視聴者の多く(前走のシーンを共有体験している可能性が高いと思われます)は、解説者の予想を是とするでしょう。

しかし、印象は薄いでしょうが、良馬場において2回も大敗している事も事実です。この場合の条件の限りでは、最尤値は3/11となります。即ち良馬場を含む全て過去走が対象となります。

少し難しくなりますが、分割表、クラスカル・ウォリスの検定などの正確確率検定を行えば、道悪が不得手と断定できないのですが、この理屈を理解するのは大変だと思います。少し別の方法で説明します。

ここでタイムマシンに乗って、この馬の13走の直前にワープします。やはり解説者は同じ人です。天候も雨で、馬場状態も同様に不良馬場です。只一つ違うのは前走に当たる12走目に鮮やかな逃げ切り勝ちをしているのです。さて解説者の予想は如何に?

ここでは解説者としては前走の不良馬場での大勝を受けて"勝つ”と予想したいところです。また多くの視聴者は、この馬の勝つ事を期待しているでしょう。そこで、また解説者はある一つの薀蓄を思い出しました。蹄の大きい馬は道悪適性があると言う事と、この馬は普通の馬より大きな蹄をしている事を、解説者は自信を持ってこの馬が勝つと予想して前述の薀蓄を披露する事で確信を補強しました。視聴者も多分この予想を信じるでしょう。果たして13走目の結果は平凡に4着に終わりました。ここまでは架空のお話ですが、有りがちなシナリオです。しかし、冷静に考えて見ると、この馬は略3回に1回は勝っている事実だけが残ります。これが尤もらいし事、即ち最尤値になる訳です。

話は少し横道にそれますが、解説者の薀蓄について分析してみます。解説者が根拠にしている情報は基本的には競馬の現場をになう騎手、調教師などから得ているものでしょう。特に、調教師の方は先生とも呼ばれ競馬世界では最も権威があるとされています。従って、その経験から発せられる言葉は非常な重みを持っており、真実だと捉えられてしますものと思われます。

ところで、近年医療の現場ではEBM(Evidence-based Medicine)が標榜されています。日本語に訳すと”根拠に基づいた医療”となりますが、要は権威者、経験者の言う事をそのまま鵜呑みにするのでは無く、客観的な事実(エビデンス)に基づいた医療を行うと言うものです。エビデンスとは何かですが、具体的には無作為二重盲検法をさすようです。

競馬の場合のエビデンスですが、別に作成者が調教師であって無くてもよいですが、過去少なくとも3年以上の不良馬場の全レースにおける馬の蹄の形状と大きさとその時タイムあるいは勝率などが統計学に処理されており且つその形状ならびに大きさの差が意味あるものとされたデータが存在するか否かです。もし、解説者の薀蓄がエビデンスに基づくものであれば信じるに足る事となります。

| | コメント (0) | トラックバック (0)

2006年4月10日 (月)

記号の能力 桜花賞結果

     

_1923_image002_2 左は昨日(2006年4月9日)の桜花賞の結果です。難解レースであった割には1着キッストゥヘブンが予順3位(6番人気)、2着アドマイヤキッスが予順4位(1番人気)、3着コイウタが予順5位(5番人気)、4着アサヒライジングが予順1位(9番人気)とまともな予想であったと思います。特に4着に来たアサヒライジングは、一時逃げ切るかと期待しましたが、残念です。

| | コメント (0) | トラックバック (0)

2006年4月 8日 (土)

記号の能力 桜花賞

     

_18437_image002 左は明日(2006年4月9日)の桜花賞の予想です。速度理論と数量化理論は速度を求めれば、それから先は何とかなると言う訳には行きません。数量化理論では過去走が有る馬も無い馬も同等に扱います。従って、求まるのは個々の馬の能力では無く、例えばディープインパクトであればディープインパクトそのものでは無くディープインパクトに代表されるディープインパクト型の馬の能力です。ディープインパクトそのものの能力を求めるにはディープインパクトが出走した全てのレースを再予想して実タイムとの差を求めて、その差をディープインパクトの能力としています。

| | コメント (0) | トラックバック (0)

2006年4月 4日 (火)

記号の能力 日本競馬のケース

     

_4723_image002 左の表はカシノバズライトの過去2走のデータを解析したものです。日本競馬はデータは豊富ですが、個々のデータがシンクロ(同期)していませんので、非常に扱い難い面もあります。再度、強調しますが”個々の馬の前半3Fタイム”は存在していません。存在しているのレースのラップタイムの一部としての前半3Fタイムです。

但し、個々の馬の前半3Fタイムを推定する方法は有ります。手段としては2通り考えられます。1番目は対応するコーナーの通過順位をそのまま馬身差(具体的には通過順位-1)としてしまう方法です。しかし、この方法は、例えば2位通過で20馬身離されていても1馬身差とされてしまう為、非常に誤差を生じ易く信頼性に欠けます。2番目はコーナー通過順位情報を解析して利用する方法です。この場合、馬身差の大まかな数字が把握できる為、誤差は非常に少ないと思われます。左上のカシノバズライトは2番目の方法で推定しています。

通過順位情報にはさらに面白いと言うか貴重な情報が入っています。4コーナー情報の(8,*7)の解釈ですが馬番7,8は集団を形成しており馬番8の方が内側を走っている事を表しています。*は集団が一位通過馬を含む場合、先頭の馬(このケースでは馬番7の馬)を示しています。勝ったカシノバズライトは3コーナーでは(2,6,11,1,14)となっていますので相当外側を走っていた訳です。VTRでレースを見る事無く、レース展開を再現できる日本の競馬データは凄いですね。

| | コメント (0) | トラックバック (0)

2006年4月 3日 (月)

記号の能力 日本競馬への完訳?

     

_5310_image002 左の表はEl Prado Robの前2走のデータを解析したものです。米国の競馬データ、即ちDRFのデータを”極めて単純”とした割には、長々と複雑極まりない解説をしてきました。単純である理由は一位通過の競走馬にしか公式走破タイム(国は関与していないので正確な表現では有りませんがニュアンスとしてです)は与えられていない事です。言い換えると、フィニッシュライン(ゴール)にせよ、各コール地点にせよ、一位で通過しなかった場合、馬身差(一位通過の馬との)の情報のみしか得られない訳です。

例として挙げたEl Prado Rob号の2004年1月17日Gulfstream Park競馬場の11レース(1700m)の走破タイムは推定するしか得られる方法は有りません。何故この様に日本の競馬の常識からすると不自然なのかですが、実は日本の競馬データの方が世界の競馬から見れば非常識(別の視点からは非常に進んでいる)であるからです。

DRFの最初のページ上には”AMERICA'S TURF AUTHORITY SINCE 1894”となりますので100年以上の歴史があるものと思われます。今ではタイムを計測する手段はいくらでもありますが、数十年から100年前のタイム計測を想定しますと、手動のストップウオッチが使われていた筈です。手動のストップウオッチしか使えなかった時代を考えると同時に多頭数のタイムを個別に計測するのは非常に困難と言うより不可能だったと思います。

そこで一つの便法として、目印になるもの(例えばハロン棒、ゴールポストなど)を一位で通過した馬のみタイム計測し、その他の馬は一位の馬との差を記録したのと思われます。人間の空間識別能力は優れていますし、一時点を写真のように記録できる脳を持った人もいますので、各馬の差を馬身以上に細かく鼻差、頭差、首差まで分解して記録できたと思われます。この伝統が今に引き継がれて生きているのだと感じます。

一方、日本の競馬タイム計測は数十年前に距離と時間がシンクロした写真が開発され、個々の馬の走破タイムが、現在では100分の1秒単位(多分今は1000分の1秒)まで計測できる程進化しており、10分の1秒精度で当たり前のように提供されている訳です。

| | コメント (0) | トラックバック (0)

2006年4月 2日 (日)

記号の能力 MARGINって何?

     

_12009_image002 左の写真はEl Prado Rob号の過去走の右半分です。この表の中で重要な情報は各レースで1着,2着,3着になった馬の名前ですが、それぞれの馬名の後に情報が付随しています。El Prado Rob 号の出走した前走では1着馬Second of June、その時の負担重量122lbs(1lbs-1ポンド約453.6g->約55.3Kg)と2馬身3/4、2着馬はSilver Wagon-120lbs-10馬身、3着馬はFriendsLake-122lbs-1/2馬身で、そしてEl Prado Robは4着でした。

DRFの解説に the margins separating each one と有りますが、MARGINは馬身差で直ぐ分ったのですが、separatingがちょっとピンとこず、戸惑いました。しかし、日本競馬への翻訳トライでEl Pradp Robは先頭から13馬身1/4離されて4位入線となっています。ここで2馬身3/4+10馬身+1/2馬身を合計すると13馬身1/4になります。これでお分かりと思いますが、4位入線したEl Prado Robが一位入線した先頭の馬から離された馬身数13馬身1/4と一致する訳です。分離したとは馬と馬との間の馬身差に分けると言う意味でした。

ところで、米国ではある指数が非常に根強く支持されていますが、理由は多分、米国の一般の競馬ファンにとってもDRFの過去走データを詳しく理解するのは至難の技と言えますので、馬の能力を簡便に示す数値が必須であるからと考えられます。一方、日本の競馬データは初心者に分かり易く、少し慣れれば馬の能力を何となく掴めるのではと思います。従って、日本競馬では指数の導入は新たな混乱要因を招きいれるだけかも知れませんね。

| | コメント (0) | トラックバック (0)

記号の能力 El Prado Rob 号の前々走

_23990_image002 左の写真El Prado Rob 号の前々走はさらに複雑です。レースはAqueduct競馬場で2003年11月29日に行われたコース(Dirt)、馬場状態(fst=早い-良)、距離1mileと1/8mile(約1800m)、レース名Remsen(G2)で11頭立てで行われたものです。なお、当号の馬番は5でした。

距離は約100mしか違いませんが、コール並びタイムの状況ががらりと変わります。コール地点とタイムとがシンクロ(同期)する地点は4つです。

1st call(1/4mile-約400m)地点でのタイムは有りませんが、当号は先頭の馬から1馬身3/4離された5位で通過しました。

2nd call(1/2mile-約800m)地点の先頭の馬のタイムは48.2秒、そしてEl Prado Rob 号は先頭の馬から3馬身離され4位で通過しました。

3rd call(3/4mile-約1200m)地点では先頭の馬のタイムは1分12.2秒、当号は先頭の馬から2馬身1/2離され3位で通過しました。

4th call(1mile-約1600m、stretch call、ゴール前約200m、最後の1ハロン)地点では先頭の馬のタイムは1分37.6秒、当号は先頭から13馬身離された5位で通過、この時も失速していたんですね。

5th call(finish call、ゴール約1800m)地点、即ちゴールでは、一位通過の馬はタイム1分50.6秒でフィニッシュ、El Prado Rob 号は一位から実に17馬身1/2も離され6位で入線した事になります。

| | コメント (0) | トラックバック (0)

2006年4月 1日 (土)

記号の能力 日本競馬への翻訳トライ

_28966_image002 日米の競馬データの本質的差異について理解して頂けたでしょうか。多分、複雑すぎて”いまいち理解できないな”と言ったところだと推察します。横道にそれたついでに、さらにアメリカ競馬データを解析して見ましょう。左上の写真はDRFのサンプルから引っ張ってきたもので、2004年2月14日、Gulfstream Park競馬場(GP)の11レース、1mileと1/16mile(約1700m)-8頭立で行われた筈であるG2-The Fountain of Youthに馬番3で出走したEl Prado Rob 号(古いですね)の過去走データです。

当号の前走データは同じ競馬場(GP)で2004年1月17日、1mileと1/16mile(約1700m)のDirt(ダートコース、日本では砂ですが米国では土コースと言った方が良いかも知れない)、馬場状態fst(早い、良に相当か)で行われた9頭立てのレースG3-HolyBullでのもので、馬番(post position)は2番で参加しています。タイムは当号のものではなく、1/4mile(約400m-1st call)地点、1/2mile(約800m-2nd call)地点、3/4mile(約1200m-3rd call)地点、ゴール(1mileと1/16mile-約1700m)を一位で通過した馬(くどいようですが、一位通過しない限りEl Prado Rob 号では有りません)のものです。ここで重要なのはコール地点がタイムと4地点(1st、2nd、3rd、finish)でシンクロ(同期)している事です。

1st call(1/4mile-約400m)地点のタイムは24秒です。これは、幸いEl Prado Rob 号が2位に頭差を着けて一位通過していますのでタイムは当号のものです。

2nd call(1/2mile-約800m)地点のタイムは48.2秒(日本ではタイムは0.1秒刻みですが米国では0.2秒刻み-小数点以下を表す右肩の小文字は1,2,3,4だけしか使用されません)です。2nd callでも当号が2位に半馬身差を着けて一位通過していますのでタイムは当号のものです。

3rd call(3/4mile-約1200m)地点のタイムは1分12秒4ですが、これも当号は2位に頭差着けて一位通過していますので、タイムは当号のものです。

4th call(stretch call-ゴール前1/8mile-ゴール前約200m-最後の1ハロン)ではタイムはありませんが、当号は3位に後退して一位通過の馬に5馬身もの差を着けられています。この時点で当号は失速していた訳です。

最後の5th call(finish、ゴール)では、さらに悲惨で1分43秒で一位通過した馬から13馬身1/4もの大差を着けられ4位に敗れた訳です。

| | コメント (0) | トラックバック (0)

2006年3月30日 (木)

記号の能力 FRACTIONAL TIMESって何?

     

_26954_image002 左の写真は現在の”POINTS OF CALL AND FRACTIONAL TIMES”です。多分…。それで、FRACTIONAL TIMESとはなにかですが、これは単純に通過タイムと訳すべきでしょう。具体的には対応する(対応しない場合もあります)コールポイントを先頭の馬が通過したタイムとなるわけです。コールポイントとはなんでしょうか、これはスタート地点あるいはゴールからのある距離を示す地点の事で、単位はマイル(mile=約1600m)となります。各コールポイントの呼び名はスタート地点は1st call(1mile以上のレースは1/4mile-約400m-地点または1/2mile-約800m-地点がファーストコールになります)または start call(発馬機から出て直ぐの各馬の順位、1mile以上のレースにはスタートコールは有りません)、次からは2nd call、3rd call、4th call またはstretch call(ストレッチ コール=ゴール前1/8mile=ゴール前約200m=最後の1furlong(ハロン))となり、最後は5th call 即ちfinish(ゴール)になるわけです。

各コールの情報とは各馬番(post position)の通過順位と一位通過した馬からの差(margin)を馬身(length=8 feet=約2.4m)単位で示したものです。fractional times、即ち、先頭の馬の通過タイムは全てのcall(コール)に有る訳では有りませんが、コール地点と対応が取れる場合”通過順位情報”(順位と馬身差)と”通過タイム”はシンクロ、即ち、同期しています。日本競馬データの場合、”通過順位情報”(コーナー)と”通過タイム”(ラップタイム)は全く同期していません。この点が日米の競馬データの原理的差であるわけです。米国データは直感的には分り難いが、個々の馬のラップタイムに近いものが得られる点では日本競馬データより優れているとも言えます。.

ようやく”個々の馬のテンの3Fタイムは存在しない”に繋がりました。アメリカ競馬の横道にそれた理由がこれです。

| | コメント (0) | トラックバック (0)

2006年3月29日 (水)

記号の能力 POINTS OF CALLって何?

     

Points アメリカ競馬データには驚く事が少なくとも二つ有ります。日本では競馬に少しでも興味を持ちだされた方でも知っていると思われますが、日本の競馬データには競走馬の馬体重が載っていますし、レース数時間前には必ず当日の馬体重が発表され、前走からの馬体重の増減に一喜一憂されてるものと思います。期待の馬が前走より10Kgも減っていれば大丈夫かと疑ってしまいますね。ところが、驚く事にアメリカ競馬データには過去の馬体重の記録は一切有りません。当然当日の馬体重なども発表されていないと思われます。アメリカの予想ロジックには馬体重情報は組み込まれていないのです。

二つ目は、もっと驚く事です。競馬に少し慣れれば、誰でも、これはと思った競走馬が過去にどんな距離をどんなタイムで走破したか知りたくなるのは自然です。そして日本の競馬データには全ての馬について過去に走っていれば走破タイムと上がりタイム(ゴール前600m地点から掛かったタイム)が存在しています。ところがアメリカ競馬データには個々の馬の走破タイムが殆ど存在していません。日本競馬の常識からしたら全く信じられない状況な訳です。

それでは、アメリカの競馬データ、タイム構造はどんなものでしょう。印象を言えば”極めて単純”であると同時に”非常に複雑”であり、”素晴らしく遅れている”と言えるでしょう。左上は1992年当時の"POINTS OF CALL AND FRACTIONAL TIMES IN PAST PERFORMANCES”の写真ですが現在は少し違うようです。POINTS OF CALLは日本語では”通過順位情報”と言ったところですが、定義は非常に複雑です。

| | コメント (0) | トラックバック (0)

2006年3月28日 (火)

記号の能力 アメリカ競馬の怪

     

Drf19920720 ドバイにおける日本の競走馬の活躍は素晴らしいですね。日本の馬券市場は米国の2倍近く有り、近来、その規模に見合う能力を身に付けて来た事を実感します。今回は、少し横道にそれますが、アメリカの競馬予想にふれて見たいと思います。左上の写真は少々汚いですが、1992年7月20日、シカゴの街角で購入したDaily Racing Formです。アメリカではどうも、予想紙としてはDRF一紙だけのようです。またその内容は現在(2006年)でも全く同一と言って良いくらい変化していません。

表題の”アメリカ競馬の怪”は、正確にはアメリカの競馬予想理論の翻訳の怪という事です。即ち、英語のアメリカ競馬予想理論が日本語のアメリカ競馬予想理論になっているだけで、果たしてアメリカ競馬が日本競馬になっているかです。具体的にはアメリカ競馬データが日本競馬データとして読めるかです。DRFには”DETAILED EXPLANATION OF DATA IN PAST PERFORMANCES”と言う目が痛くなるほど小さな又品質の悪い文字で書かれたA3のページ有ります。日本語では”過去走データの詳しい読み方”と言ったところです。ここに回答があるようです。

| | コメント (0) | トラックバック (0)

2006年3月26日 (日)

記号の能力  コーナー通過順位

     

個々の競走馬のラップタイム分析は不可能としましたが、終始逃げて勝った馬のラップタイム分析は可能ではないかと思われる方もいるかも知れません。しかし、これはVTR等他の手段で確認できただけ有り、提供データのみでは確認できません。確かにコーナー通過順位が別に提供データとしてありますので、これと合せれば、少なくとも、逃げた馬は、例えば、①①①となっていますので、確認できるではないかとの見方です。しかし、厳密には、ラップタイム計測とコーナー通過順位はシンクロしていません。即ち、ハロンタイム計測時に一位で通過していたかは保証していない訳です。

しかしながら、競走馬は時速にすれば60Km/hr以上、秒速で言えば毎秒16m前後で高速で動いています。従って、コーナーとハロンタイム計測地点が近い場合、ハロン通過順位(馬番・馬名不明)とコーナー通過順位(馬番・馬名特定)は略一致すると考えて90%以上正しいと考えられます。ここまでくれば、思いつくはずです、個々の馬の前半3Fタイムの推定方法がです。

正確には、各競馬場の各距離のスタート位置とコーナーまでの距離を調べないといけませんが、レースの前半3Fタイム計測地点とコーナーとの関係は容易く分ると思います。そこで、乱暴ですが、通過順位を1馬身と見なして、例えば、対応するコーナーの通過順位6位で、レースの前半3Fタイムが36.0秒の場合、6馬身1秒と言われていますので、6位の馬の固有の前半3Fタイムは37.0秒と推定できます。さらに、最近では各コーナー順位を()集団、=大差、-小差、*先頭などの記号で表されており、もう少し精度の良い個々の馬の前半3Fタイムが得られるものと考えています。

おな、1200m未満の距離(1150m)、前二桁が奇数の距離(1300mなど)では前半2.75Fになったり2.5Fになったりする筈ですが、実際そのような表記がされているでしょうか。

| | コメント (0) | トラックバック (0)

2006年3月25日 (土)

記号の能力 ラップタイム考

     

_26489_image002 個々の競走馬のテン、即ちスタートして600m地点まで掛かったタイム(前半3Fタイム)は存在しないとしましたが、レース単位では存在(提供)しています。それはハロンタイムあるいはラップタイムと呼ばれる物です。ただ、問題なのはタイム構造が非常にトリッキーに出来ている事です。

左上のグラフは、ハロン(200m)タイムが12.0秒の仮想の芝1600mのラップタイムモデルです。具体的には12.0-12.0-12.0-12.0-12.0-12.0-12.0-12.0となっており、12.0秒が8回繰り返す構造にしてあります。また、横棒の中の数字は個々の馬が12秒間に走った距離(m)を示しています。もちろん架空の数字ですが、個々の馬のラップがレースのラップと全く一致していないのが見て取れるようにしています。

レースとしてはラップは12.0秒と非常に平坦ですが、勝った事にしたA馬は最後にすごい足を使った事(9.1秒は在りえませんが)にしていますが、8ハロン目以外は非常に遅いラップタイム(平均12.4秒)であった事になります。この様にレースのラップ分析と勝った馬のラップ分析は全く違ったものになりますが、現行の提供データでは勝った馬(個々の馬)のラップ分析は不可能です。不可能な理由は提供されたハロンあるいはラップタイムは200m毎に計測した馬番(馬名)が特定されない1位通過馬のタイムしか与えていないからです。

グラフに示した仮想ラップタイムモデルでは200m地点ではH馬が1位通過(12.0秒)、400m地点ではG馬(24.0秒)が、以下600mF馬(36.0秒-レースの前半3Fタイム)、800mE馬(48.0秒)、1000mD馬(1分0.0秒-レースの後半3Fタイムの起点)、1200mC馬(1分12.0秒)、1400mB馬(1分24.0秒)、ゴールの1600m地点ではA馬が96秒(1分36.0秒)で1位通過した事にしています。ゴール地点では馬番(馬名)が特定されますが、それ以外の地点では馬番が特定されないデータが提供されている訳です。このモデルではレースの前半3FタイムはF馬の通過タイムになり、1000mD馬の通過タイムとA馬のゴールタイムとの差36.0秒がレースの後半3Fタイム(上がり)なるわけですが、提供データにはD馬またはF馬が具体的に馬番何番の馬かは記されていません。因みにA馬の固有の後半3Fタイム(上がり)は33.9秒となります。

| | コメント (0) | トラックバック (0)

2006年3月23日 (木)

機械仕掛けの馬を走らせるな!

     

競馬を数的世界でハンドリングしよう(取り扱おう)としている者が言うのも変ですが、私がここまで興味を維持できたのは、競走馬が生き物すなわち生物学的存在であるからです。もし、機械仕掛けの馬(同時に機械仕掛けの人間)が走る事になれば、興味を無くすでしょう。理由は簡単です。理論的確率が同一になってしまう事、確率が人に操作されてしまうからです。

「予想が出来る」事に危機感を感じるのは、競走馬を、騎手を「博打の駒」と考えてしまうことが、「機械仕掛けの馬」を受け入れてしまう事態になるのではと言う事です。現に米国では「機械仕掛けの馬」そのものではないですが、競馬の未来を「スロットマシーン」に託してしまう動きも出ています。競走馬を生物学的存在であるとした視点からの予想理論は、米国にも日本にも残念ながら存在していませんでした。

私がしようとしている事は競馬を生物学的視点で、人間を認知科学的視点で捕らえようとする事です。また、この事から物語りも夢もロマンも発生し得るとも考えています。

| | コメント (0) | トラックバック (0)

2006年3月18日 (土)

記号の能力 個々の馬のテンの3Fタイムは存在しない

     

_14307_image002 本書のサブタイトルとしました”競馬の記号学”の元になった競馬予想は馬の能力を予測するものでは無く、記号としての”馬番の能力”を予測するとしましたが、これを具体的な数字で示したものが”さらに進化した標準速度解析”の各記事(グラフ)です。

まず、各競馬場の各距離・馬番の特徴を解説する前に、左上のグラフに注目してください。グラフは非常に単純なもので芝の各距離を横棒グラフにしただけです。ところで日本では競馬において個々の競走馬のタイム情報として提供されるのは全ての距離(テン3F+中間+上がり3F)を走破した場合のタイム(1.12.0とか)とゴール前600m(後半3F)からゴールまでの上がりタイム(36.0とか)の2つのみです。

一般の競馬ファンが良く勘違いしている事ですが、個々の競走馬のテン(スタートから600m地点までの)の前半3Fタイムは1000mの前半2Fタイムと1200mの前半3Fタイム以外は存在(芝の場合)していません。何故、一般の競馬ファンが勘違いしたかといいますと、一部の競馬新聞あるいはサイトに載っているからです。しかし、競馬用語解説をよく調べてみますと、前半3Fタイムは(コーナーの)「通過順位から計算しました」と明記されています。即ち、個々の馬の前半3Fタイムは個々の馬の後半(上がり)3Fタイムと等価なものでは無い訳です。従って前半3Fタイムは有用な情報ではありますが、タイム理論などを構築する時に用いる基本データとしては使用できない事になります。

| | コメント (0) | トラックバック (0)

2006年3月16日 (木)

さらに進化した標準速度解析 芝2005年

     

SibaItemCategory200301N20060305_14924_image002 芝の2005年の標準速度です。

| | コメント (0) | トラックバック (0)

さらに進化した標準速度解析 芝2004年

     

SibaItemCategory200301N20060305_11210_image002 芝の2004年の標準速度です。

| | コメント (0) | トラックバック (0)

さらに進化した標準速度解析 芝2003年

     

SibaItemCategory200301N20060305_8937_image002 芝の2003年の標準速度です。

| | コメント (0) | トラックバック (0)

2006年3月15日 (水)

さらに進化した標準速度解析 芝2000m

     

SibaItemCategory200301N20060305_2778_image003 芝の2000mの影響速度です。採録期間は2003年~2005年です。対象は全てのレース、解説は後ほど

| | コメント (0) | トラックバック (0)

さらに進化した標準速度解析 芝1600m

     

SibaItemCategory200301N20060305_30642_image003 芝の1600mの影響速度です。採録期間は2003年~2005年、対象は全てのレースです。解説は後ほど

| | コメント (0) | トラックバック (0)

さらに進化した標準速度解析 芝1400m

     

SibaItemCategory200301N20060305_27896_image003 芝の1400mの影響速度です。採録期間は2003年~2005年、対象は全てのレースです。解説は後ほど

| | コメント (0) | トラックバック (0)

さらに進化した標準速度解析 芝1200m

     

SibaItemCategory200301N20060305_16055_image003 芝の1200mの影響速度です。採録期間は2003年~2005年、対象は全てのレースです。解説は後ほど

| | コメント (0) | トラックバック (0)

さらに進化した標準速度解析 芝1000m

     

SibaItemCategory200301N20060305_10336_image003 芝1000mの影響速度です。採録期間は2003年~2005年の全てレースです。解説は後ほど

| | コメント (0) | トラックバック (0)

2006年3月10日 (金)

競馬の記号学 本書について

     

“競馬の記号学”の解説対象である速度理論並びに数量化理論による競馬予想のプログラムは前世紀末に略完成しており、現在(2006年3月)まで中央競馬の全てのレース(新馬戦、障害、JCも例外とせず)の予想を行いました。予想の提示形式は極めてシンプルなもので、買い目を直接(馬連10-11など)示し、的中確率の高い順番(本線1~6点目などとして)に並べました。

予想実績につきましては、本書、五章 効率的市場仮説p27-p30でご紹介しましたように、2005年7月16日より9月4日の間に行われた中央競馬の全てのレース(576R)を平均すると、馬連本線6点は回収率146%、的中率32%、3連複本線7点では回収率169%、的中率19%を示しました。また、本書には直接収録しなかったですが2005年7月16日2回函館1日目の第12レース芝1200mでは3連単661360円を1点で、続く2005年7月17日2回新潟2日目の第10レース疾風特別では3連単654460円を4点で的中しています。従いまして、速度理論並びに数量化理論による競馬予想は必勝状態にあった訳です。

しかしながら、この様な状態(必勝)は"競馬の常識"からは信じられませんので、現実に起こった事であっても、たまたまの"偶然"として片付けられると思われます。ただ、この状態(必勝)が真実であるならば、"偶然"とするには期間が長いようですので、的中あるいは回収率には何らかの"理屈"あるいは"理由"が存在しても良いとも考えられます。

ところで、私は今までこの"理屈"あるいは"理由"に直接言及しませんでした。言及しなかったのには、いくつかの理由がありますが、最大のものは“競馬の常識”、なかんずく“競馬予想の常識”を捨てて頂かないと理解に結びつかない事です。言い換えると“因果律”の誤謬あるいは虚構に気が付いて頂きたいという事です。

物事には結果があれば原因が必ずあるとするのが因果律ですが、この場合、結果が一つであるのは自明ですが、誤謬は、往々にして、結果が一つであるから原因も一つ(あるいは限定された少数)であるべきだと考えてしまう事です。競馬で言えば、勝ったあるいは負けたのには理由が有り、その原因が一つ(あるいは限定された少数)であると断定してしまう事です。実際には、原因は無数(当然複数の原因が交絡する場合も含みます)に有り、その一つ一つは確率の雲の濃さである訳です。しかし、このような表現は解り難い事もありますが、理屈を理解する困難さ以外に、もう一つは物語性あるいはロマンを紡ぎ出すのが非常に難しい、不可能に近い事です。即ち、原因は一つ(あるいは少数)である方が物語性あるいはロマンまたは事件の創生に都合が良く、読み手に取って理解し易いからです。

因果律の虚構の創生(思い入れ、思い込み)はエンターテイメントとしては、許される事ですし、競馬はエンターテイメントそのものですから、許されて当然です。しかし、もし、この事(因果律の虚構の創生)に疑問を持ち、回答の一部を得たいならば、本書を一読する事をお勧めします。また本書を踏み台として、例えば、カオスニューラルネットワークなどの理解に至れば私に教えて頂ければと思います。

                                                                                                               2006年3月
                                                   HRPTV5C

| | コメント (0) | トラックバック (0)

2006年3月 8日 (水)

競馬の記号学 目次抜粋

     

目次抜粋

1章 競馬(予測可能なギャンブルである、性善説など)
2章 予測と予想(旧石器時代の神の手、記号の能力の予測など)
3章 速度理論(能力は速度である他)
4章 数量化理論(交互作用他)
5章 効率的市場仮説(期待値は同一他)
6章 勝率・連対率(競馬予想に勝率・連対率は役に立たない他)
7章 血統・生産牧場(血統論がトンデモな理由他)
8章 騎手・調教師(脚質は誰のもの他)
9章 クラス(クラスは存在しない他)
10章 天候・馬場状態(天候と馬場状態は交絡する)
11章 標準馬(基準タイムは存在しない、幻の標準馬など)
12章 多頭数と内枠外枠の有利不利
13章 負担重量(ハンデには二面性がある他)
14章 馬体重
15章 ローテイション
16章 ブリンカー(馬は馬ごみを好む他)
17章 人気に応えた次走は(馬は慢心するのか他)
18章 前走の走行パターン(逃げるのは疲れる他)
19章 母馬(グレートマザーを探せ他)
20章 競馬の見方(スローペース症候群他)
21章 1978年の競馬予想プログラム

| | コメント (0) | トラックバック (0)

2006年2月27日 (月)

競馬の記号学

     

この度、九天社より”競馬の記号学”を出版しました。価格は本体1800円です。image002

| | コメント (2) | トラックバック (1)

2006年1月 5日 (木)

目次作りに挑戦

     

ブログは非常にとっつき易く便利ですが、欠点としては目次が簡単には作れない事です。今回は、目次に挑戦してみました。次回はリンク貼って見たいと思います。これが大変そう。

目次
はじめに 
競馬 

 予測可能なギャンブルである 
 複雑系の生命現象である 
 性善説 
予想と予測 
 旧石器時代の神の手 
 競馬の常識は言い訳の集大成である
 記号の能力の予測 
 予想は直列で 
 アカロフのレモンの市場 
速度理論 
 能力は速度である
 分布の形状
 正規分布から数量化分析へ  続き
  速度理論のすすめ    
数量化理論    
 競馬の数量化理論的概念   
 交互作用   
 数量化演算の実際   
 予想の最終段階   
 一般的な予想との違い   
効率的市場仮説    
 オッズの逆数は的中確率    
 期待値は同一    
 回収率と的中率
 アノマリー(Anomalies)    
勝率・連対率    
 阪神タイガースは何故優勝したか?    
 薬物のお話(背景の同一性確保)    
 お医者さんと患者さんを盲目にする    
 千兆分の一?   
 一兆円の無駄遣い   
 競馬予想に勝率・連対率は役に立たない?   
血統・生産牧場   
 血液型性格判定の嘘   
 血統論がトンデモな理由   
 巷間の血統理論の誤謬   
 血統理論の未来   
 POGへの理論的アプローチ
  芝父馬編 サンデーサイレンスは本当に最強
  芝母父馬編 サンデーサイレンスは芝の母父馬
  ダート父編 サンデーサイレンスはダートでは普通?
  ダート母父編 Mr.Prospector最高?
 生産牧場   
  芝編 ノーザンファーム圧勝?
  ダート編 結局社台グループ圧勝
騎手・調教師   
 騎手(脚質は誰のもの?)   
  芝1編 競馬の真実は騎手7分馬3分?
  芝2編 外国人騎手の実力は如何に?
  ダート1編 武豊騎手はダートの方が得意!
  ダート2編 脚質は騎手の戦略・戦術である
 調教師(競馬の中枢)   
  芝編 調教師には三つのタイプが有りそう
  ダート編 調教師の顔ぶれが違う
クラス   
 クラスは存在しない
 馬は三歳で大人になる   
  芝牡馬編 一年は馬には長すぎる 
  芝牝馬編 牝馬は早熟か
  ダート牡馬編 基本的に芝と同じ 
  ダート牝馬編 牝馬はレースにでる絶対数が少ない 
 競走馬は経験値を持つ    
  芝編 馬の知能   
  ダート編 芝と全く同じ   
  障害編 経験不問   
 稼げない馬はやはり能力が無い    
  芝編 ゼロを除算するとゼロでは無い   
  ダート編 特別な事   
天候・馬場状態    
 馬場状態は芝とダートで逆にタイムへ作用する 
 天候と馬場状態の交互作用    
  芝編 馬場状態は4段階では足りない   
  ダート編 雨で水の浮く不良馬場は特別   
標準馬    
 基準タイムは存在しない   
 距離も騎手も同等な変数    
  芝編 幻の標準馬
  ダート編 減量騎手は買いかも
 標準速度から基準タイムへの変換   
 さらに進化した標準速度解析例    
  京都の芝1400mと1600m 上がりタイムが逆転する   
  新潟の芝直線1000m編 内側内枠が荒れるのか   
多頭数と内枠外枠の有利不利    
 競馬も渋滞する    
  芝編 外枠はやはり不利 
  ダート編 芝程混まない   
負担重量(斤量-ハンデ)    
 ハンデは物理学的重さと強さの指標と言う二面性   
  芝編 負担重量%がものを言う
  ダート編 複雑怪奇
 大穴効果    
 斤量の増減のパラドックス   
馬体重    
 芝では大きい馬は動きが鈍いが
 馬体重の増減では1日当たりのg数に意味有り   
  芝編 滞在競馬の怪 
  ダート編 直前予想に役立ちそう   
  障害編 一応傾向はでます   
ローテーション    
 芝の休養明け叩き2戦はいわく言いがたし 
 ダートの長期休養明けは全く駄目
ブリンカー   
 馬は馬ごみを好む?   
 分析の堅牢性 
人気に応えた次走は   
 馬は慢心するのか 
 騎手の心理 
前走の走行パターン   
 逃げるのは疲れる
 芝からダートへの転戦は不利
母馬    
 競争馬のグレートマザーを探せ    
 出産馬齢と第何子かの関係  芝上がり編

  出産馬齢と第何子かの関係  芝ペース編

 出産馬齢と第何子かの関係  ダート上がり編

 出産馬齢と第何子かの関係  ダートペース編
競馬の見方    
 スローペース症候群 
 川の水は水源に近いほど綺麗で純粋である    
 勝ちパターンは次の負けパターン    
 オーバーフィッティング    
1978年の競馬予想プログラム    
 パソコンが出現する前   
 指数理論が出現する前   
 多変量解析(数量化理論)は出現していた   
 回帰分析について   
 Back to the future、時代を超えて    
おわりに     

| | コメント (4) | トラックバック (0)

2005年12月25日 (日)

高度な速度理論 その3

     

CatItemsibaf2100APSw516_15414_image001 ここでは示しませんが、種牡馬も騎手と同様で、走破速度で見た場合は、全く同じ能力を産駒に与える影響速度を示していても、上がり速度とペース速度に分けて分析すると上がり速度が異常に遅くペース速度が異常に早いケースが有り、予想の柔軟性は、走破速度のみ場合に比べ格段に向上します。ところで、ここまで示しましたグラフを見ると単に上がりとペースが逆相関しているだけでは無いかとの印象を持たれるかも知れませんそこで、馬の能力を示す1レース当たりの本賞金額の影響速度を,次に示しますと、グラフより分かると思いますが、走破、上がり,ペースともに右上がりになっており、上がりとペース速度が単純に逆相関になっていない事がわかると思います。なお、また機会を改めて解説したいと思いますが、上がり速度とペース速度から走破速度を推定した場合、所謂レースがハイペースかスローペースかの問題も同時に解決しております。

| | コメント (0) | トラックバック (0)

高度な速度理論 その2

     

CatItemsibaf2100APSw516_26088_image001 走破速度を数量化分析した結果では、内枠有利,外枠不利の結果は、一応出ていますが、数値的には僅かな差です。上がり速度とペース速度を分けて分析した結果では、明白な差を捉えています。従って、走破速度の分析値を基にした馬の能力推定は非常に甘くなっている事が分かると思います。次に、騎手の影響速度について考えて見ますと以下のグラフのようになります。走破速度を分析した結果では、武豊騎手、岡部騎手が上位に来て、一義的な数値となってしまい、下位にいる中館騎手や武士沢騎手には一方的に不利になってしまいますが、上がり速度とペース速度に分けて分析した結果を見ると、走破速度では下位の影響速度しか示さなかった騎手でもペース速度が非常に高い騎手がおり、距離あるいは、状況によって必ずしも不利にならず、多様性のある予想が可能になります。

| | コメント (0) | トラックバック (0)

高度な速度理論 その1

     

CatItemsibaf2100APSw516_22137_image001これは私のHPからの再掲です。

まず初めに、走破タイムより求めた基準速度あるいは基準タイムは競馬予想には必要無いと言う事です。但し、これは各馬の走破タイムと同時に上がりタイムがある場合ですが、走破タイムしか無い場合(害レースは上がりタイムのところにデータは有りますが、これは単に200mの平均タイムが入っているだけで基本的には走破タイムの情報しか有りません)は、走破タイムから求めた基準速度ないし基準タイムしか得られないのでこれらを使うしかないのですが、中央競馬には幸い各馬の上がりタイム存在するので、こう言った結論になった訳です。具体的には、上がり基準速度とペース基準速度によってしか正確な馬の能力の推定は出来ないと言うことです。最近の競馬は昔と違ってスケールが小さくなって前半から真剣に走らず上がりタイムで勝負が決するちまちました競馬が多くなったと言われていますが、果たして昔と今とは競馬のスタイルが変わったのでしょうか。 一般論として、競い合って優劣を決める競技の目的は何かと考えると、全ての競技は着順を争うのであって、決して絶対スピードを争う訳では有りません。従って、昔のレースでも上がり優位であったに違い無いと私は考えています。ただ、騎乗技術が進歩した事によりこう言った印象を持つに至ったのでは無いかと思います。私の理論は、一つには競馬をタイム指数から予想するのではなく、速度で予想する道を拓いたと考えていますが、二つ目は走破タイムから求めた基準速度をもとに競馬を予想するのでは無く、上がりタイムから求めた上がり基準速度とペース基準速度からしか正確な競馬予想は出来ないとする考え方の提案です。なお、上がり及びペース速度を使うからと言って、上がり補正速度とか○○馬とか但し書きのある結論が出る訳では無く、最終的には走破速度ないし走破タイムと言う形を取ります。即ち

走破速度=f(上がり速度、ペース速度)

より走破速度を求め、必要であれば走破タイムと形で予想に供します。 それでは、何故、走破タイムから求めた基準速度に準拠する走破速度では正確な馬の能力の判定出来ないかですが(当然ながら、所謂スピード指数も役に立ちません)、それを端的に示しているのが、内枠有,外枠不利の問題です。以下に馬番の影響分速のグラフを示しますの で、それに従って説明します。

| | コメント (0) | トラックバック (0)

2005年12月13日 (火)

血統理論

     

巷間の血統理論がどうも間違いである事については、過去の記事で触れてきましたが、同様な考え方は存在しているのでは色々サイトを検索していましたら

------------------------------------------------------------------------

なぜならば、サラブレッド競馬の公正にとって、真実は金銭より重要であるからである。サラブレッドは、崇高でかつ輝かしい動物であり、スポーツにおいて、最も長い間、最も栄光に満ちた一連の記録を打ち立てたという歴史がある。サラブレッドの記録の一部が真実でなく、我々がそれを知っているのに修正しないならば、競馬はその正統性の一部、すなわち失ってはいけない一部を失うことになる。さらに、血統理論が不正確な血統表に基づいていて、不正確に適用されているとしたら、いかなる血統理論も無意味である。

---------------------------------------------------------------------

なかなか刺激的な文章ですが、これは

http://www.jair.jrao.ne.jp/japan/news/main_00.html

の一部です。参考になれば幸いです。

| | コメント (0) | トラックバック (0)

2005年11月11日 (金)

交互作用

     

交互作用と言う用語は、多分非常に理解しにくい概念です。算数の常識では1+12ですが、数量化理論並びにこの理論で使われる交互作用は1+10にも、1+1-5にも或いは1+1+5にもなり得るという概念です。分かり易い例えでは、水の容積と値段かと思います。ミネラルウオターで有名なエビアンであれば500ml100円から150円で売られていますので、例えば100円としましょう。一方水道水は500mlの値段は1円もしないと思いますが、1円とします。ここでエビアンと水道水をお客の目の前で混ぜて1000mlの水を作り、お客に、100円の価値のものと1円の価値のものを足したのだから、出来上がった1000mlの水を101円で売りますと言ったらどうなるでしょう。多分、大部分のお客は1円の価値も認めないでしょう。ここで起こっていることは物理的には500ml+500ml=1000mlですが、価値的には100+1円=0円と言う現象が起こっています。交互作用とはこの価値的な現象を言います。ここで、さらに売り手が出来上がった1000mlの処理に困っているところを、あるお客が見て10円頂ければ1000mlの水を引き取って挙げると言われ、売り手がそれを承諾すれば100+1円=-10円となります。即ち、プラス+プラス=マイナスも起こりうる事になります。競馬では“馬場状態は芝とダートで逆にタイムへ作用する”で示しましたコースの種類(芝かダート)と馬場状態(良、稍重、重、不良)でこの交互作用が起こります。さらに天候と馬場状態でも起こります。

| | コメント (0) | トラックバック (0)

2005年10月25日 (火)

開発日誌

     

HRPTV5C HOME PAGEに在った開発日誌をこちらに移動させました。カテゴリー開発日誌をクリックして下さい。内容的には全くこちらと違うものも入っていますので、参考にして下さい。なお、この移動はnoteが来年無くなる為です。

| | コメント (2) | トラックバック (0)

2005年10月24日 (月)

はじめに

     

ここに、端がボロボロになった一冊の月刊雑誌あります。表紙を見ると特集”競馬予想プログラム”云々、さらに表紙の右下を見ると1978の文字が、え!、今から27年も前です。その頃の競馬予想プログラムとは、さらに予想ロジックとは、どんな物だろうか?そんなことから本書の物語は始まります。

| | コメント (0) | トラックバック (0)

2005年10月22日 (土)

昭和53年(1978年)の競馬予想プログラム その4

     

basic1978p109 今回のように文章の大部分を書き写して引用する場合、必ずしなければならない事は原著者の了解を得る事です。しかし、今回の引用には全くその必要は有りません。何故なら、著者は27年前の私自身であるからです。従いまして競馬予想における多変量解析(数量化理論)の基本ロジックは競馬の世界から全く影響を受けていないオリジナルなものである訳です。即ち、今回のブログは27年前の競馬予想理論の完結編でもありますが、プロッグ立ち上げにも書きましたように競馬予想を新たな次元に導く序章でも有ります。

| | コメント (3) | トラックバック (0)

ディープインパクトの強さの根源 その2

     

n2_9520_image004 調教師ではディープインパクトの池江師が高いペース速度を調教馬に与えているのが印象的です。その他では藤沢和雄師のピサノパテツクへの上がりとペースの高くてバランスの良い調教、松田師のアドマイアジャパンへの上がりペースともに高い調教が目立ちます。母父馬ではディープインパクトの母父馬であるAlzaoの上がり速度の高さが際立っています。さらに毎回期待にどれだけ応えたかの指標である残差平均はディープインパクトがダントツで高かった。

| | コメント (0) | トラックバック (0)

ディープインパクトの強さの根源 その1

     

n2_9520_image002 今回の菊花賞におけるディープインパクトの京都芝3000mの予想タイムは3分4秒49,上がり3F予想タイムは34.03秒で全16頭中当然トップであった。以下走破タイムではシックスセンス、アドマイヤーフジが続きますが、4番手5番手はマルブツライト、ピサノパティックと少々意外な馬が続きます。上がりタイムでは安藤騎手騎乗のローゼンクロイツ、アドマイヤーフジが続きます。騎手の技量では武豊(ディープ)をトップに安藤騎手(ローゼン)が僅差で続き,3番手に地方の星岩田康誠が乗るピサノバテックがが上位を窺っています。その他騎手では福永祐一アドマイヤーフジが有力です。父馬ではサンデーサイレンスが多く産駒差が付け難いが、アドマイヤフジの父馬のアドマイヤベガの影響速度が唯一サンデーサイレンスを上回っており面白い存在です。

| | コメント (0) | トラックバック (1)

2005年10月21日 (金)

昭和53年(1978年)の競馬予想プログラム その3

     

basic1978p108 --回帰式の処理に用いる正規方程式の解法にはガウスジョルダン法を用いており..中略...。 何故このような事をを書くかといいますと、これに少し手を加えればデータ解析に非常に有力な手段となる多変量解析が可能になるからです。たとえば競馬を予想する場合の各因子の重みが客観的に付けられますし、これができれば予想の正確度は飛躍的に上がるでしょう。やる気のある方は挑戦してみてください。私も最終的には多変量解析群をサブルーチンに持ったプログラムを考えていますが、現在のメモリ容量では足りないようですし、また、仮にできたとしても扱うデータ数が1レース数千から1万のオーダーに近づくでしょうから、とても個人の労力では間に合わないでしょう。(予想結果が出たころにはレースが終わってしまう)また、大型コンピュータにはこのプログラムのライブラリがありますので試されるのも良いでしょう。しかし大型をこのような遊びに使うのは気が引けますし、マイコンをホビーとする者には邪道かもしれませんネ!つづく..

| | コメント (0) | トラックバック (0)

昭和53年(1978年)の競馬予想プログラム その2

     

basic1978p107 左は競馬予想プログラムの1ページ目です。著者を消してありますが,その理由は後ほど。画像では読みにくいところも有りますので、こちらに要点を書き写します。 --マイコンを楽しむにはテレビディスプレイでゲームをするのが一番手っ取り早く、それはそれで面白いのですが、安物のガムみたいですぐに味がなくなってしまいます。また一通りBASICが使える機種となれば相当高価な買い物となりますし,ゲームだけに使っていたのではいかにももったいない気がします。それならばビジネスに使えば良いと言うことになりますが、それも夢のない話です。そこで思いつくのがギャンブルへの応用です。計算機の発生とギャンブルとのかかわり合いは深く、300年前パスカルは賭けに勝つために計算機を考えたそうですし、イギリスのバベージもやはり「エンジン」という今の電子計算機の元祖に当たるものを設計しようしたと言われています。しかし不思議に思うのですが、マイコンが世間の話題になってからおよそ2年が過ぎようしBASICプログラム集が出版されているのに、ギャンブルに応用したものが一向に現れてこないのはどうしたことでしょうか?前置きはさておき、マイコン応用の俎上に乗るギャンブルは何と言ってもデータ豊富な競馬になります。今回私が紹介しますのは勝馬推理プログラムです。-中略-使用している回帰式は対数型2次多項式です。処理の第一段階は幻の標準馬のデータ回帰します。次に各馬のデータを前回タイムに重点をおいて回帰し、各距離ごとのタイムを算出します。なお、芝、ダートなどの条件で補正されたものも出力されますが、これは生のデータを処理したものよりも正確度が高いようす。 --以上の中で注目すべきは距離とタイムとの関係を直線ではなく非線形としている点でタイム分布を左右対称とはなっていないとしている事と27年前に既に幻の標準馬を想定している事です。つづく...

| | コメント (0) | トラックバック (0)

2005年10月20日 (木)

昭和53年(1978年)の競馬予想プログラム その1

     

basic1978 左の月刊雑誌のトップにある特集”BASICに挑戦する!競馬新聞不要的中率100%?!競馬予想プログラム”のタイトルも気になりますが、驚くべきは表紙右下にある年号です。1978年8月、実に今から27年前です。その頃は、まだパソコンと言う名前も存在していない時代です。また、現在巷間に溢れているタイム理論の元と成った米国のタイム理論が紹介されるより遥か前です。そんな時代の競馬予想の理論とは何か非常に興味がありますね。今回よりこの話題について触れます。

| | コメント (0) | トラックバック (0)

2005年10月17日 (月)

さらに進化した基準速度解析例 新潟の芝直線1000m

     

n2_13980_image002 日本で唯一の芝の直線1000mの速度(タイム)構造がどのようになっているか興味を持たれる方も多いかと思います。数量化分析の結果ではもちろん影響速度は最も高い値(京都の1400mあるいは1600mを参照)を示し、途中息継ぎ出来る距離では有りませんので、上がり速度とペース速度は同じような値となりました。特徴としては外枠になるに従い速度が上がっているようです。原因は特定できませんが,多分利き足にあるのではと思っています。なお、データは2003年1月~2005年9月までの中央競馬の全レースから採録しました。

| | コメント (5) | トラックバック (0)

2005年10月16日 (日)

さらに進化した基準速度解析例 京都芝1400mと1600m

     

n2_30342_image003競馬も渋滞する”あるいは”基準タイムは存在しない”などで所謂基準とは何かに述べてきましたが、今回は京都の右回り芝の1400mと1600mに存在する内回りと外回りの違いを解析して見ました。所謂基準タイム論的には余り詳しく触れられていませんが、数量化分析の結果では内と外では全く違った結果が得られました。左上のグラフの如く内回りはハイペースで上がりタイムを要するコース形状であり、外回りではペース速度と上がり速度が同程度になると言う全く違う性質を捕らえました。外回りは上がりとペースが同じ位の速度になると言う事は、途中で速度を変える必要が無く、相対的走りやすい事を意味して走破タイムとしては外回りの方が良いようです。同時調べた馬番の影響は1400mでは最外枠が少し不利であり1600mでは逆に有利であるようです。なお、データは2003年1月~2005年9月までの中央競馬の全レースから採録しました。ところで、今までご紹介したデータの採録期間が色々存在していますが、採録期間の区切りは予想ロジックのメジャーアップデイトに対応しています。今回のデータは最新で今週より使用しています。さらに詳しく左上のグラフを解析しますと所謂”スローペース症候群”の正体の一部が見えてきます。即ち、1400mの内回り上がり速度の絶対値と1600mの外回りの上がり速度の絶対値を比較して見て下さい。馬番3より外側では1600mの上がり速度の方が高い事が判ります。言い換えると1600mの上がりタイムの方が距離が長くなっているにも関わらず良くなっています。そうです逆転している訳です。断定するのは少し早いかもしれませんが”スローペース症候群”の原因は馬にだけにあるのでは無く、コースの形状にもあると言える訳です。

| | コメント (0) | トラックバック (0)

2005年10月15日 (土)

競馬も渋滞する? ダート編

     

n2_21101_image003 基本的には芝と同じ傾向を示したが、最大頭数は16であることも有り、多頭数の影響は芝より顕著では有りませんでした。データは1999年1月より2002年10月まで全レースを対称としました。

| | コメント (0) | トラックバック (0)

2005年10月14日 (金)

競馬も渋滞する? 芝編

     

n2_26769_image003 車の渋滞はやな物ですね。具体的な現象としては併走している車の数が増えてきて速度が落ちて最終的には歩くより遅くなる事ですが、競馬でも起こっているのではないかと考えました。即ち、8頭立てより10頭立て、12頭立てと出走頭数が増えるに従い走行速度が低下するのではないかと言うことです。結果は左上のグラフに様に多頭数になればなるほどペース速度は早くなります。即ち頭数が少ないとゆっくりしたペースになりますが、その代わり上がりタイムは早くなります。枠順に関しては外枠程上がり速度の低下か顕著になり、一般論としては外枠不利と言えるでしょう。データは1999年1月より2002年10月まで全レースを対称としました。

| | コメント (0) | トラックバック (0)

2005年10月13日 (木)

新馬戦での的中例

     

n2_19932_image002 少々旧い例ですが、新馬戦での的中例を高配当のものを5例、低配当の本命のもの5例とあげました。例にあげた予想は3連複を本線7点以内で的中したものです。なお、最近万馬券の例はHRPTV5C HOME PAGEを参照下さい。

| | コメント (0) | トラックバック (0)

2005年10月12日 (水)

斤量の増減の影響

     

n2_9594_image005 これは前走からの負担重量(斤量・ハンデ)の増減の影響を見たものです。馬体重と同じように前走からの経過日数で斤量の増減を除したもので1日当たりの斤量の増減量を決めこれを変数として影響速度を算出したものでです。結果は左のグラフのように不思議なものでした。馬体重の急激な変動は競走馬の能力を明らかに低下させるものでしたが、斤量の場合は、様子が明らかに違っていました。芝コースの場合、斤量の急激な変動は増えても減っても馬の能力の低下をもたらしますが、ダートの場合、斤量が最も激しく低下(1日あたり300g以上)した場合が最も馬の能力が低く、斤量の増加率が大きくなるほど馬の能力が上がって行きました。特にダートにいて斤量が増加率が大きい程,馬の能力が上昇するのは競馬の常識から考えて不自然ですので、この減少は斤量のパラドックスと考え合わせて、さらに追求すべき事だと思います。なおデータ2002年1月~2005年3月までの全中央レースから得ました。

| | コメント (0) | トラックバック (0)

2005年10月11日 (火)

出産馬齢と第何子かの関係 ダートペース速度編

     

n2_4437_image003 ダートのペース速度では非常に変化は乏しい。異常に大きい値はサンプル数が数個の為、特徴としては取り上げられません。データは2002年1月~2005年3月までの全中央レースから取りました。

| | コメント (0) | トラックバック (0)

出産馬齢と第何子かの関係 ダート上がり速度編

     

n2_25446_image003 ダートでは変化に乏しくなっているが、比較的高齢馬(満12~16歳)の第1子の上がり速度高いように感じます。出産馬齢と第何子との関係を見ているとまだ別に何か遺伝的な要因があるような感じがします。母父馬は既に特徴を抽出していますので、母系の何かなのでしょう。現在のところは不明です。データは2002年1月~2005年3月までの全中央レースから取りました。

| | コメント (0) | トラックバック (0)

2005年10月10日 (月)

出産馬齢と第何子かの関係 芝ペース速度編

     

n2_19439_image003 ペース速度では第1子が高い傾向がうかがえますが、大きな特徴は捕まえられませんでした。データは2002年1月~2005年3月までの全中央レースから取りました。

| | コメント (0) | トラックバック (0)