自分の記事を見返すことは、過去の自分との対話になる、とか思っているけど、過去の自分に申し訳ないくらい進捗はよくない。

 

好奇心のほうは、あまり変わらず、プログラミングやデータ分析なのだが、その他のことをゆるーくやっていたので、特別に進んでいる、という気が全くない。

 

さて、単純作業的な仕事をしているときに、しばしばメインで考えていることは、totoで一発あててぇなということである。何かこう、うまくモデルつくって、いい感じで勝率とかでねぇかなーということを考えている。

考え始めると、サッカーにもミクロ、マクロみたいな感じがあるっぽくて、たとえば選手の運動量やゴールの確率、ボールカットの確率などがありそうだが、これはどっちかというとミクロのことかなーと思っていて、選手個人やその試合のチーム戦略、チームの方針などには適するけど、どうも全体の勝ちを予測しようと思うと、変数が多すぎて対応できないんじゃね?と頭を悩ませている。マクロっぽいことだと、チーム全体のゴール確率とか、ゴール被弾率、年間の勝ち点や、10年単位のデータを持ってきてドカッと分析することかなとも思うけど、これまたその年で戦力そのものが違うし、ましてやJリーグだと、次の年の上位5チームですら予想するのが困難というなんとも「えきさいてぃんぐ」なリーグになっているので、時系列分析をかけても意味がなさそう。。。とか思っている。

 

そうすると、それっぽい分析って難しいとか思いつつ、単純作業をミスるっていうことを続けている。

 

なんかその年のウイイレを買って、リーグモードを10000回くらい回したほうがそれっぽい答えが得られそうだけど、なんかそれでも上位5チームがものすごいばらばらになりそうな気がする。

 

なんか気になって、過去の順位表見てみたけど2005年以降だと、鹿島と浦和の強さが少し目立つ気がする。けど、柏のJ2上がりからの優勝とか、はぁ?みたいなことがあるので、なんとも言えないし、優勝争いをしていたガンバやセレッソが次の年からJ2みたいな謎がある。なにこれ。

まぁそりゃそうで、日本人で中心で目立った選手は海外に行っちゃうし、すげぇ外国人選手は中東にいっちゃうし、そんな中で安定した強さを維持するのはかなり難易度が高い。

そんで、今年の場合は海外から戻ってきた選手がたくさんいるセレッソが強そう。各チームの年間予算を見てもうーんな感じで傾向を見るのが難しそうで、なんかこの過去のデータを無視してくる姿勢がたまらない。

ということで、Jリーグも開幕したことだし、データ分析の練習がてら趣味でやっていきたいと思っている。

 

 

この記事を書きながら面白い記事を見つけたので、貼っておく。

2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(1) | Football LAB ~ サッカーをデータで楽しむ

 

記事を読んでいて、やっぱり機械学習のほうがいいよなー、そのほうがかっこいいよなー、RよりPythonのほうがその後の広がりがよさそうだよなーという思いをさらに強くしつつ、今日も今日とて、プログラミングの勉強時間が消えていくのであった。