Keisuke Yanagi

About me

Machine learning engineer / Research scientist at ZOZO Technologies.
PhD in particle physics.
more about me

tech articles on zenn

Recent posts

Oct 9, 2021
t検定で必要なサンプルサイズを求める公式について A/Bテスト実践ガイドという本を読んでいたら、有意水準5%、検出力80%のt検定に必要なサンプルサイズを求める公式として以下のようなものが書かれていました $$n = \frac{16\sigma^2}{\delta^2}.$$ ここで$\sigma$は分散(両群で等しいとする)、 $\delta$ は検出したい二群の平均の差です。この式がどこから出てくるのかパッとわからなかったので考えました。…
Jun 20, 2021
CatBoost でランキング学習に使われる StochasticRank について 概要 CatBoost ではランキング学習用の目的関数 として StochasticRank という関数が実装されている。 これによってnDCGなどの定番のランキングメトリックを最適化することができる。逆に、XGBoostにある LambdaMART などは実装されていないようである。…
Mar 24, 2021
Implicit feedback 下での推薦アルゴリズムに関わる論文 最近は推薦の問題に取り組むことが多く、特に実務の現場では implicit feedback という状況を扱う必要があるため関連する論文を読んで勉強していました。重要そうな論文をいくつかリストアップしたいと思います。 Item Recommendation from Implicit Feedback…
Mar 20, 2021
Hugo に外部コンテンツを良い感じで埋め込む Shortcode を利用する方法 Hugo の shortcodeを利用する方法。…
Sep 15, 2020
CatBoost の feature importance CatBoost が計算してくれる feature importance の定義がドキュメントを見てもよくわからなかったので調べた。…