Python¶
SinkhornアルゴリズムとJAXによる実装: 最適輸送の高速化
最適輸送問題に以前から興味があり、最近のDeepSeekのMHC (Manifold Constrained Hyper Connections) 論文でも言及されていたため、その中心となるSinkhornアルゴリズムについて詳細を調べ、JAXで実装してみた際のメモ。
Warning
この記事は Google Antigravity を使用して作成されました。 あくまで私自身の勉強した結果の備忘録としてのメモと思っていただければと思います。 (正確性はかならずしも担保されません。) 作成過程で知らないことが多くあり、非常に勉強になりました。
PC画面キャプチャとGemini 2.0 Flashによる全自動日報生成: 実装と備忘録
PCの画面を1分おきにキャプチャし、Gemini 2.0 Flashを利用して1日の活動内容を自動で要約するツールを作成した際のメモ。
Warning
この記事は Google Antigravity を使用して作成されました。 あくまで私自身の勉強した結果の備忘録としてのメモと思っていただければと思います。 (正確性はかならずしも担保されません。) 作成過程で知らないことが多くあり、非常に勉強になりました。
『Pythonによるはじめての数値流体力学』第4章
引き続き『Pythonによるはじめての数値流体力学』という本を読み進めています。 第4章では、対流方程式の数値解法について学びました。 理論の解説とJAXによる実装を行います。
『Pythonによるはじめての数値流体力学』第3章
引き続き『Pythonによるはじめての数値流体力学』という本を読み進めています。 第3章では、拡散方程式の数値解法について学びました。 理論の解説とJAXによる実装を行います。
『Pythonによるはじめての数値流体力学』第2章
『Pythonによるはじめての数値流体力学』という本を読み始めました。 この本は数値流体力学(CFD)の基礎的な内容をPythonで実装しながら学んでいくことを目的とした本です。 第2章まで読み進めたので、その内容を簡単にまとめておきます。 なお、本ではNumpyをベースとした実装が行われていますが、ここではJAXを用いた実装を紹介します。
MLBデータの可視化
メジャーリーグを見ていると、Google Cloud提供のStatcastというデータを使った解析がよく行われている。Statcastは、MLBの試合中に選手やボールの動きを追跡するためのシステムで、打球速度や打球角度、投球速度などの様々なデータを収集しているらしい。
そしてStatcastのデータはBaseball Savantというサイトで全世界に公開されている。
データ分析を生業にするものとして、そして一野球ファンとして、ぜひともこのデータを触ってみたいと思い、Pythonのpybaseballというライブラリを使ってStatcastのデータを取得・可視化を行ってみた。
内容としてはほとんどpybaseballの使い方みたいな感じではある。
gpytorchを使う
最近博士時代の研究がarxivに投稿された。ガウス過程回帰を使ってモデル方程式を学習するという内容である。
当時はgpflowを使っての実装を色々と行っていた記憶だが、これは名前の通りTensorflowをベースとしたガウス過程ライブラリである。
ただ、最近自分自身Pytorchを使った実装をすることが多くなってきて、Pytorchをベースとしたガウス過程ライブラリであるgpytorchを使ってみたくなった。とりあえずチュートリアルを見ながらな同じことをしてみたので備忘録的にまとめてみる。なので新しいことは何もない。
- 最近出た博士時代の研究論文: arXiv:2504.09110
- gpytorchのチュートリアル: GPyTorch Regression Tutorial
スプライン補間【1次元】
torchにはデフォルトでスプライン補間の実装がないなあと思い、自分で実装してみることにした。 正直こういったものは今だとLLMが勝手に実装を済ませてくれるものではある気がするので、どれくらい理論まで把握しておくべきかは悩ましいところではある。ただスプライン補間は基本的な数値計算の手法であるし、自分で実装してみることで理解を深めることが出来るので、一度はやってみるのも悪くはないかな、といったところ。 しょっぱなでtorchの話を書いたが、この記事ではnumpyとscipyのみを使ってスプライン補間を実装することにする。
『推薦システム実践入門』5章1節2節

『推薦システム実践入門』を読み始めたので、実装をまとめてみます。 Pythonによる実装自体はGitHubにアップされています。 データ処理には定番のpandasが使われているのですが、 最近自分がpolarsを使い始めているのと、devcontainer上でpandasを回しているとすぐにメモリがあふれてしまうという問題にぶち当たったので、 ここではpolarsを使った実装をまとめていこうと思います。 このブログで紹介した実装は自分のGitHubにも適宜アップロードしていく予定です。