空飛ぶ気まぐれ雑記帳

主に趣味とかプログラミングについて扱います。

2023-01-01から1年間の記事一覧

[論文紹介]Unsupervised Sound Separation Using Mixture Invariant Training

久々に、ブログを書く気になったので、最近読んでいて面白かった「Unsupervised Sound Separation Using Mixture Invariant Training」についてまとめる。 特に記載がなければ論文中の図表は以下を参照しています。 [1] S. Wisdom, E. Tzinis, H. Erdogan, R…

aesthetic-predictorをパッケージにした

ランキング参加中プログラミングLAION-AIが開発したモデルの一つであるaesthetic-predictorというものがある。 github.com画像の美しさを評価するモデルで、以下のような結果が得られるらしい。 データセット作りに便利そうなので今回パッケージにした。 CLI…

pydanticからArgumentParserを作るライブラリをアップデートした

ランキング参加中プログラミング少し前に書いたライブラリであるpydantic-argparse-builderをアップデートした。 ライブラリの詳細については以下にまとめています。 qiita.comもともと備えている機能は事前定義されているpydanticのオブジェクトにもとづい…

RustからWhisperを使ってみる

ランキング参加中プログラミング Rustで音声認識 はじめに 今回はWhisperを用いて音声認識を行います。 オリジナルのWhisperはPythonを使って実装されていますが、世の中にはWhisperをCで実装したライブラリwhisper.cppがあります。 さらに、それをRustで使…