空飛ぶ気まぐれ雑記帳

主に趣味とかプログラミングについて扱います。

[論文紹介]Unsupervised Sound Separation Using Mixture Invariant Training

久々に、ブログを書く気になったので、最近読んでいて面白かった「Unsupervised Sound Separation Using Mixture Invariant Training」についてまとめる。 特に記載がなければ論文中の図表は以下を参照しています。 [1] S. Wisdom, E. Tzinis, H. Erdogan, R…

aesthetic-predictorをパッケージにした

ランキング参加中プログラミングLAION-AIが開発したモデルの一つであるaesthetic-predictorというものがある。 github.com画像の美しさを評価するモデルで、以下のような結果が得られるらしい。 データセット作りに便利そうなので今回パッケージにした。 CLI…

pydanticからArgumentParserを作るライブラリをアップデートした

ランキング参加中プログラミング少し前に書いたライブラリであるpydantic-argparse-builderをアップデートした。 ライブラリの詳細については以下にまとめています。 qiita.comもともと備えている機能は事前定義されているpydanticのオブジェクトにもとづい…

RustからWhisperを使ってみる

ランキング参加中プログラミング Rustで音声認識 はじめに 今回はWhisperを用いて音声認識を行います。 オリジナルのWhisperはPythonを使って実装されていますが、世の中にはWhisperをCで実装したライブラリwhisper.cppがあります。 さらに、それをRustで使…

debugpyがいい感じなことに気づいた

なにがあったか docker-composeで立ち上げたpythonコンテナをデバッグするときに、VSCodeからDockerで立ち上げたコンテナにattachしてデバッグするのが面倒だと思っていた。 普通にフォルダが表示されるまで時間がかかるし、ソースコードを削除しているコン…

【Python】システムのSSL証明書の設定を読み出す【Windows】

今回はWindowsでOSで設定されているSSL証明書をPythonのライブラリで使用する方法について説明する。PythonではSSL証明書を通常`certifi`というライブラリに埋め込まれたものを使用する。 そのため、OSに設定されているSSL証明書やそれ以外の証明書を使う方…

OSSを読んだ記録をつけることにした話

きっかけ 細かい話もスライドに書いているけど、OSSを読めという人は沢山居るけど、それを読んだ記録みたいなのは本当に無いので書いてみた。 speakerdeck.com 感想 読んでいるOSSとネタが噛み合ったら何かしら書けるけど、そうじゃなければ中々書くことも難…

Tensorflow2.Xの5Stepのネットワーク実装

この記事を書こうと思ったきっかけ 世の中にTensorflow 2.X実装のネットワークが増えてほしいと思ったから。 最近ではTensorflow 2.X実装のネットワークも増えつつあるが、今でもTensorflow 1.X実装のネットワークは少なくない。 PyTorchを使っている人が多…

Tensorflowでregularizationが効いていなかった話

Tensorflow 2.0で自分でTraining loopを書いている人は一度公式のドキュメント読んだほうがいいと思った www.tensorflow.org今まで知らなかったけど、Training loopを自分で書くケースでは正則化項のlossを自分で足し込む必要があるらしい。 該当箇所は以下…

VSCodeでPythonのTestが自動検出されない話

VSCodeでPythonを書いていて、Testが自動検出されなくて困っていた。 VSCodeはUnit testのデバッグがワンボタンでできるため、結構便利に使っていたのだが、PCを買い替えてVSCodeの設定を飛ばしてからTestの検出がされなくて困っていた。ネットの海を泳いで…

FactorVAEを実装した話

Factor VAEをTensorflow2.0で実装してみた話です。 github.comTensorflow 1.XやChainerの実装はありましたが、Tensorflow 2.0で書かれた物はなかったので、実装してみました。トップの画像は実際にLatent traversalを行った結果です。 若干チューニングの甘…

【Now Reading】A Disentangling Invertible Interpretation Network for Explaining Latent Representations

はじめに 読んでる最中の論文についてまとめる。読んでいて気づいたけど、自身の論文を大量に引用していて、前提とする知識が多すぎる。。。 結構時間がかかりそう。 まだまだ読見込んでいる段階なので、ちょっとづつ書き足していきます。 そのうち実装もし…

TensorflowかPyTorchなのか

何のポエムか Deep Learningをするときは常にChainerを使っていたのですが、Chainerがサポート終了とのことで、フレームワークの乗り換えが必要になった。 その時に、選択肢として浮かんだのがTensorflowとPyTorchだった。 Microsoft Cognitive Toolkit(旧C…

【Windows】DockerでPythonアプリケーションをビルドする方法

背景 年に一度しか更新されず、前置きが長いポエミーな本ブログで未だによく見られている記事にGUIアプリを作る話があったので、折角ならもうちょっとモダンに何とかできないかと。 思い至ったので、実際に作ってみました。 ところで、私は普段WindowsでAnac…

OpenCV 4.2.0のビルドエラー対策

未だにこのブログを見る人がいたのと気が向いたので更新しています。 この記事はカスだ とりあえず、OPENCV_PYTHON3_VERSIONはBOOLではなく、STRINGで指定するものだ。 しかも普通にバージョンを指定すべき変数だ。 少なくともOpenCV 3.4のブランチを見るとO…

PythonでMarkdownをHTMLに変換する

4月になってから環境が変わってクソ忙しくなったせいか、録にブログを更新できず。 なんだかんだで、もう5月も終わり。プログラムを書いてないわけじゃないけど、githubの履歴を見る限り一ヶ月でたったの6000行しか書いてないので、全然ですね。 それはさて…

スクリプトとDLLの間に生きる時のデバッグ

はじめに 4月になって環境が変わって色々と忙しい今日このごろ。 気づけば4月も末日、そろそろGW前だというのに未だに慣れず。そう、4月末なのに今月はまだ1記事も書いてないのです。 マズイ…というわけで、今回はちょっとしたデバッグのテクニックをご紹介…

OpenCVのDeformable Part Modelを試してみた

はじめに 今回は、故あってOpenCVのDPM(Deformable Part Model)を試してみたので、それについて紹介したいと思います。 DPMって? DPMとは物体を検出するアルゴリズムの1つで、入力画像からHOG特徴を抽出し、事前に学習しておいた物体全体のモデルと物体をパ…

古き悪しき全プロジェクト共通のVC++ディレクトリ的なSomethingを設定する方法

むか~し、むかし。Visual Studio 2008では設定>プロジェクトとソリューションからVC++ディレクトリの設定を行うことが出来た。 この設定では、全てのプロジェクトに共通した設定を書き込むことが出来、大変重宝しておった。 その一方で、色々な問題からVisu…

Visual Studio 2017を試してみた

C++

はじめに そもそもVisual Studio 2017の正式版がリリースされたのは3/7のことで、リリースノートによるとVisual C++の更新は軽微なもので、CMakeのサポートがメインになっている模様。 実際、ツールチェーンのバージョンも141とVisual C++14のマイナーアップ…

はじめてWebアプリケーションを作った話

はじめに プログラミングを初めて早6年と3ヶ月。 これまでに、C++でアプリケーションを作ったことは数多くあれど、Webアプリケーションは作ったことがありませんでした。 ただ、某FEの試験を受けたり、QtからGoogleAPIをJavascript経由でバインディグしたり…

PythonでGUIアプリケーションを作ろうとした話

はじめに 今回の話はタイトルどおり、Pythonを使ってGUIアプリケーションを作ろうとした話です。 これまでに、C++でアプリケーションを作ったことは数多くあれど、他の言語でアプリケーションを作った経験は少ないものです。 特に、スクリプト言語に絞ると無…

CNTKがガチでクソだったと思ってたらいつの間にかそうでも無くなってた話

はじめに 前回の記事を書いている最中に思い出したのだけれども、CNTKがガチでクソだった話を書こうと思ったらいつの間にかそうでも無くなってた話。近況と生存報告と人気ページについて - 空飛ぶ気まぐれ雑記帳 そもそもCNTKって CNTKとはMicrosoft社が提供…

近況と生存報告と人気ページについて

先月からクソ忙しくて、録に更新してこなかったけどいい加減更新しようと思いいたった。のだけれども、どうも記事にできる内容がない。 いや、この三ヶ月、何もしてこなかった訳ではない。一応、研究成果の方はしっかり出して、それ相応の評価を頂戴した。 …

Visual Studioユーザーに送るCMakeテクニック☆ (3)

いやーこれでもう第三回ですよ。 なんとか自分で設定した週一更新のノルマを達成できそうですねーそれはさておき、今日は(1)と(2)の続きにあたるはなしで、(2)はCMakeListsを対象としたものでしたが、今回はそれ以外のヘッダーファイルやソースファイルを対…

なんかデスマってたからレムちーのボクセルキャラクターを描いてみた

学会前のセルフハンディキャッピングの一環としてなぜかボクセルキャラクターを作りたくなったのでRe:ゼロのレムを作ってみました。 参考は下記、3つのサイトです。CHARACTER|TVアニメ『Re:ゼロから始める異世界生活』オフィシャルサイト ultimei.hatenablo…

Visual Studioユーザーに送るCMakeテクニック☆ (2)

Visual Studioユーザーに送るCMakeテクニック☆ 、第二回目です。 今回は、昨日の記事で説明したフィルタリング機能を使って、CMakeファイルをVisualStudioから簡単に見えるようにしようって話です。 具体的にはどういうことかと言うと下記のように各ディレク…

Visual Studioユーザーに送るCMakeテクニック☆ (1)

はじめに 今月忙しすぎてブログの更新が滞っていたので、暫くごまかしのためにCMakeのテクニックを紹介します。 なお、未だに忙しくて録に記事が書ける状態ではないので記事は分割してますが、悪しからず。決して当初掲げていた週一更新の分を一気に放出しよ…

Visual Studio で拡張子のないC++ヘッダーをIntelli Senseで表示する方法

Qt+CMakeを使いつつVisual Studioを使っていると拡張なしのヘッダーファイルをインクルードしたい時がある(実際には拡張し有りのヘッダーファイルをインクルードすれば事足りるので特に問題にはならないが…)。 その場合、なぜかIntelli Senseでは標準ライ…

Windowsでffmpegを使ってみた話

C++

はじめに ffmpegを使ってみた話ですが、あくまでもC++から使ってみようっていう話。 ffmpegのバイナリを使うって話はググれば山ほど出てくるんだけど、Cのライブラリを使うって言う話はあまり出てこなかったので、備忘録を兼ねて。そもそも、どうしてffmpeg…