Python Dockerでデータ分析環境を構築してみた(Miniconda + RDKitなど、日本語対応も) 2020年9月18日 punhundon ぷんたむの悟りの書 Dockerでデータ分析環境を構築する方法をまとめてみました。 UbuntuをベースにMinicondaを導入し、さらにRDKitやPym …
情報科学 パラメトリックモデルとノンパラメトリックモデル 2020年3月28日 punhundon ぷんたむの悟りの書 機械学習を勉強していると出てくる、パラメトリックモデルとノンパラメトリックモデル。 モデルの構築方法はパラメトリックな手法とノンパラメトリ …
情報科学 次元の呪いとは?説明変数が多すぎると、汎化性能が悪くなる。 2020年3月15日 punhundon ぷんたむの悟りの書 説明変数は多ければ多いほどよいわけではありません。 説明変数が多すぎると、テストデータに対する予測精度が悪くなる(汎化性能が悪くなる)など …
情報科学 カーネル法、カーネルトリックの意味について 2019年12月29日 punhundon ぷんたむの悟りの書 非線形な関係性を線形な手法を用いて表現できるのがカーネル法です。 とはいえ、カーネル法と言われてもピンとこないと思います。本記事ではその意味を噛み砕いてみます。 サポートベクタ …
情報科学 多変量解析の意味、PCA(主成分分析)とPLS(部分的最小二乗法)の違い 2019年8月24日 punhundon ぷんたむの悟りの書 品質管理やデータ分析に関わっていると、「多変量解析」という言葉に遭遇します。 そもそも多変量解析とは何なのでしょうか?そして、多変量解析の …
情報科学 バイアスとバリアンスの違い、正則化の意味 2019年6月21日 punhundon ぷんたむの悟りの書 機械学習をやっていると、バイアスとバリアンスのバランスが重要だという話がよく出てきます。 バイアスとバリアンスとは何なのか?バランスをとるとはどういうことか? そして、L1正則 …
Python たった10行のコードで動かせる、物体検出のAIプログラムをマネして作ってみた。 2019年6月14日 punhundon ぷんたむの悟りの書 ツイッターを見ていると、とてもセンセーショナルな記事を見つけました。 なんと、たった10行のPythonコードで物体検出のAIプログラムが …