折角、最新の40シリーズを買ったのに思ったほど速度が出ない!
30シリーズより40シリーズの方が遅いじゃないか!
そんな事で、お困りではありませんか?
私も数日間、超遅い状態でRTX4090を使っていたのでここにまとめておきます。
ぶっちゃけ、機械学習のライブラリを更新するだけのお手軽作業です。
期待される動作スピードですがグラフの上が上書き後、下が初期状態です。
だいたい半分の時間で生成が完了するようになりました。
※アスカベンチマークを4090で実施したデータ
ダウンロード
まずは下記サイトから、必要なファイルをダウンロードしてきます。
embed: developer.nvidia.comダウンロードするためには、規約に同意しNVIDIA Developer Programへの登録が必要です。登録が完了したら、最新のcuDNN for CUDA 11.x を入手します。
※for CUDA 12.0は利用できません。
ファイルを上書き
ダウンロードしたファイルを解凍し、binフォルダ内にある"~~~64_8.lib"の7ファイルを"stable-diffusion-web-ui\venv\Lib\site-packages\torch\lib" に上書きします。
上書きを行う前に、念のため"lib"フォルダごとコピーしてバックアップを作っておきましょう。
これで作業は完了です。
正常にStableDiffusionが起動し、いつもよりサクサク画像が生成できればOKです。
起動しない等の問題があれば、バックアップをもとに戻して最初から再トライしてみましょう。