cahinerメモ3
chainerドキュメント・チュートリアルのGPUで動かすところの最後がtypo?
Using GPU(s) in Chainer — Chainer 1.0.1 documentation
データパラレルのところのこのコード
optimizer.acumulate_grads(model_1.gradients) #accumulateのtypo optimizer.update() model_1.copy_parameters_from(model_0.parameters) #model_0とmodel_1が逆?
元コードだといつまでも学習が進まないけれど、model_0とmodel_1を逆にしたら進むようになる。
typoっぽいけど自分は物理マルチGPUではなく一つのGPUで仮想的にマルチっぽく動かして無理矢理このコードを試してるのでそれが原因なのかもしれない。
あとgithubの使い方がいまいちわからずバグ報告も気が引ける。自分でリポジトリを作って修正してpull_requestするのかな?自信ない場合はissue?