studylog/北の雲

chainer/python/nlp

cahinerメモ3

chainerドキュメント・チュートリアルGPUで動かすところの最後がtypo?
Using GPU(s) in Chainer — Chainer 1.0.1 documentation

データパラレルのところのこのコード

optimizer.acumulate_grads(model_1.gradients) #accumulateのtypo
optimizer.update()

model_1.copy_parameters_from(model_0.parameters) #model_0とmodel_1が逆?

元コードだといつまでも学習が進まないけれど、model_0とmodel_1を逆にしたら進むようになる。
typoっぽいけど自分は物理マルチGPUではなく一つのGPUで仮想的にマルチっぽく動かして無理矢理このコードを試してるのでそれが原因なのかもしれない。

あとgithubの使い方がいまいちわからずバグ報告も気が引ける。自分でリポジトリを作って修正してpull_requestするのかな?自信ない場合はissue?