studylog/北の雲

chainer/python/nlp

Chainer1.4.0は延期

二週間後の10月28日に延期されました。
モデルの構造をがらっと変えるための議論と実装に時間がかかっているようです。

公式のモデル保存&読み込み方法も実装される予定でしたが、いずれも1.5.0(11月下旬?)になりそうです。
今のFunctionSetをpickleで保存するやり方ではバージョン間の互換性が保てない問題があるっぽいんですよね。
あと、もしモデル構造が変わると以前のバージョンとの互換性がますます無くなっちゃうんでしょうか。
ドキュメントもgithubも全部英語なので追うのが大変です。

他に1.4.0で気になってるのは

  • cuda.initの復活(例外を出すのではなくdeprecatedを出すだけにして1.3より前のコードとの互換性を維持)
  • cupyのallとany
  • タスクによってはLSTMよりも精度が高いGRU
  • LSTMのAPIの変更?(入力をLinearで4倍にしなくてよくなりそう)

このあたり。
楽しみに待ちたいと思います。