2009年10月1日木曜日

Fermiきたー

http://pc.watch.impress.co.jp/docs/column/kaigai/20091001_318463.html
http://www.4gamer.net/games/099/G009929/20090930012

GT300は、いろんなうわさがありつつ、本当かな~と眉唾でまっていたが、これはうわさ以上でしょう!

ECC対応
MIMD化
倍精度演算大幅向上
コンフィグラブルなShared memory or キャッシュ
メモリ空間の統合

まず、 上の3つはまことしやかにうわさされていたけど、そんなすぐには無理だろうな、あと数年かけて段階的にだろうなと思っていたのが、いっぺんにきたー!これはすごい。このうちの一個でもできれば、万々歳だと思っていたら、すごい!Nvidiaは、AMDの流れでひよるどころか、思いっきりHPCの流れを出してきた。そんなにHPCってもうかっているのだろうか?Nvidia本気だな。

その次の2つは全くの予想外だった。Shared Memoryは、もうこのままあまりいじらないのかなとおもっていたけど、最近AMDは倍増してたからひょっとしてとは思っていたが、まさかキャッシュもいれるとは。これで、結果的に、Larrabeeとかなり近い構成になってきた。整数演算用のパイプも別に入れてきたのもそうだ。これって、画像処理でも有効に使えるもんなの?

あとは、性能的なところは、うわさのとおり、ほぼ倍増。GDDR5。

あと、気になるのが、SMあたりのSPの4倍増。 命令ユニットも増えた。この結果、Warpは変わるのかってところ。今までは8SP*4clockで32threadだったけど、32SP*1clock=32threadになるんだろうか?そうだとして、これがどう効いてくるかは、わかりやすいのでいえば、逐次で実行される命令数の数が増えるってこと。CPUが3GHzくらいで実行できるのに対して、Fermiでは1.6GHzくらいで実行できるようになって、遜色なくなってくることになるかもしれなくて、逐次計算が必要なある種のアプリケーションでは非常にありがたいだろう。実は自分も最近リアルタイム計算とかやっているので、これはありがたいかも。

あと、複数カーネルの実行ができて、メモリ空間が統合されるとなると、例えば他のSMのShared Memoryに直接アクセスできるようになるのかなっていうのも気になるところ。Atomicの命令を改善するみたいだし、それをやるってことは、まわりまわって、ひょっとしたらできるかもしれないな。

こうなってくると、もうほとんど16コアの32ワイドのベクタ長のCPU見たいなもんだ。すごいな。FermiとQuadのCore i7 とか載せていると、CPUが二つのっているような感じで変な気になってくるな。

あとは、本業の画像処理性能がどれだけあるのかっていうのと、これだけ改良して不良なくちゃんと動くのか、発熱問題は大丈夫なのかとかってところ。 Tesla世代のプログラムもちゃんと動くのかって言うのも、結構大切かも。でも、Fermiをがっつりうごかすには、Teslaのプログラムをかなり手を入れないとだめかも。まあ、自分は趣味なんでいいですけど。

これは、他のプロセッサにすごい影響与えるな。特にLarrabeeと、もろにバッティングするだろうから(ピーク性能ではFermiが上)、 Larrabeeが、自分の位置づけをどうするか。AMDのGPUは、Nvidiaとはもうかなり別モンになりつつあり、このままいくと、どっちかがトレンドをはずして死ぬこともあるかもしれない。どちらもそれぞれの立ち位置で生きていけるってのもあるかもしれないけど。GPUの本業としての利益に比べたら、HPCの利益なんてたいしたことないと思うんだが、そうするとAMDの方がまともに商売やっていけそうな気がする。でも、IntelとNvidiaをみていると、汎用的なGPUに時代の流れは向かっている。どうなるんだろう。やっぱり、問題はキラーなアプリケーションしだいかな。あと、次世代ゲーム機の動向も、GPUの流れを決めるだろう。その観点からみると、一体なにが選ばれるんだろう?

あ、Cellはどうなんだ?

0 件のコメント: