GT200のアーキテクチャの話で面白いのがあった。ちょっと推測に推測が乗っかりすぎの気もするけど。
http://pc.watch.impress.co.jp/docs/2008/0707/kaigai452.htm
warpで何スレッド実行すべきとか、2命令同時発行がアーキテクチャ的にどうやってるとか、なんかうやむやでよくわからんずやっていたが、いろいろ突っ込んでいる。
とにかく、GT200で2命令同時実行の割合が増えているのはいいことだ。
データと命令のレベルの並列性ではなく、スレッドレベルの並列性というのが、良くわかるようなわからんような。演算の粒度は、結局スレッドを実行するユニットにしたがって、データも命令もそのレベルの並列性にはなるわけだろ?まあ、さきにスレッドが来て、あとは決まっていくということかな?
この人の話のストーリーだと、これがR700系では一方違いますとなると思うから、どうちがうのか教えてほしいなあ。
0 件のコメント:
コメントを投稿