2008年7月7日月曜日

teslaのアーキテクチャ

GT200のアーキテクチャの話で面白いのがあった。ちょっと推測に推測が乗っかりすぎの気もするけど。

http://pc.watch.impress.co.jp/docs/2008/0707/kaigai452.htm

warpで何スレッド実行すべきとか、2命令同時発行がアーキテクチャ的にどうやってるとか、なんかうやむやでよくわからんずやっていたが、いろいろ突っ込んでいる。

とにかく、GT200で2命令同時実行の割合が増えているのはいいことだ。

データと命令のレベルの並列性ではなく、スレッドレベルの並列性というのが、良くわかるようなわからんような。演算の粒度は、結局スレッドを実行するユニットにしたがって、データも命令もそのレベルの並列性にはなるわけだろ?まあ、さきにスレッドが来て、あとは決まっていくということかな?

この人の話のストーリーだと、これがR700系では一方違いますとなると思うから、どうちがうのか教えてほしいなあ。

0 件のコメント: