2008年8月28日木曜日

2013年に20TFLOPS

NVIDIA主催のNVISIONが開幕中だそうだ。そのweb記事でこんなのが。
http://pc.watch.impress.co.jp/docs/2008/0828/nvision06.htm

2013年に20TFLOPSってそんな、あんたって思ったよ。GT200のPen4的な今の状況からみて、Intelの10GHz超え宣言に似たもんを感じる。

まあ、それはいいとして、それぐらいのGPUならなにができるかっていう予測ムービー画像が最後に出ている。どれだけ信憑性があるのかわからないけど、これまでの進化を考えれば、これくらいのクオリティがリアルタイムに、普通のマシンで動くというのは、ありえるはずだ。でも実際にこれが動くよって、見せられると、すごすぎてそんな世界がやってくるなんて信じられないなあ。

小学生が、家でゲームしてて、これを自由にいじれるってなったら、もう現実と区別つかないとか、本当に起きると思う。大人の自分ですら、このレベルの世界が自由に動かせたら、どうなってしまうんだろうと思う。これはもう事件だな。

でも、これが当たり前になる社会で、さらにその先でなにをどうできるか考えると、とてもわくわくです。

2008年8月22日金曜日

続・Larrabee

IDFがあって、Larrabeeのニュースもでている。
http://pc.watch.impress.co.jp/docs/2008/0822/kaigai461.htm

ソフトウェアよりのGPUだから、Ctのこととかもでてくるのが必然か。しかし、CtとNative 言語があるというのは、混乱を招くような気もするけどなあ。

性能に関する印象は、やはり皆同じような感触を持っているようだ。情報をあまり出さないIntelもそこらへんを一番恐れているんだろう。

こうなってくると、HPCやってる人には大うけだけど、一般にはお寒いという、Cellと同じような状況が激しく起きそうだ。これは、CPUとGPUのはざまのチップの宿命だな。どっちつかずだけど、一部のニッチ市場、新興市場のみでヒットという。

コモディティ化の波がものをいうこの業界で、それに乗れないとなると成功はできない。ゲームでもなんでもいいから、数が出てしまえばいいんだけど。HPCでやってるのが生活で使われるような社会が到来する、もしくは作り上げれるというのがあれば、逆にとんでもなく大儲け。

そのカギというのは、高性能チップの性能を使いこなした、キラーアプリの登場ということに尽きるのだろう。

なんにもあてもないわけじゃなくて、こんなんできる、あんなんできるっていうのが、とにかく研究レベルではいっぱいあるわけで、そんなに割の合わない賭けでもないと思うんだけどなあ。

そんなキラーアプリが、実はグラフィック処理の分野にあるのかもというIntelの読みから、LarrabeeはGPUとして舵を切っている部分が、ひょっとしてあるのだろうか?いや、知らんけども。

2008年8月18日月曜日

次世代ゲーム機

PS3とかXbox360とかwiiの次の次世代ゲーム機ってどうなるんだろうと、最近よく思う。

きっかけは、Larrabeeがでてきて、これをどこかが次で採用するんだろうかって思い始めたこと。Larrabeeってちょうど次世代機が出るころだし。

でも、Larrabeeは初物すぎて、各メーカーが乗ってくるかが非常に?だ。それに、x86のGPUにしたら、CPUもx86にしないと、強みが出ないかな?

まず、一番あり得ないと思うのは、SonyがGPUでLarrabee採用。CPUでキャッシュのないCELLで、GPUでキャッシュのあるLarrabeeってそんなばかな話があるだろうか?Cellを一転してやめて、Core + Larrabeeってほうがまだありえるな。RSXはあんまり良くなかったし、ライセンス料もふんだくられているだろうからどっかにか変えたいだろうとは思うけど、x86とRISCを乗せるなんてことは、IBMだってさせないだろう。

つぎに、本命のMS。wintel同盟だし、そこまで、下位互換性にこだわってないし。ガラッと変えるのも可能かも。ただ、そうするとやっぱりCPUもかえるかっていう問題が出てくる。x86でいいCPUがありまっせと、Intelがだせるなら、そういう強みを打ち出せるから、ありえるのかもしれない。AVXで親和性の高いGPUとCPUですみたいな。

最後が任天堂。枯れた技術でがんばるってとこだから、あり得ない気がするけど、今回であきらめた性能面を挽回するんだっていって、larrabeeつかってくるっていうのもないこともないのかも。でも、larrabee乗せて2,5000円とか無理なんじゃないだろうか。う~ん。やっぱないかな。

Sony PS4 Cell2 + ATI (or Nvidia) GPU
MS Xbox gen2 Core + Larrabee
任天堂 IBMカスタムチップ+ なんか普通のGPU

Nvidia、ATIのうちどちらかは、次世代ゲーム機で採用されないかもしれないな。もしくは、そもそも存続していない可能性もあるな。

あと、CPUとGPUをひとつずつ搭載するっていう今の構成が、次世代では変わってくる可能性もあるな。物理とかストリーミング処理用プロセッサを新たに追加ってあるのかも。開発者からもんすごいブーイング来そうだけど。

まだ3年以上先だろうけど、面白くなりそうだ。

のだめ新刊

のだめの新刊を読んだ。ある程度成功をつかんだ漫画が、これからどう展開するのかと思っていたら、どんどん進化していくな。前の巻では、クラシックや演奏する人以外をおいていくような、マニアックな音楽話が結構展開して、アグレッシブでやるなって思ってたけど、今回はまたそれとも違う。コメディ的な皮をかぶりながら、トップアスリートの激しい戦いのようなスリリングさを持ち、実は結構残酷で、人生哲学のような深みを感じる…とまでいうとよくいいすぎ?
ルイは体験できなくても想像できる人だっているなんていってたけど、たとえばこの漫画の作者もそういう人間なのかな?新刊のような微妙な表現をできる作者っていうのは、心の中はそれ以上のことを感じ取って生きているのだろうか?そういう人は素直にあこがれるし、尊敬するなあ。

2008年8月10日日曜日

揺れる気持ち

日記を読み返したら、なんかとんでもない一貫性のなさ…。まあ、まあ、そのときそのときの気持ちを大切にするという方向性で。

昔の日記を読んでみて気づくのは、気持ちがピーク性能と利便性の間で揺れ動いているということ。

Larrabeeは、そこそこ性能でて使いやすいだろうという期待があったんだけど、性能がいまいちな可能性と、Cellと大差ないんじゃないかというので、ちょっとがっかり。

実際に登場するときには、価格というファクタも入っていくるから、またわからなくなるな。結局、2年後に実際出て、使えるようになって、環境ができて、そのときにならないとわからないな。

ようするに、わからん、わからん。やはりやってみないとわからんな。やればいいのだ。

2008年8月6日水曜日

larrabeeさあ、どうなん?

Larrabeeの詳細が発表されたということで、だいぶWeb記事もでたなあ。世間的な反応は思ったほどなかった気もするな。

自分はというと、もんすごい注目してたけど、結構、え?っていう内容だったな。これ大丈夫?って感じ。別に根拠とかなかったんだけど、GPUより性能はうえで、キャッシュもあって、タイルっぽい作りで、みたいな勝手な思い込みがあったのでなおさら。

でも、ふたを開けたら、かなりCell。キャッシュはあるけど。ピーク性能ではGPUには勝てそうにないところもCellと同じ。リングバス。えー。

しかし、コア増やして性能スケールするのって本当だろうか。プログラムが簡単に書けるというのも、なんか怪しいなあ。

あと、今回の発表でコア数とか演算性能をはっきり数字で示していないのも、性能があんまりでないからじゃないだろうか。GT200と同じか倍ぐらい性能出る予定だけど、でるの2年後と公表したら、みんながっかり~になっちゃうからじゃなだろうか?でも、汎用なGPUだったら、それぐらいの性能にならざる終えないよなあ、現実としてさ。

出る前に勉強して、がって使ってやろうかと思ったけど、これはかなり微妙だ。GPUとして生きていくのもしんどそうだし、普通のCPUとして生きていくのは無理そうだし、なんだこれ…。無理やりゲームで使ってもらえばいいかな。そしたら、Cellもやる気でて、さらに進化してくれるかも!

そういや、CellのLSの評価の試金石として、これ以上ない相手ではあるな。まあ、Cellが次世代でキャッシュ乗せてくることもありうるけど。

ひさしぶりのcuda

最近、cudaをいじりいじり。

半年ぶりで、いろんなことを忘れまくっている。shared memoryがblockごとに共有だったのを忘れてて、一苦労。改めて思うけど、shared memoryの定義の仕方って、なんか混乱するなあ。初めての人は絶対あれ?ってなるんじゃまいか?2周目なのにあれってなった。

それにしても、shared memoryってこんな少なかったっけ?全部で数百KBだったっけ?Cellとそんなに変わらんように思い込んでたけど。GT200でsmあたりの容量が増えると思ったのになあ。増えんかった。むー。

2週目にして思うんだが、cudaはハードの抽象化がやや強くて、複雑で、Cellの方がかえってわかりやすいな。抽象化のせいか、メモリのアラインメントのとり方で、最適化する方法がごちゃごちゃしすぎじゃないか?SIMTで、連続したメモリの転送を考えるのは、本当にパズルだ。何千というスレッドプログラミングで、メモリの転送を効率化するというのは今までにない、難しい問題かもしれない。これは次期cudaのバージョンで解決されるかもしれないし、解決されない問題かもしれないなあ。これさえ解決されれば、SIMTってなかなかいいと思うんだけどなあ。

2008年8月2日土曜日

おすすめ

http://d.hatena.ne.jp/rarirulelele/20070504

これいいなって、ひとにいってまわりたい。

でも、変に騒がないほうがいいかなとか思ったり、だからといって、黙ってるのももったいないというか。


だから、こっそり、ここだけで、おすすめしとこう。きっと5年たったらなんかなってると思うぞい。ふふふ。