2009年1月3日土曜日

ガンズアンドローゼズ

このまえ近くのジャスコにいったら、ガンズの新譜のポスターが貼ってあった。
その前で5才くらいの子が、
「お母さんこれ、かっこいい、かっこいい~」
と、泣きながらお母さんに訴えていた。
お母さんはわかった、わかったからもういくよと、泣き叫ぶ子を無理やり引っ張っていきました。

やっぱ、ガンズすげー!!!

2008年12月17日水曜日

LarrabeeとCell

http://pc.watch.impress.co.jp/docs/2008/1217/kaigai481.htm
抜粋
仮想マシンを走らせるCPUコア間では、キャッシュの間でコヒーレンシを保つ必要がない

なるほど、そりゃそうだ。そういう発想はなかったわ~(おれ、あほ?)。
コヒーレンシを限定的にするという方向が、究極までいくとLSになるわけか。これはいいかもしれない。でも、それって実装はそんなに簡単にできるもんなんだろうか…?

まあ、それは置いとくとして、思ったのはLarrabeeはCPUとCellの間なんだなってことだ。

CPU -Larrabee -Cell- GPU

でも、CellはCPUで、LarrabeeはGPUと。

Cell2はGPUとCPUのどっちの方向にむかうだろう。PPE強化という点では、CPU的な性能が強化される。SPEの数が増えるので、GPU的になるといえばなるが本質じゃない?はて。

LSが増えたら、どっちだろう?どんなインパクトを持つだろう?1MのLSを持つSPEって意味あるだろうか?うーん、本質的ではないような気もするが。まあ、どうせ無理かな。よくて倍増だろう。いやそれもないな。

それにしても、ここまで似てるなら、OpenCLでCellとLarrabee用で同じ最適化オプションとかできそう。どうなることやら。

2008年12月16日火曜日

40年前の夢

Cnetでマウス生誕40周年についての話が出ていた。

http://japan.cnet.com/news/biz/story/0,2000056020,20385224,00.htm

40年前では夢のような世界に、今我々はまさにいるんのだ。すごいこった。

次の40年でいったい何がかなうかな。

2008年12月7日日曜日

ぼーっとしていると今年も終わり

最近、いろんな忙しさが少しおさまり、燃え尽きちまったぜな感じ。でも本当はぼーっとばかりもしていられないんだけどなあ。もう疲れた。

そんなときは、何も考えずに、OSでもインストールすりゃいいんですと、PS3×6台にLinuxインストール。いまだにFedora core 6とSDK2.1を使っている私。

そんで、久し振りOpenCV on the Cellもインストール。やり方を忘れてたが、まあすんなりできた。よかった、よかった。このまえ、質問してきた人はうまくできたんだろうか?すこし気になるが、返事がないからできたんだろう。

今年はずいぶんPS3にLinuxをインストールしたな。20台近くしているな。なんも偉くもないけど、えらい気がするよ。少し空しいけど。

あと、CUDAもずいぶんインストールしたな。今、GT200がまわりに10枚以上はあるので、10TFLOPSですね。自慢。俺のじゃないけど。CUDAはインストール簡単だから別にそんなに苦労してない。

Cell×15=3TFLOPSとあわせて13TFLOPSくらい。すげー。

しっかし、GPUの進化は本当に早い。去年の今頃初めて、いつのまにかCUDAのバージョンも2.0になっちゃって、環境も知らないうちにいろいろ進化している。Global memoryのCoalesceさせる条件とか変わってて、知らずに最適化するところだった。わりと条件がゆるくなってよいな。Bank Conflictの条件も変わった?もともとあんまりそこら辺を把握してなかった可能性もある。もう一回くらい、プログラミングテキスト読んだほうがいいな。

GT200って、やれることは、G80世代から大きくは進化しているように見えない。見えない部分で根本的に変えているところとかあるんだろうけど、つかってる側からしたら、規模が倍に増えただけにしか感じない。もちろん倍精度ができるようになったとかあるけど。

今度はどうなるかなっていうのが、やっぱり気になってくる。個人的には、Shared Memoryが増えてくれないかなといっつも思う。CellでもLS増えないかなともいっつも思うように。これは、みーんな思っていることだけど、なかなかかなわない。互換性の問題?十分だという判断?うーむ。

あと、SM間の直の通信とか、SMの独立性をあげるとか、より汎用的なマルチコアみたいになる可能性ってあるんだろうか?これに舵を切ったら、完全にCellみたいになってしまうので、意味があるのかわからないけど、どうなんだろう。でも、そんな能力はGPUでは無意味だろうか?

やっぱり、GPUである以上、そのメインの使い方がどうなるかっていうのが、まずありきで、そこから汎用的な使用にすり合わせられるわけだから、そこがどうなるかという、市場の要請みたいなのを一番に考えて予測するべきだろうか。だとすれば、unreal engineの人の講演の話ででている、より柔軟なGPUの道がこれからのメインストリートだろう。だとすれば、やっぱりCell的にならざるを得ない。

そうすると、やっぱりCPUとGPUとの汎用性の差というのの境界がどんどん近付いてきて、GPUが消滅するっていう話になったりするが、そうなんだろうか?そしてCPUとGPU混合というストーリー。

でも、GPUとCPUの割合が、固定っていうのがうまくいくのだろうかと、いつも思う。それは、人やアプリケーションによって全然変わってくるから、難しい。

だから、FPGAみたいに一部のロジックを可変にして、ある時はCPU、ある時はGPUみたいなのを動的に変えられないだろうか。CPUの有利な処理のときは、大きなCPUを10個。GPUの有利な処理のときはCPU2個、GPU1000個とか。

そしたら、結局、全部FPGAでやれってことになるんだろうか。っていうか、そんな動的なシステムできるわけないか。

いや、そもそも、CPUとGPUの違いって言ったら、逐次か並列化ってのが大きな違いで、CPUは多くても数個で事足りる?どんどんわけがわからなくなってきた。

2008年11月21日金曜日

エンコ対決

最近、spursEngineとCUDAでエンコができる記事をよく目にする。それが実際どんなもんかというのがでていた。

http://pc.watch.impress.co.jp/docs/2008/1120/tawada157.htm
http://pc.watch.impress.co.jp/docs/2008/1121/tawada158.htm

なんか、びみょ~な気が…。そりゃ速くなってるのもあるけど、あんま変わってないほうが多くないか…。ものによっては遅くなっている。

こういう処理では、ばかっぱやが連発するのかなと思っていたが、そうでもないんだな。それともまだ最適化が甘いだけなんだろうか?

それにしても、企業が専用に用意してこれなわけだから、これが現状のマルチコアの現実とみるべきだ。速くなることもあるが、確率は五分五分だよと。うむむむ。

2008年11月7日金曜日

TESLA、うほ

最近また、GPUをいじってる。前回はまあ、使えるってのを確かめるって感じだったけど、今回は本気で使うことになってるのだ。しかもGTX280*3で。うほ。でも、さすがに3枚使い切るのはなかなか大変そう。まだ1枚すら使い切れない。なんて贅沢な。

と思っていたら、別のルートからTESLA*4キター!!!メモリは一枚で4GBとかですよ。すごー。ということは、今周りに7TFLOPSのマシンがあることになるなあ(俺んじゃねえけど)。地球シミュレータの1/6のパワーが今ここに!

うおー、もったいねえ。これをドガーンと使い切ってやりたもんだ。

2008年11月1日土曜日

覚悟というのは気合いではなく、毎日毎日階段を上っていくという作業でしかない。

ガンダムの富野監督のもんすごいインタビュー記事があった。

http://www.itmedia.co.jp/news/articles/0810/31/news118.html

全体の印象として、こういう勇気のいることをずばっといってくれて痛快であり、人生訓として非常にためになる小言だと思った。内容はいい部分ばかりじゃなくて、悪い部分もあるけど、清濁併せ呑め的な人生の匂いを感じられた。

その中で、気に入ったというか、これはある種の真実だと思ったのが、

「覚悟というのは気合いではなく、毎日毎日階段を上っていくという作業でしかない。」

という言葉だ。本人は恐らく、若い人に発破かけようという気持ちがあって挑発的なことをいっているが、基本的に自らの経験に基づいて、自分でだした結論や真実しかいっていない。

そういう本当のことというのは、何より尊いのだと思う。それこそ、人種やお金などを飛び越え、人類にとって、一番強くて、価値のあることだろうと思う。それが匂いを放つんだろう。

だから、自分は自分で、なにかを見つけていかなければ、面白くないよな。