myun2の???

Your awesome Tagline

Notes

mulpsは3クロックか? / VC++2008のSSE最適化について (from Twitter : self post)

ぉーすごい。多分、パイプラインのお陰だろうけど・・・SSEレジスタへの転送(movaps)は1クロックで終わるっぽいな

さて、mulps(浮動小数点掛け算)も3クロックとかで終わってるっぽいんだけど・・・これ、事実だとしたら、むちゃんこ早いぞ・・・?約3時間前 Twitで

とかまぁ、ここまでやってきた訳なんですけど、どうもVC++2008には”勝手にSSE化”機能があるらしいんよね。ま、折角ここまで勉強してきたんで、今とりあえずインラインアセンブリで書いてますけども。約3時間前 Twitで

後たぶんVC2008の勝手にSSE化は、多分、浮動小数点命令使う代わりにSSE命令使う、とかだと思う。多分パックド演算とかまではやってくれない。・・・と、思うんだけど・・・。約3時間前 Twitで

案外書き方次第で”勝手にパックド演算”とかもありえそ・・・嗚呼・・・大いにありえそう・・・!(苦笑約3時間前 Twitで
まぁでも、多分毎回「SSE使えるかどうか」をチェックするだろうから、その分のオーバーヘッド(まぁ、せいぜい1クロックだけど・・・)は生じると思う。最初に一回チェックして、まるまるSSEコードかどうか切り替えた方が早い!約3時間前 Twitで
・・・はず・・・。なんかもうそのオーバーヘッドすらパイプラインで水の泡になりそうだけど・・・約3時間前 Twitで
まぁ、とりあえず、何にせよ、将来的に「何かで」SSEを使う必要性はあると思うから、基本的な使い方はおさえとこうと思う。・・・で、まぁちゃんとした結果が取れないんだけど。(何約2時間前 Twitで
ちゃんと鳥説見てないだけだった!ちゃんと取れるジャーン!約2時間前 Twitで