アプリ版:「スタンプのみでお礼する」機能のリリースについて

CUDAを使って行列と配列のXORの並列計算をしたいのですが早くなりますか?
サイズは行列が64*64、配列が64で、データは整数です。(unsigned char)
整数データの計算は遅くなると聞いたので心配ですが、24ビット以下に抑えれば
浮動小数点と同じ速度で計算できるとも聞きました。SIMD計算に対応していれば
16ビットでもかまいません。詳しい人がいたら情報ください。
よろしくお願いします。

A 回答 (1件)

早くなると思いますよ。


サンプルを実際に書いて、試してみたらいいじゃないですか。
プログラミングガイドもよく見てください。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!