トップ 新規 編集 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

GPU Challenge 2009

[GPU]

ここは?

SACSIS2009併設企画 GPU Challenge 2009に関する情報共有の場

大会スケジュール

現時点での予定です.予告なく変更にあることがあります.ご了承ください.

2009/01/21
課題概要公開,参加受付開始
2009/02/03
ツールキット公開
2009/02/20
参加受付〆切(延長しました)
2009/03/25
規定課題プログラム提出〆切,自由課題レポート提出〆切
2009/05/28〜
SACSIS2009にて表彰(予定)

課題

GPU Challenge 2009 の規定課題は「文字列の編集距離計算」です.

共有ファイルはbluebaseの /home/doc/document/GPUChallenge2009 にでも保存しましょう。

ツールキット

コンテスト用マシン情報

  • OS: OpenSUSE Linux 10.3
  • CPU: Dual-core Opteron 880 x 8 (合計16コア)
  • memory: 32GB
  • GPU: NVIDIA Tesla S1070-500 x 2GPU
    • (Tesla S1070は4GPU含みますが,一マシンからはそのうち2GPUが見えます.規定課題のルールではプログラムが一度に使えるのは1GPUです)
  • toolkit/sdk: ver2.0が入っている模様

実験してみた

デフォルトで測定してみた

  • 実験者:大島
  • 内容:run1からrun9まで測定してみた.これが目安.斜めに並列実行,Thread数は128でBlock数は並列度/128.
  • 使用機種:tesla.yuba.is.uec.ac.jp
  • 使用スクリプト:runall.py, Makefile.bench
- run1 run2 run3 run4 run5 run6 run7 run8 run9
answer 4800 9581 19168 224 2944 38302 56848 62851 68774
strnum(a) 5120 10240 20480 128 384 40960 60800 67200 73600
strnum(b) 5120 10240 20480 256 3328 40960 60800 67200 73600
[CPU] 4800 9581 19168 224 2944 38302 56848 62851 68774
[GPU] 4800 9581 19168 224 2944 38302 56848 62851 68774
min eclock 0.87524199 1.03994107 2.04155612 0.38609886 0.55774212 5.1889329 9.29123712 12.17615008 14.82502508
max eclock 1.05791187 1.86863089 3.76405311 0.45459318 0.65292883 9.24855614 16.37100697 18.84016895 21.76819897

デフォルトで測定し直してみた

測定し直したらだいぶ違う値になった(というか,GPU Challenge中からなっていた模様.上のはなんだろう?エージング不足?)

  • 実験者:大島
  • 内容:run1からrun9まで測定してみた.これが目安.斜めに並列実行,Thread数は128でBlock数は並列度/128.
  • 使用機種:tesla.yuba.is.uec.ac.jp
  • 使用スクリプト:runall.py, Makefile.bench
- run1 run2 run3 run4 run5 run6 run7 run8 run9
answer 4800 9581 19168 224 2944 38302 56848 62851 68774
strnum(a) 5120 10240 20480 128 384 40960 60800 67200 73600
strnum(b) 5120 10240 20480 256 3328 40960 60800 67200 73600
[CPU] 4800 9581 19168 224 2944 38302 56848 62851 68774
[GPU] 4800 9581 19168 224 2944 38302 56848 62851 68774
min eclock 0.1543839 0.24431491 0.474823 0.08552194 0.10665083 1.18567586 2.17426705 2.57916117 2.9698329
max eclock 0.15964985 0.24715996 0.48030305 0.08999801 0.11121416 1.19095993 2.17825985 2.58320212 2.97527599

色々やってみた結果

  • 実験者:大島
  • 内容:色々やっちゃったので,後で……
- run1 run2 run3 run4 run5 run6 run7 run8 run9
answer 4800 9581 19168 224 2944 38302 56848 62851 68774
strnum(a) 5120 10240 20480 128 384 40960 60800 67200 73600
strnum(b) 5120 10240 20480 256 3328 40960 60800 67200 73600
[CPU] 4800 9581 19168 224 2944 38302 56848 62851 68774
[GPU] 4800 9581 19168 224 2944 38302 56848 62851 68774
min eclock 0.07092905 0.09300494 0.17454505 0.0544579 0.05931091 0.47296 0.93469906 1.11898112 1.32442999
max eclock 0.07789707 0.14330411 0.22287703 0.10834885 0.06348419 0.47815895 1.13983703 1.43120289 1.87265205

コメント

お名前: コメント:

最終更新時間:2009年03月21日 19時58分34秒