トップ 新規 編集 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

GPU実験用PCまとめ

[GPU]

数が増えてきたのでまとめ。基本的に,「NIS/Automountが利用可能で誰でも使える実験用計算機」のみを掲載するページということでお願いします.

GPU実験意外にも適当に(コンパイルテストや実行テストなどに)使って構いませんが,多大な負荷をかける場合や長時間に渡って占有したい場合などはMLで断ってからにしましょう。

運用方法(案)

複数バージョンのCUDAを入れるために,/opt/NVIDIA_CUDA_SDKや/usr/local/cudaは利用せず,/opt/NVIDIA_CUDA_SDK_x.yや/usr/local/cuda_x.yなどを利用する.必要に応じて個人が環境変数を設定する.

    • PATH に /usr/local/cuda_x.y/cuda/bin を追加
    • LD_LIBRARY_PATH に /usr/local/cuda_x.y/cuda/lib を追加
      • CUDA3.0の場合、64bitOSなら/usr/local/cuda_x.y/cuda/lib64を追加
      • 「error while loading shared libraries: libcudart.so.2: cannot open shared object file: No such file or directory」が出る場合はこの設定ができていない!
    • C_INCLUDE_PATH およびCPLUS_INCLUDE_PAHに /usr/local/cuda_x.y/cuda/include を追加,さらに/opt/NVIDIA_CUDA_SDK_x.y/common/inc(/opt/NVIDIA_GPU_Computing_SDK_x.y/C/common/inc)を追加.
  • nprec3とteslaで試験運用中
  • 注意
    • CUDA2.3から/opt/NVIDIA_CUDA_SDK_x.yは/opt/NVIDIA_GPU_Computing_SDK_x.y/Cに変更になりました.

CUDA導入方法メモ

  1. 準備
    • ドライバの導入におそらくgccが必要。yum install gcc-c++ などしておく
  2. ドライバを導入
    • yum install kernel-devel などしてカーネルヘッダを導入しておく必要あり
  3. toolkitを導入
    • インストール先を /usr/local/cuda ではなく /usr/local/cuda_x.y にする
  4. sdkを導入
    • インストール先を ~/NVIDIA_CUDA_SDK ではなく /opt/NVIDIA_CUDA_SDK_x.y にする
    • toolkitのパスを /usr/local/cuda ではなく /usr/local/cuda_x.y/cuda にする
      • toolkitのパスに注意。cuda_x.yのあとにcudaがつきます
    • /opt/NVIDIA_CUDA_SDK_x.yでmake
      • /opt/NVIDIA_CUDA_SDK_x.y/lib以下にlibcutil.aを作ることが重要
      • root権限が必要ですねこれ
  5. その他のソフトウェアを導入
    • yum install freeglut-devel libXmu-devel libXi-devel libXext-devel
    • 64bit環境では yum install /usr/include/gnu/stubs-32.h も必要か?
    • glewが必要になる可能性もあり

性能確認方法メモ

  • サンプルのdeviceQueryを実行すれば基本的な数値は確認可能.
  • メモリクロックはdeviceQueryではわからない.

GPU実験用PC一覧(動作中)

各種ソフトウェア

  • 基本的にデフォルトのyumリポジトリから入手.不定期にyum update.
  • 一部のソフトウェアは野良で拾ってきて導入.

という緩い管理を行っています.バージョン問題など不具合が起きる場合は管理者までご連絡ください.

tesla3 (192.168.208.81) / Xeon + Tesla S1070

  • GPU Tesla S1070
  • CPU Core Xeon X5550
  • Mem 12GB
  • OS CentOS 5.3 x86_64
  • NIS/automount ○(hpclab)
  • CUDA 3.0
  • 備考
    • TeslaS1070のすごいやつ。CPUも強力です。
    • 2台目もありますが、現在準備中。
    • ページ上の運用方法にのっとってないので注意

nprec1 (192.168.208.179) / Xeon + GeFroce GTX 280

  • GPU GeForce GTX 280
  • CPU Xeon E5345 2.33GHz (DualProcessor,合計4コア?)
  • Mem 4.0GB(32ibtOSのため3.2GB使用可)
  • OS CentOS 5.0
  • NIS/automount ○
  • CUDA 2.0
  • 備考
    • deviceQuery
$ /opt/NVIDIA_CUDA_SDK/bin/linux/release/deviceQuery
Device 0: "GeForce GTX 280"
 Major revision number:                         1
 Minor revision number:                         3
 Total amount of global memory:                 1073479680 bytes
 Number of multiprocessors:                     30
 Number of cores:                               240
 Total amount of constant memory:               65536 bytes
 Total amount of shared memory per block:       16384 bytes
 Total number of registers available per block: 16384
 Warp size:                                     32
 Maximum number of threads per block:           512
 Maximum sizes of each dimension of a block:    512 x 512 x 64
 Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
 Maximum memory pitch:                          262144 bytes
 Texture alignment:                             256 bytes
 Clock rate:                                    1.30 GHz
 Concurrent copy and execution:                 Yes

tesla (192.168.208.59) / Core i7 + Tesla C1060

  • GPU Tesla C1060
  • CPU Core i7
  • Mem 4GB
  • OS CentOS 5.2 x86_64
  • NIS/automount ○
  • CUDA 2.1, 2.2
  • 備考
    • GPUの搭載メモリが4GBと巨大なのが特徴.
    • NICの認識にこけることがあるので注意.
      • r8168のモジュールが必要なのにr8169が呼ばれてしまう.対処法は以下の通り.yum updateなどでkernelを更新したらその都度必要.
# cd work/r8168-8.011.00
# rmmod r8169
# make install
# depmod -a
# modprobe r8168
    • deviceQuery
$ /opt/NVIDIA_CUDA_SDK_2.1/bin/linux/release/deviceQuery
There are 2 devices supporting CUDA

Device 0: "Tesla C1060"
 Major revision number:                         1
 Minor revision number:                         3
 Total amount of global memory:                 4294705152 bytes
 Number of multiprocessors:                     30
 Number of cores:                               240
 Total amount of constant memory:               65536 bytes
 Total amount of shared memory per block:       16384 bytes
 Total number of registers available per block: 16384
 Warp size:                                     32
 Maximum number of threads per block:           512
 Maximum sizes of each dimension of a block:    512 x 512 x 64
 Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
 Maximum memory pitch:                          262144 bytes
 Texture alignment:                             256 bytes
 Clock rate:                                    1.30 GHz
 Concurrent copy and execution:                 Yes

Device 1: "GeForce 8500 GT"
 Major revision number:                         1
 Minor revision number:                         1
 Total amount of global memory:                 536150016 bytes
 Number of multiprocessors:                     2
 Number of cores:                               16
 Total amount of constant memory:               65536 bytes
 Total amount of shared memory per block:       16384 bytes
 Total number of registers available per block: 8192
 Warp size:                                     32
 Maximum number of threads per block:           512
 Maximum sizes of each dimension of a block:    512 x 512 x 64
 Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
 Maximum memory pitch:                          262144 bytes
 Texture alignment:                             256 bytes
 Clock rate:                                    0.92 GHz
 Concurrent copy and execution:                 Yes

nprec3 (192.168.208.160) / Xeon + Quadro NVS 290

  • GPU Quadro NVS 290
  • CPU Xeon (QuadCore)
  • Mem
  • OS
  • NIS/automount ○
  • CUDA 2.1, 2.2
  • 備考
    • 現在動いてません
    • deviceQuery
Device 0: "Quadro NVS 290"
 Major revision number:                         1
 Minor revision number:                         1
 Total amount of global memory:                 267714560 bytes
 Number of multiprocessors:                     2
 Number of cores:                               16
 Total amount of constant memory:               65536 bytes
 Total amount of shared memory per block:       16384 bytes
 Total number of registers available per block: 8192
 Warp size:                                     32
 Maximum number of threads per block:           512
 Maximum sizes of each dimension of a block:    512 x 512 x 64
 Maximum sizes of each dimension of a grid:     65535 x 65535 x 1
 Maximum memory pitch:                          262144 bytes
 Texture alignment:                             256 bytes
 Clock rate:                                    0.92 GHz
 Concurrent copy and execution:                 Yes

GPU実験用PC一覧(非動作中,別用途への転用可能?)

optiplex64a (192.168.208.173)

  • GPU GeForce8800GT
  • CPU PenD *.*GHz
  • Mem 2GB ?
  • OS CentOS 5.x
  • NIS/automount ○
  • CUDA 1.1 2.0beta

endeavor0b (192.168.208.168)

  • GPU GeForce8600GTS
  • CPU Pen4HT 3.0GHz
  • Mem 1GB
  • OS CentOS 5.x
  • NIS/automount ○
  • CUDA 1.1
  • 備考
    • /proc/cpuinfo:endeavor0b_cpuinfo.txt(14)
    • endeavor0bは鈴木淳也(@島津研)個人用PCに移行しました。

endeavor0a (192.168.208.167)

  • GPU GeForce 8800GTS 512MB
  • CPU Pen4HT *GHz
  • Mem 1GB
  • OS CentOS 5.x
  • NIS/automount ○
  • CUDA 1.1
  • 備考

endeavor01 (192.168.208.161)

  • GPU Quadro FX 4600
  • CPU Pen4HT *.*GHz
  • Mem 1GB?
  • OS
  • NIS/automount
  • CUDA
  • 備考 1000W電源搭載

endeavor04 (192.168.208.164)

  • GPU *
  • CPU Pen4HT 3.0GHZ
  • Mem 1GB
  • OS ?
  • NIS/automount ?
  • CUDA ?
  • 備考

endeavor05 (192.168.208.165)

  • GPU GeForce GTX 260
  • CPU Pen4HT 3.0GHZ
  • Mem 1GB
  • OS CentOS 5.x
  • NIS/automount ○
  • CUDA 2.0
  • 備考

GPU実験用PC一覧(未分類)

【endeavor02 (192.168.208.162)】:史 占有

  • GPU GeForce9600GT
  • CPU Pen4HT 3.0GHz
  • Mem 1GB
  • OS Fedora8
  • NIS/automount ○
  • CUDA 1.1
  • 備考 史の作業機なので、他のプログラムが色々と動いているかもしれません。
endeavor0b_cpuinfo.txt[削除]

最終更新時間:2010年07月29日 11時10分38秒