トップ 新規 編集 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

共用計算機の管理情報

[管理情報]

管理情報

管理者:

  • 松本
  • 久米
  • 大島
  • 田邊
  • 平澤

HPのブレード (HP ProLiant BL20p G3)

  • hpbla…稼働中
    • hpbla[1-8] (hpbla[1-8].yuba.is.uec.ac.jp, 192.168.208.[190-197])
    • hpbla1
      • RAID
    • hpbla[2-8]
      • 2 Logical Drives
  • hpblb…稼働中
    • hpblb[1-8] (hpblb[1-8].yuba.is.uec.ac.jp, 192.168.208.[120-127])
    • hpblb[1-6,8]
      • 2 Logical Drives
    • hpblb7…HDD故障によりSTOP→HDD交換済み

Dellのブレード (Dell PowerEdge 1955)

  • pe…電源OFF
    • pe[1-5] (pe[1-5].yuba.is.uec.ac.jp, 192.168.208.[112-116])

旧Dellブレード (bluecore)

  • フロントエンド:bluecore.yuba.is.uec.ac.jp (172.21.64.175)
  • 計算ノード: comp[34][1-6]

Cellマシン (PLAYSTATION3, Cell Reference Set)

  • PLAYSTATION3…稼働中
    • ps3a (ps3a.yuba.is.uec.ac.jp, 192.168.208.136) -
    • ps3b (ps3b.yuba.is.uec.ac.jp, 192.168.208.137) Fedora Core 10
  • Cell Reference Set…返却済みにつき使用不可能
    • cell (cell01.yuba.is.uec.ac.jp, 192.168.208.117)

Cellマシンの管理情報も参照

共用WindowsPC (講座共通)

optiplex64f (optiplex64f.yuba.is.uec.ac.jp, 192.168.208.178)

GPU実験用

GPU実験用PCまとめを参照

Phenom X4 9850搭載マシン (講座独自製作マシン)

  • phenom…稼働中
    • phenom1 (phenom1.hpc.is.uec.ac.jp, 192.168.208.181)
    • phenom3 (phenom3.hpc.is.uec.ac.jp, 192.168.208.183)
    • phenom4 (phenom4.hpc.is.uec.ac.jp, 192.168.208.184)

NIS, Automountの設定

NIS

インストール時に設定する部分があるのでそれを利用する。

インストール時に設定をしなかった場合は……(めんどくさくて放置中)

→ypbindで,NISドメインにyuba.is.uec.ac.jp,NISサーバにredを指定する (MD5?)

# vi /etc/yp.conf
"ypserver 192.168.208.51"をついか
 
もしくは

"domain yuba.is.uec.ac.jp server 192.168.208.51"をついか

その後ypbindとかで調べていろいろと設定してください.GUIとかでやるのもいいのではないかと思います.

Automount (bluebase, DNSで逆引き可能ホストのみ)

/etc/auto.master

/net -hosts

以下に

/home auto.indirect.home --timeout 60

を追記する。

なお、これをやると/homeが上書きされたような状態になるため、マシンにローカルなユーザ(hpclabなど)のホームディレクトリが/homeに存在しているとアクセス不能になる。そのため、hpclabのホームディレクトリは/usr/local/home/hpclabなどに作成しておくと良い。

管理日誌

2010/3/30 (火) 久米

phenom[1,3,4]の位置を移動

場所確保のため,phenom[1,3,4]の位置を移動しました.

プリンタ(MP-C3500)の前のデスク上→520号室

  • デスク上には現在ディスプレイがあります

2010/3/11 (木) 松本

hpbla5修理

症状
hpbla5の電源が入らない。通電ランプは点灯している。
原因
DCコンバータおよびフィルターモジュールの物理故障
処置
メインボート、DCコンバータ基板、およびフィルターモジュール基板を交換

2010/2/24 (水) 久米

phenom4解放

phenom4を共用計算機に復帰させました.

2010/2/10 (水) 松本

hpbla5の物理故障?

現在hpbla5において電源が入らない症状が発生しています。物理故障な気がしています。今週中に修理依頼をしようと思っています。

この症状は、hpbla5が正常に動作するかどうか確認作業を行っていて発見しました。(2009/12/1に、hpbla5の下段HDDを交換しています。)

一度電源が入り、以下の確認作業を行っている最中に落ちてから電源が入りません。

  • HDD2個のマウント ...OK
  • NIS, Automount ...OK
  • ssh ...OK
  • /optのマウント ...NotYet

hpblb7の動作確認

hpblb7について上段HDDが空の状態だと勘違いしていましたが、すでに復旧済みでした(2009/1/30, 2/2の日誌参照)。

/optの設定が未完了だったため、以下の作業を行いました。

# mount -t nfs bluebase:/home/opts/linux-64bit /opt      # マウント
# ln -s /opt/env/lab-env.sh /etc/profile.d/lab-env.sh    # 環境変数

2010/1/31 (日) 久米

phenom4占有

一時的にphenom4を久米の実験機に移行させました.

2010/1/29 (金) 久米

メモリチャンネル,メモリコントローラの設定変更@phenom[1,3,4]

メモリチャンネルとメモリコントローラの設定を次のように変更しました.

  • phenom1…Dual-channel, Ganged
  • phenom3…Dual-channel, Unganged
  • phenom4…Single-channel

2009/12/8 (火) 久米

phenom4の位置を移動

phenom4の場所を移動して,共用計算機として復帰させました.

場所: プリンタ(MP-C3500)の前のデスク上

  • phenom[1,3]やprecision450bと一緒に並んでいます

2009/12/1 (火) 松本

hpブレードサーバHDD交換

hpbla5の下段HDDが物理的に故障していたので交換修理しました。

2009/9/11 (金) 大島

nprec3を再構築しOpenCLを導入

nprec3(Tesla搭載,クアッドコアXeon)が浮いていたので,試しにOpenCL実験環境を構築してみた.(本当はNVIDIAの登録ユーザしかまだ使っちゃ駄目のような気がしますが…….)

  • 導入手順
    • 185.18.08ドライバを導入
    • developerサイトから入手したopenclsdkを展開してmake
      • CentOS5.3ではgcc/g++の4.3(gcc43,g++43)を導入して利用する(common_opencl.mk書き換え)必要あり

興味がある人はhpclabユーザでログインして動かしてみると吉.

  • hpclabユーザのHomeにNVIDIA_GPU_Computing_SDKディレクトリを作成して展開し,makeしてあります.
  • 実行時にはLD_LIBRARY_PATHなどの設定が必要です.
  • subversionの少し新しい版(1.6)が導入してあります.使う人は注意.

2009/8/12 (水) 大島

teslaにcuda2.3を導入

  • driver
# sh cudadriver_2.3_linux_64_190.18.run
  • toolkit
# sh cudatoolkit_2.3_linux_64_rhel5.3.run
(インストール先指定,ディレクトリを事前に作成しておく) /usr/local/cuda_2.3
インストール後メッセージ(パスの通し方とアンインストール方法)
* Please make sure your PATH includes /usr/local/cuda_2.3/cuda/bin
* Please make sure your LD_LIBRARY_PATH
*   for 32-bit Linux distributions includes /usr/local/cuda_2.3/cuda/lib
*   for 64-bit Linux distributions includes /usr/local/cuda_2.3/cuda/lib64
* OR
*   for 32-bit Linux distributions add /usr/local/cuda_2.3/cuda/lib
*   for 64-bit Linux distributions add /usr/local/cuda_2.3/cuda/lib64
* to /etc/ld.so.conf and run ldconfig as root

* Please read the release notes in /usr/local/cuda_2.3/cuda/doc/

* To uninstall CUDA, delete /usr/local/cuda_2.3/cuda
* Installation Complete
  • sdk
# sh cudasdk_2.3_linux.run
(インストール先指定) /opt/NVIDIA_GPU_Computing_SDK_2.3
(toolkitの場所を聞かれる) /usr/local/cuda_2.3/cuda
toolkitの場所はインストール後に指定してもいいらしい.
Could not locate CUDA.  Enter the full path to CUDA.
If you do not know the path, accept the default and then
modify the CUDA_INSTALL_PATH variable in
/opt/NVIDIA_GPU_Computing_SDK_2.3/shared/common.mk.
インストール後メッセージ(パスの通し方とアンインストール方法)
* Please make sure your PATH includes /usr/local/cuda_2.3/cuda/bin
* Please make sure your LD_LIBRARY_PATH includes /usr/local/cuda_2.3/cuda/lib

* To uninstall the NVIDIA GPU Computing SDK, please delete /opt/NVIDIA_GPU_Computing_SDK_2.3
* Installation Complete
インストール後処理
# cd /opt/NVIDIA_GPU_Computing_SDK_2.3/shared
# make
a - obj/release/shrUtils.cpp.o
a - obj/release/rendercheckGL.cpp.o
a - obj/release/cmd_arg_reader.cpp.o
# cd /opt/NVIDIA_GPU_Computing_SDK_2.3/C
# make
make[1]: ディレクトリ `/opt/NVIDIA_GPU_Computing_SDK_2.3/C/common' に入ります
src/cutil.cpp:29:27: error: builtin_types.h: そのようなファイルやディレクトリはありません
make[1]: *** [obj/release/cutil.cpp.o] エラー 1
make[1]: ディレクトリ `/opt/NVIDIA_GPU_Computing_SDK_2.3/C/common' から出ます
make: *** [lib/libcutil.so] エラー 2

# cd /opt/NVIDIA_GPU_Computing_SDK_2.3/C/common
common/common.mkのCUDA_INSTALL_PATHを書き換え
from CUDA_INSTALL_PATH ?= /usr/local/cuda
to   CUDA_INSTALL_PATH ?= /usr/local/cuda_2.3/cuda
# make
a - obj/release/bank_checker.cpp.o
a - obj/release/cmd_arg_reader.cpp.o
a - obj/release/cutil.cpp.o
a - obj/release/stopwatch.cpp.o
a - obj/release/stopwatch_linux.cpp.o
a - obj/release/multithreading.cpp.o
# cd /opt/NVIDIA_GPU_Computing_SDK_2.3/C
# make
(warningなどが大量に出るが)
Finished building all
と出るので一応OKらしい?

2009/7/16(木)大島

teslaとnprec1にcuda 2.21を導入

sdkのみの更新.toolkitも一応上書き.

  • /opt/NVIDIA_SDK_2.21
  • /usr/local/cuda_2.2

2009/7/16 (木) 松本

共用DocのAutomount

  • whitebaseでNFSエクスポートしている共用Doc(/mnt/iscsi/doc)を/misc/docにマウントするように設定
  • 設定した計算機はhpbla[1-8],phenom[1,3]
    • これで、現在Automountが有効の共用計算機は全てwhitebaseの共用Docをマウントするようになった。
vim /etc/auto.master   # "/misc /etc/auto.misc --timeout=60"
vim /etc/auto.misc     # "doc -fstype=nfs,rw 192.168.208.46:/mnt/iscsi/doc"
/etc/init.d/autofs restart

2009/6/18 (木) 久米

phenom1の位置を移動

長らく僕の手元にあったphenom1ですが,手元にマシンが増えすぎたため,場所を移動しました.

久米の席→プリンタ(MP-C3500)の前のデスク上

  • phenom3やprecision450bと一緒に並んでいます

2009/6/5(金)松本

ps3bの諸設定

  • SELinuxおよびiptablesを無効化
  • NetworkManagerを停止してnetworkを起動
  • NIS, automountの設定を見直し
%                                    # ---- SELinux, iptables停止
% setenforced 0
% /etc/rc.d/init.d/iptables stop
%                                    # ---- NetworkManager停止, network起動
% /etc/rc.d/init.d/NetworkManager stop
% /etc/rc.d/init.d/network start
%                                    # ---- 再起動後の初期設定を上記内容に変更
% vi /etc/sysconfig/selinux          # SELINUX=enforcing を SELINUX=disable に変更
% chkconfig iptables off
% chkconfig NetworkManager off
% chkconfig network on
%                                    # ---- NISが動いていないので設定見直し
% vipw                               # +:::::: を追加
% vigr                               # +:::    を追加
%                                    # サービス再起動
% /etc/rc.d/init.d/rpcbind restart
% /etc/rc.d/init.d/portreserv restart
% /etc/rc.d/init.d/ypbind restart
% ypwhich                            # 確認
red.yuba.is.uec.ac.jp
%                                    # ---- automountも設定見直し
% vi /etc/auto.master                # /host auto.indirect --timeout 60 を追加
% /etc/rc.d/init.d/autofs restart    # サービス再起動

2009/5/14(木)大島

teslaにcuda 2.2を導入

2.1も残してあります.

  • /opt/NVIDIA_SDK_*.*
  • /usr/local/cuda_*.*

2009/5/1(金) 松本

vmubuntuをfuji3上に移送

  • optiplex745gからfuji3へ
  • vCenter Converter Standalone Clientを用いた
  • 同様に仮想OSのpe[1-3]も移送した

2009/4/29 (水) 久米

phenomのメモリコントローラ設定変更

真理究明のために,phenomのメモリコントローラ設定を以下のように変更した.

BIOSの設定画面から,DCTs Modeを

  • phenom1…Ganged(シングル128ビットチャナル)
  • phenom3…Unganged(デュアル64ビットチャナル)

2009/4/22 (水) 松本

CellReferenceSet返却

Cell Reference Set(cell.yuba.is.uec.ac.jp)のレンタル期間が満了したので返却した。

ps3bにCellSDKインストール

ps3bにCell SDK 3.1をインストール。手順はここを参考にした。

2009/3/3 (火) 大島

teslaとnprec3の追加

  • tesla.yuba.is.uec.ac.jp 192.168.208.59
  • nprec3.yuba.is.uec.ac.jp 192.168.208.160

を追加しました.CUDAを使えるように設定しておきますのでご利用ください.

2009/2/10 (火) 松本

pe[1-5]の停止と今後の使用方針

ずいぶん前(去年の11月ごろ)からDellブレードサーバ、pe[1-5]の電源を落としています。# 書き忘れていました。すいません。

まだ検討段階ですが、pe*にVMWare ESXiをのせようかと考えています。ESXiはホストOSを必要しない、直接ハードウエアにインストールする仮想化ソフトウェアです。2008年7月より無償提供されています。

理由は、

  • 現在いろいろなOSがインストールされていて使いにくい状態
  • 2階で運用したい(2階に持っていってもOSインストールなどの設定が容易にできる)
  • 面白そう

現在の作業が一段落したら、話し合って決める予定です。

2009/2/9 (月) 久米

HDDの余っている領域にパーティション割り当て (hpbl[a,b][1-8])

hpblb7においてこの作業で不具合が発生しました.HDDがやっぱりこっちが壊れているのだろうか.

当分いじらない方向だったのに勝手にいじってhpblb7を止めてしまい申し訳ありません.

作業の工程

# fdisk /dev/cciss/c0d0
# reboot
# mkfs -t ext3 /dev/cciss/c0d0p3

2009/2/5 (木) 久米

Python 2.5.2のインストール(hpblb[1-8])

hpblb[1-8]においても

$ python2.5.2

とするとPython 2.5.2を利用できるようにした.

作業の工程

  • hpblb[1-8]で,共有ライブラリの設定とリンクの作成
# vi /etc/ld.so.conf.d/python2.5.2.conf
-> add "/opt/python2.5.2/lib"
# ldconfig

# ln -s /opt/python2.5.2/bin/python /usr/bin/python2.5.2

2009/2/2 (月) 久米

hpblb7の故障HDD

  • SERIAL NUMBER: *3KQ16C4B*

hpblb7を2つのHDDでRAIDに設定したらランプが光り始めたため,故障しているハードディスクは「SERIAL NUMBER: *3KQ16BQK*」のやつだと思われました.

ですが,これを無効にしてもう片方のディスクを使い復旧を試みたところ,ddでディスクのコピーができませんでした。よってもう片方の「SERIAL NUMBER: *3KQ16C4B*」のHDDが壊れているのではないかと思います.これに「OUT OF ORDER」「故障」シールをはりました.サーバルーム内に放置してあります.

都合によりhpblb7とhpblb8が現在動きません.現在復旧中です.ご迷惑おかけして申し訳ありません.→hpblb7およびhpblb8は復旧しました.

作業の工程

作業の工程は1/30のと同様です.しかもhpblb7はhpblb8と同じになっているのでmpiやgrid関連のソフトウェアも動くと思います.

全ブレードサーバを同じ環境に統一するため,ついでにhpbla7もhpblb7と同じに復旧中.

現在hpbla7およびhpblb7が停止中です.→hpbla7およびhpblb7は復旧しました.ただしhpblb7は1 Logical Drive稼働です.

いろいろ調査

今後のためにいろいろ調査.

  • RAIDで動いているのはhpbla1だけのもよう
    • (/dev/ccissの内容より推定)
  • hpblb1
    • eth0 192.168.208.120, 00:16:35:3B:B1:E4
    • eth1 nothing, 00:16:35:3B:02:4D
    • eth2 nothing, 00:16:35:3B:E1:17
    • eth3 nothing, 00:15:60:A8:F6:0D
  • hpblb2
    • eth0 192.168.208.121, 00:16:35:3B:91:55
    • eth1 nothing, 00:16:35:3B:42:11
    • eth2 nothing, 00:16:35:3B:32:DE
    • eth3 nothing, 00:16:35:3B:A5:00
  • hpblb3
    • eth0 192.168.208.122, 00:16:35:3B:91:E2
    • eth1 nothing, 00:16:35:3B:22:29
    • eth2 nothing, 00:16:35:3B:22:28
    • eth3 nothing, 00:16:35:3B:14:51
  • hpblb4
    • eth0 192.168.208.123, 00:16:35:3B:91:9C
    • eth1 nothing, 00:16:35:3B:32:AA
    • eth2 nothing, 00:16:35:3B:32:A9
    • eth3 nothing, 00:16:35:3B:95:B5
  • hpblb5
    • eth0 192.168.208.124, 00:16:35:3B:D1:CC
    • eth1 nothing, 00:16:35:3B:42:B5
    • eth2 nothing, 00:16:35:3B:42:DE
    • eth3 nothing, 00:16:35:3B:95:B4
  • hpblb6
    • eth0 192.168.208.125, 00:15:60:A7:79:07
    • eth1 nothing, 00:15:60:0D:AF:1A
    • eth2 nothing, 00:15:60:0D:AF:17
    • eth3 nothing, 00:16:35:3B:95:C8
  • hpblb7→2009/1/30のログ参照
  • hpblb8
    • eth0 192.168.208.127, 00:16:35:3B:91:B0
    • eth1 nothing, 00:16:35:3B:32:67
    • eth2 nothing, 00:16:35:3B:32:65
    • eth3 nothing, 00:16:35:3B:05:9D

hpblb4のeth[1-3]の設定がBOOTPROTO=dhcpになっていたので一応staticに書き換えた.

2009/1/30(金) 久米

hpbla7,hpblb7の蘇生 復旧

目が覚めるとhpbla7,hpblb7がだめになっていたので正常に動くようにしたいと思った.

作業の工程

hpbla7下にhpblb7下のHDDを装着して,CentOSのDVDからレスキューシステムを起動.

レスキューシステム上で

# dd if=/dev/cciss/c0d0 of=/dev/cciss/c0d1

(c0d0=上HDD,c0d1=下HDDとなっていた)

でHDDの中身を丸ごとコピー.1時間程度放置後,完了したのを確認してシャットダウンしHDDを元の状態に装着しなおした.

hpbla7は起動途中でストップしてしまう状態だったので,よくわからないが下の論理ドライブをいったん削除して作成した.すると正しく起動するようになった.

hpblb7は,上HDDから起動するみたいなので,BIOS上で上HDDの論理ドライブを削除.下HDDしか見えない状態にすると起動した.

その後ちょいちょいとhpblb7のネットワーク設定を修正.

# vi /etc/hosts
"192.168.208.196 hpbla7.yuba.is.uec.ac.jp hpbla7" -> "192.168.208.126 hpblb7.yuba.is.uec.ac.jp hpblb7"

名前とMACアドレスがずれているので修正
# vi /etc/sysconfig/network-scripts/ifcfg-eth0
"HWADDR=00:16:35:3B:91:AF"にへんこう
# vi /etc/sysconfig/network-scripts/ifcfg-eth1
"HWADDR=00:16:35:3B:32:5F"にへんこう
# vi /etc/sysconfig/network-scripts/ifcfg-eth2
"HWADDR=00:16:35:3B:32:63"にへんこう
# vi /etc/sysconfig/network-scripts/ifcfg-eth3
"HWADDR=00:15:60:09:29:27"にへんこう

多分しばらくは大丈夫じゃないかと思われます.

あと,何でNICの名前とMACアドレスはずれるんですか?(←これのせいでネットワークにつながらずかなり悩みました)←NICの認識される順番で,うまくいくかいかないかはらしいです

  • hpblb7
    • eth0 192.168.208.126, 00:16:35:3B:91:AF ←実際にケーブルがつながっているやつ
    • eth1 nothing, 00:16:35:3B:32:5F ?
    • eth2 nothing, 00:16:35:3B:32:63 ?
    • eth3 nothing, 00:15:60:09:29:27 ?

2009/1/21(水) 田邊

blcr-0.4.2 のインストール(hpbl[ab][1-8])

# cd /opt/blcr/work
# tar xvfz /tmp/blcr-0.4.2.tar.gz
# cd blcr-0.4.2
# cp cr_module/cr_rstrt_req.c  cr_module/cr_rstrt_req.c.orig
# vi cr_module/cr_rstrt_req.c
# ./configure --enable-debug --enable-libcr-tracing --enable-kernel-tracing --prefix=/opt/blcr/0.4.2-stable --with-linux=/usr/src/kernels/2.6.9-78.0.1.EL-smp-x86_64/
# make
# insmod blcr_imports/kbuild/blcr_imports.ko; insmod vmadump4/kbuild/blcr_vmadump.ko; insmod cr_module/kbuild/blcr.ko
# make check
# make install

cr_rstrt_req.c の修正箇所は下記の通り

--- cr_rstrt_req.c.orig 2009-01-21 10:16:45.000000000 +0900
+++ cr_rstrt_req.c      2009-01-21 10:18:37.000000000 +0900
@@ -639,8 +639,8 @@
     /* XXX:  We don't handle a cr_restart that has children
      * yet, so make sure that you don't have any before continuing */
       if (CR_CHILD(current) != NULL) {
-        CR_KTRACE_UNEXPECTED("Aborting.  Process has children.");
-        return -EAGAIN;
+        CR_KTRACE_UNEXPECTED("[debug: skipped] Aborting.  Process has children.");
+       //        return -EAGAIN;
     }
 
     /* Allocate a request structure for bookkeeping */

他の構築済みのblcrライブラリとの競合を避けるため、現時点ではライブラリを作成しただけで自動的にロードさせる設定にはしていない。当該モジュールを利用したい場合には手動で行う。

サンプルのrcファイルとして /opt/bcs/pexec /opt/blcr/0.4.2-stable/blcr.manual_load.rc を作成しておいた。

prelink のおまじない

# /usr/sbin/prelink --undo --all

http://upc-bugs.lbl.gov/blcr/doc/html/FAQ.html#prelink

  • (追記)2009年2月4日 /etc/sysconfig/prelink の設定変更
# vi /etc/sysconfig/prelink
PRELINKING=yes  →  PRELINKING=no

[おまけ] bcs (pexec, pcpなど)をインストール

設定ファイル /opt/bcs/etc/{cluster, alive} に pコマンドを実行させた対象ノードを列記する。

# perl -e 'for (1..8) { print "hpbla$_\n"; }' > /opt/bcs/etc/cluster
# perl -e 'for (1..8) { print "hpbla$_\n"; }' > /opt/bcs/etc/alive
# /opt/bcs/pexec uptime
# /opt/bcs/pexec /opt/blcr/0.4.2-stable/blcr.manual_load.rc start

2009/1/7(水) 久米

Python 2.5.2のインストール(hpbla[1-8])

hpbla[1-8]において

$ python2.5.2

とするとPython 2.5.2を利用できるようにした.

作業の工程

  • まずはhpbla1だけで,Python 2.5.2のソースファイルをダウンロードしビルド
# wget http://www.python.org/ftp/python/2.5.2/Python-2.5.2.tar.bz2
# bzip2 -dc Python-2.5.2.tar.bz2 | tar xvf -
# mkdir build
# cd build
# ../Python-2.5.2/configure --prefix=/opt/python2.5.2 --enable-shared
# make
# make install
  • hpbla[1-8]で,共有ライブラリの設定とリンクの作成
# vi /etc/ld.so.conf.d/python2.5.2.conf
-> add "/opt/python2.5.2/lib"
# ldconfig

# ln -s /opt/python2.5.2/bin/python /usr/bin/python2.5.2

2008/12/14(日) 久米

hpbla7の再セットアップ

hpbla7だけ止まっているのがさびしいと思い再セットアップを試みた.

  • CentOS 4.7 (x86_64)のインストールディスクのイメージを調達
    • 共用デスクのところにDVDを
    • isoファイルをbluebase:/home/doc/os/iso/Linux上にアップロード(約2.6GB,邪魔だったらすみません,消します)
  • ハードディスクが壊れているらしいが,どちらが壊れているかわからなかったため,双方のディスクでRAID1+0に設定
    • その後ランプが光りだしたため,上のハードディスクが故障していることが判明
  • 下のほうに書いてあるhpblのインストール情報を参考にして,CentOS 4.7 (x86_64)を再インストール

その後,起動時の設定で上のハードディスクのLogical Driveを削除して,1 Logical Drive体制で下記の作業工程どおりに再度OSをインストールした.

一応,(リモートログインなどでも)個々のアカウントでログインして作業できるようになった.

作業の工程(hpbla7)

情報どおりにCentOS 4.7 (x86_64)をインストール後,

# vi /etc/resolv.conf
-> add "search yuba.is.uec.ac.jp"
# vi /etc/hosts
-> add "192.168.208.196 hpbla7.yuba.is.uec.ac.jp hpbla7"
-> add "192.168.208.47  bluebase"

# vi /etc/hosts.equiv
-> add "hpbla1"
-> add "hpbla2"
…………………………
-> add "hpblb8"

名前とMACアドレスがずれているので修正
# vi /etc/sysconfig/network-scripts/ifcfg-eth0
"HWADDR=00:16:35:3B:05:07" -> "HWADDR=00:16:35:3B:C1:9F"
# vi /etc/sysconfig/network-scripts/ifcfg-eth1
"HWADDR=00:16:35:3B:C1:9F" -> "HWADDR=00:16:35:3B:02:49"
# vi /etc/sysconfig/network-scripts/ifcfg-eth2
"HWADDR=00:16:35:3B:02:49" -> "HWADDR=00:16:35:3B:E1:7B"
# vi /etc/sysconfig/network-scripts/ifcfg-eth3
"HWADDR=00:16:35:3B:E1:7B" -> "HWADDR=00:16:35:3B:05:07"
  • Automount関連
# vi /etc/fstab
-> add "bluebase:/home/opts/linux-64bit /opt nfs defaults"

# vi /etc/auto.master
-> add "/home auto.indirect.home --timeout 60"

その後再起動
  • その他
# mv /etc/profile.d/krb5.sh /etc/profile.d/krb5.sh-nouse
# mv /etc/profile.d/krb5.csh /etc/profile.d/krb5.csh-nouse

# cd /etc/rc5.d
# mv S25netfs S29netfs

# yum install yum-plugin-fastestmirror
# yum install yumex rsh-server
# chkconfig rsh on
# /etc/init.d/xinetd restart

# yum update kernel
# vi /etc/grub.conf
(10行目defaultの値を1から0に変更)

# yum update

その後再起動

その他

hpbla7のセットアップ中にhpbla1の設定を参考にしていたが,間違って再起動してしまい,以前のネットワーク不調の時のような症状があらわれてしまった.そこで,

  • NICの設定をeth[0-3]だけにした(/etc/sysconfig/network-scripts/ifcfg-eth0.bak何とかを削除)
  • /etc/sysconfig/network-scripts/ifcfg-eth[0-3]ファイルをhpbla7と同様に設定
  • depmodを実行
  • 再起動

したところ,正常な状態に戻った.

また,いろいろ調べたところ,

  • hpbla1は2台のハードディスクがRAID1+0で1 Logical Driveとして作動中
  • hpbla8は2台のハードディスクが別々で2 Logical Drivesとして作動中

だということがわかった.どっちのほうがいいんでしょう.

2008/11/19(水)大島

共用計算機Optiplex64fにAdobeCSをインストール

PhotoshopとIllustratorの連携のために導入

2008/10/28(火) 松本

pe1,pe2のGT4を再インストール

  • GridFTPやGRAMなどのコンテナが正常に動作しないため、GTを再インストールした
  • GT4.2.1の各種ディストリ用バイナリインストーラから、GT4.2.0のソースインストーラに変更した

2008/10/27(月) 松本

pe[1-3]のセットアップ(認証、GridFTP/RFT、GRAM)

pe[1-3]について、

  • (vmubuntuをCA機として)ホスト認証およびコンテナ認証
pe1# . globus-env.sh ← 環境変数設定用の自前スクリプト
pe1# grid-cert-request -host 'pe1.yuba.is.uec.ac.jp)'
pe1# ssh globus@vmubuntu
globus@vmubuntu$ . globus-env.sh
globus@vmubuntu$ scp root@pe1:/etc/grid-security/hostcert_request.pem /tmp
globus@vmubuntu$ grid-ca-sign -in /tmp/hostcert_request.pem -out hostsigned.pem
pe1# cd /etc/grid-security
pe1# scp globus@vmubuntu:/tmp/hostsigned.pem .
pe1# mv hostsigned.pem hostcert.pem ← これでpe1のホスト認証完了
pe1# cp hostcert.pem containercert.pem
pe1# cp hostkey.pem containerkey.pem
pe1# chown globus:globus container*.pem ← これでpe1のコンテナ認証完了
  • GridFTP/RFTの設定
# . globus-env.sh
# globus-gridftp-server -p 2811 -S
# telnet localhost 2811 ← telnetで確認
# su - postgres
postgres$ initdb
postgres$ pg_ctl start
postgres$ createuser globus
postgres$ createdb -U globus rftDatabase
# su - globus
globus$ . globus-env.sh
globus$ psql -d rftDatabase -f $GLOBUS_LOCATION/share/globus_wsrf_rft/rft_schema.sql
  • GRAMの設定
# visudo
(次の2行を追加)
globus ALL=(matsum) NOPASSWD:/opt/globus/libexec/globus-gridmap-and-execute -g etc/grid-security/grid-mapfile /opt/globus/libexec/globus-job-manager-script.pl *
globus ALL=(matsum) NOPASSWD:/opt/globus/libexec/globus-gridmap-and-execute -g etc/grid-security/grid-mapfile /opt/globus/libexec/globus-gram-local-proxy-tool *

2008/10/24(金) 大島,下田

CUDA実験機endeavor01,endeavor0aのセットアップ

  • endeavor0aのセットアップ
    • ビデオカードをGeForce 8800GTS 512MB に変更
    • CUDA1.1用ドライバーのインストール.サンプルプログラムの動作確認→OK
  • endeavor01のセットアップ
    • Linux(CentOS 5.0)のインストール完了
    • NIS,NFS:OK
    • yum update後放置

ToDo

  • endeavor01
    • GPU(Quadro FX 4600)をPCに搭載.およびドライバのインストール
    • CUDA環境の構築

2008/10/22(水) 松本

vmubuntu(192.168.208.118)のセットアップ

  • VMWare上の仮想OS(現在はOptiplex745g上で動作している)
  • CA認証サーバとして使用する
    • GT4およびSimpleCAのインストールは完了した

pe4をOS再インストール

  • Solaris10からOpenSolaris2008.05にOSを変更
  • 各種設定(NISやGTセットアップなど)はまだ途中

2008/10/17(金) 松本

pe3, pe4へ1sshでrootログイン可能に

# vi /etc/ssh/sshd_config
...
PermitRootLogin yes
...

pe[1-4]のローカルユーザhpclabを削除

  • pe1, pe2, pe4はuserdel、pe3はrmuserで削除
  • ホームディレクトリを削除
    • pe1, pe2, pe3は/usr/local/home/hpclab
    • pe4は/export/home/hpclab
  • pe3は/etc/groupからhpclabの行を削除

2008/10/16(木) 松本

pe[1-4]のセットアップ(2)

pe[1-4]について、

  • NISおよびautomountを設定し、bluebaseのアカウントでログインできるようにした。なお、それぞれのサーバにローカルユーザのhpclabを用意してある。
  • Globus Toolkit 4をインストールした。インストールしたパッケージは以下。
    • pe1(CentOS 5): GT4.2.1 RedHat AS4用バイナリインストーラ(gt4.2.1-x86_rhas_4-installer.tar.gz)
    • pe2(Debian 4): GT4.2.1 Debian Etch用バイナリインストーラ(gt4.2.1-x86_deb_4.0-installer.tar.bz2)
    • pe3(FreeBSD 6.3): GT4.2.0 ソースパッケージ(gt4.2.0-all-source-installer.tar.gz)
    • pe4(Solaris 10): GT4.2.0 ソースパッケージ(gt4.2.0-all-source-installer.tar.gz)

2008/10/15(水) 松本

pe[1-4]のセットアップ

DELLブレードサーバpeのセットアップ作業を行っている。

  • pe[1-4]の4台について下記が完了
    • OSのインストール
    • Globus Toolkit 4のインストール(まだCA認証等が未設定なので動作しない)
  • pe1, pe2の2台について、NIS、Automountの設定が完了

2008/10/09(木) 大島

endeavor0aのメンテナンス

endeavor0aの電源を試しに1000W化.しかし安定動作せず.

GPUの熱暴走を疑い535室の端で冷却運用テスト中.Linuxのインストール失敗中.(途中でフリーズする)

endeavor01のメンテナンス

計算機室内で応答不能になっていたため停止.

GPUの熱暴走を疑い,535室の端で冷却運用中.

GPUドライバを更新し,CUDA2.0を導入.

冷却効果で安定運用なるか?

2008/10/() 大島,下田

endeavor05の電源1000W化

GTX260な共用PCの安定運用に向けて電源を交換.

2008/09/21(日) 松本

hpbl*のアップデート、他

hpblaおよびhpblbのソフトウェアのアップデートを行いました。変更点は以下のとおりです。

  • b1, b5, b6, b7について、NISが動いていなかったのでモジュールリストを再構築しました。
# depmod
  • hpbla7のpythonが壊れていた問題を解決しました。
hpbla7# rpm -V python   ← pythonパッケージの検証
(数十個のファイルが存在しないと表示された)
hpbla7# scp hpbla5:(足りないファイル) /usr/lib64/python2.3/(コピー先)
hpbla7# yum update python
hpbla7# rpm -v python
(エラーが出ないことを確認)
  • hpblaおよびhpblbのカーネルを2.6.9-78.0.1にアップデートしました。
# yum update kernel
# cp /etc/grub.conf /etc/grub.conf.orig
# vim /etc/grub.conf
(10行目defaultの値を1から0に変更)
# yum update
  • NFSデーモンの起動順を変えて、OS起動時にNFSのエラーが出ないようにしました。
# cd /etc/rc5.d
# mv S25netfs S29netfs

2008/09/01(月) 大島

nprec1にCUDA2.0を導入

driver, Toolkit, SDKを入れ直した。

2008/8/28(木) 松本

hpbla1にリモートログインできない件について

田邊さんが解決してくれました。変更内容は以下のとおりです。

ブレードのhpbla1のネットワーク設定を書き直し、再起動しました。ネットワークを利用できるようしてnis/nfsならびにsshも有効にしましたので、以前と同様にsshでログインして作業できると思います。

ただし、mpiやgrid関連の設定は全く触っておらず、確認もしていません。そのため、正常に動作しているか分からないので、残りの作業については関係者にバトンタッチします。

他の正常に起動しているノードの内容を参考にして、/etc/sysconfig/network-scripts/ifcfg-eth0を書き換えました。

--- /etc/sysconfig/network-scripts/ifcfg-eth0.bak       2008-08-28
12:40:01.000000000 +0900
+++ /etc/sysconfig/network-scripts/ifcfg-eth0   2008-08-28
12:40:44.000000000 +0900
@@ -1,10 +1,9 @@
 DEVICE=eth0
-BOOTPROTO=none
+BOOTPROTO=static
+BROADCAST=192.168.208.255
+HWADDR=00:16:35:3B:C1:E6
 IPADDR=192.168.208.190
 NETMASK=255.255.255.0
-GATEWAY=192.168.208.129
-TYPE=Ethernet
-USERCTL=no
-IPV6INIT=no
-PEERDNS=yes
+NETWORK=192.168.208.0
 ONBOOT=yes
+TYPE=Ethernet

2008/8/27(水) 松本

hpbla1にリモートログインできない件について(未解決)

しばらく前からhpbla1にsshでログインできない状態が続いています。モジュールが正常に読み込まれていないことが原因と考えられます。

depmodコマンドを実行して再起動し、lsmodのリストにtg3が表示されるようになりました。

ただし、ログインできる状態にはなっていません(pingも通りません)。まだモジュールの設定がうまくいっていないためと思われます。引き続き調査します。

2008/8/1(金) 増永

hpbla1-8のハイパースレッディングをoffに設定

  • hpbla1〜8の全てのハイパースレッディングをoffに設定しました.
  • その際,ブレードサーバを再起動しました.

2008/07/14(月) 増永

hpbla7の不具合について

hpbla7でrshが使えない原因を調査しました.

原因はHDDの故障でした.

fsckでファイル修復を行った後,再起動しました.

HDDの交換はしていません.

2008/6/24(火)大島

nprec1の調整

  • PCIにATIの古いカードを搭載し、CUDA対応GPUからは画面出力を行わない、という環境のテスト中。
  • /etc/X11/xorg.confに複数のDeviceを設定する必要があります。
  • /etc/X11/xorg.conf.plusatiというバックアップ設定を保存してあるので、何かの拍子(グラフィックスドライバ更新など)に設定が飛んだ場合にはマージなりコピーなりしてください。

2008/6/5 (木) 大島

endeavor0aを共用のCUDA実験用PCに設定

endeavor0aを適当に調整し、共用のCUDA実験用PCにしました。

  • SDKやToolkitについて
    • /opt以下。みればわかると思いますが、1.1と2.0betaがディレクトリを分けて入れてあります。必要に応じてパスを通して使ってください。
    • toolkitのインストール先を/usr/local/cudaではなく/opt/cuda_*/cudaにしてあるので注意してください。
      • コンパイル時に-Iや-Lをつけて必要なヘッダファイルやライブラリをリンクするのを忘れないこと。
      • LD_LIBRARY_PATHを調整して共有ライブラリが見えるようにするのを忘れないこと。
      • tcshならsetenv LD_LIBRARY_PATH /opt/cuda_1.1/cuda/lib
      • bashならexport LD_LIBRARY_PATH=/opt/cuda_1.1/cuda/libかな?(要確認)
  • /dev/nv*問題について
    • 再起動後に /etc/init.d/nvdev を実行してください。本当は勝手に実行されるようにしたいんだけど、方法が良くわからないので放置中。

2008/5/23(金) 増永

Jumpshot-3について

Jumpshotについて載っているHP

2008/2/21(木) 渡邊

hpbla1でMPICH-VCLをコンパイル

詳しくは HOWTO を参照されたいが,いくつか引っかかったのでメモ.

  • 最初にして最大の壁Softwaresのページで Latest release が release 1.0.1 になっているが間違い.正しい最新版は release 1.0.2 である.
  • make していくと gengetopt が無いと言ってくる.GNU Gengetopt を自分のホームディレクトリ以下にインストールしてPATHを通せばよい.
  • make の最後の方で -lcr に失敗するときは,環境変数 LDFLAGS に "-L/opt/blcr-0.4.2/lib -lcr" を設定すればうまくいく模様.
    • もしそれでもダメなら環境変数 LD_LIBRARY_PATH に "/opt/blcr-0.4.2/lib" を追加設定してみる.
  • mpirun実行時に環境変数 LD_PRELOAD に "/lib64/tls/libpthread.so.0" を設定すること.

2008/2/14(木) 大島

新しい教育用計算機等が納入されました。詳細はこちら?

2008/2/7(木) 渡邊

hpbla1-8でrlogindを起動 →不要なので戻しました.

rsh(rlogin)が原因でMPICH-PCLが動作していないようなので,hpbla1-8でrlogindをためしに起動させています.

# vi /etc/xinetd.d/rlogin
disable = no
# killall -HUP xinetd

起動しない方がよければ連絡ください.

※hpbla7で /etc 以下が読み込み専用でマウントされており書き込めませんでした.何故?

hpbla1-8でMPICH-PCLを起動

  • ノード上の /tmp 以下に,他人が作った pm-0000000* というファイルがあると,そのノードはMPICH-PCLには利用できない(ノード上で pm プロセスがハングアップする).自分だけがMPICH-PCLを使うのであれば問題ないか・・・
  • mpiexec --rsh=/usr/bin/rsh と指定しても rsh を使ってくれない.src/pm/mpd-ft の中の "/usr/bin/ssh" や "ssh" になっているところを rsh に変えてMPICH-PCLを再コンパイルするべし.

2008/2/5(火) 渡邊

hpbla1にBLCRを導入

増永君のMPICH-PCLの導入に必要な Berkeley Lab Checkpoint/Restart for Linux (BLCR) をhpbla1に導入.マニュアルなどはAdministrator's Guideを参照.

> tar zxf blcr-0.4.2.tar.gz
> cd blcr-0.4.2
> mkdir builddir
> cd builddir
> ../configure --prefix=/opt/blcr-0.4.2 --enable-multilib
> make

この後,make check をしたいけど,rootでホームディレクトリ内ファイルに書き込めないエラーが出たので

> chmod -R 757 *
> chmod o+w .

してから

> su
# make insmod
# exit
> make check

結果:

PASS: get_info
PASS: cr_run
PASS: stage0001.st
PASS: stage0002.st
PASS: critical_sections.st
PASS: replace_cb.st
PASS: failed_cb.st
PASS: simple.ct
PASS: simple_pthread.ct
PASS: cwd.ct
PASS: dup.ct
PASS: filedescriptors.ct
PASS: pipe.ct
PASS: named_fifo.ct
PASS: cloexec.ct
===================
All 15 tests passed
===================

:-) ということでインストール.

> su
# make install

続いて,カーネルモジュールをロード.

# /sbin/insmod /opt/blcr-0.4.2/lib/blcr/2.6.9-55.0.2.ELsmp/blcr_imports.ko
# /sbin/insmod /opt/blcr-0.4.2/lib/blcr/2.6.9-55.0.2.ELsmp/blcr_vmadump.ko
# /sbin/insmod /opt/blcr-0.4.2/lib/blcr/2.6.9-55.0.2.ELsmp/blcr.ko

起動時に自動的にモジュールがロードされるようにスクリプトを登録.

# cp ../etc/blcr.rc /etc/init.d/blcr

/opt/blcr-0.4.2 以下に配置されてますので,使うときにはPATHとLD_LIBRARY_PATHを適宜設定してください.

hpbla1でMPICH-PCLのコンパイル・リンク

気づいた点:

  • ft-mpdiを作るとき
    • configureでCFLAGSを明示的に付ける(→Makefile中に適用される). 32ビット用にしないほうがよさげ.

./configure --with-pcli --with-blcr --prefix=`pwd` CFLAGS="-m32"

    • "--with-blcr"を付けたのに,BLCRではなくckptを使おうとしてしまうバグがある模様バグではなくて特殊なディレクトリにBLCRが配置されていると探し出せずにckptを使う仕様になっている.
      • src/checkpoint-agent/Makefile で AGENT_SUBDIR = blcr を有効化し,さらに HELPER_LIB = blcr/libblcragent.la に書き換える.これによってckptではなくblcrを使うようになる.
      • src/checkpoint-agent/blcr/Makefile で BLCR_INCLUDES = -I/opt/blcr-0.4.2/include と BLCR_LDFLAGS = -L/opt/blcr-0.4.2/lib を明示的に設定(/usr/local 以下にインストールしていないため).
      • configure.ac の AC_ARG_WITH([blcr] 〜 のところで,
BLCR_DIR=$witharg],

のところを

BLCR_DIR=$withval],

に直し,autoreconf -vif した後,

./configure --with-pcli --with-blcr="/opt/blcr-0.4.2" --prefix=`pwd`

とすれば探してくれる.

    • 「pcli/libpcli.la が無い」というエラーが出たときには,pcli ディレクトリ内で make すればよい.
    • 以上でft-mpdiの make install まで正常に完了.
  • mpich2を作るとき:
    • HOWTOどおりに 何回か make をやればOK.
    • 以上でmpich2のmakeまで正常に完了.

2007/9/26(水) 大島

endeavor0bにiccを試験的導入

本家でユーザ登録?してキーと本体tgzを入手。展開してrootでsh install.sh。

基本的にはデフォルト指定な感じでガリガリ進んでOK。と思ったら、途中のgccとglibcのバージョン確認のところでデフォルトがnoなのをyesにし忘れて5分悩む。

libstdc++.so.5がなくてこける。libstdc++.so.6ならある。

yum provides libxxxとやるとlibxxxを提供しているパッケージ(って呼ぶのか?)がわかることを知る。yum provides libstdc++.so.5の結果、compat-libstdc++-33が提供者らしいので導入してみる。

デバッガのインストール中に今度はlibXft.so.1がなくてこける。残念ながらこちらは旧バージョンのFCとかから引っこ抜く必要があるらしいので、とりあえず無視。

とりあえずiccが使えるようになったのでよしとする。

2007/9/20(木) 大島

endeavor0bのGPU換装 etc.

GeForce7600GTをGeForce8600GTS Superに換装。ついでにOSもVineからCentOSに変更。

setup起動時にはlinux irqpoll、その後起動時にもirqpollオプションを与える必要あり。

yum updateをやってみたら75個のパッケージにupdateが出ました。時間かかりすぎ。

ドライバを入れようとしたらccがなくて怒られたのでgcc(せっかくだからgcc-c++)をyumで導入。さらにkernelのソースが必要なのでkernel-develもyumで導入。

yumでemacs,freeglut-devel,libXmu-devel,libXi-devel,libXext-develを導入し、更に野良でGLEWを導入。

NVIDIA_CUDA_Toolkitを導入、NVIDIA_CUDA_SDKを導入(/opt/NVIDIA_CUDA_SDK)。/etc/ld.so.conf.d/cuda.confにlib.soのパス(/usr/local/cuda/lib)を書いてldconfig。

rootになってchmod 666 /dev/nvidia*。(これは再起動のたびに必要かもしれないので何とかするべき。)

以上にてcudaプログラムの実行が可能に。hpclabユーザでログインしてxhost +しておけば誰でもssh接続状態からCUDAが使えます。忘れない限りやっておきます。X関係っぽいエラーが出たときは確認を。

NIS/Automountも対応済み。

2007/09/05(水) 渡邊

hpbla1-8のGRAMの起動

停電後の立ち上げでなぜかGRAMが起動されなかった.xinetdプロセスを再起動したら直った.

# killall -HUP xinetd

2007/09/02(日) 平澤

hpbla1-8のアップデート

# yum update

2007/07/24(火) 渡邊

hpbla2-8にGlobusのGatekeeperをセットアップ

まず,全ノードでgrid-mapfileを共有するべく,シンボリックリンクに置き換え.

watanabe@hpbla1> mkdir /opt/grid-security
watanabe@hpbla1> chmod 777 /opt/grid-security
watanabe@hpbla1> cp /etc/grid-security/grid-mapfile /opt/grid-security
hpbla1# mv /etc/grid-security/grid-mapfile /etc/grid-security/grid-mapfile.old
hpbla1# ln -s /opt/grid-security/grid-mapfile /etc/grid-security/grid-mapfile

hpbla2-8上で /etc/hosts を修正.

# vi /etc/hosts
192.168.208.191         hpbla2.yuba.is.uec.ac.jp hpbla2

このようにFQDNを書いておかないとglobus-job-runで error-code 7 でコケる.

hpbla2-8上でsetup-gsiを実行.

hpbla2-8:

# /opt/globus/setup/globus_simple_ca_8f8fd714_setup/setup.gsi -default
# grid-cert-request -host hpbla{2,3,4,5,6,7,8}.yuba.is.uec.ac.jp

各ノードの /etc/grid-security/hostcert_request.pem に講座CAが電子署名し /etc/grid-security/hostcert.pem に保存した後,

# chmod 600 /etc/grid-security/hostcert.pem
# ln -s /opt/grid-security/grid-mapfile /etc/grid-security/grid-mapfile

Gatekeeper サービス登録

# vi /etc/services
# vi /etc/xinetd.d/gatekeeper

xinetd 再起動

# killall -HUP xinetd

Torqueのサーバ情報の修正

# vi /var/spool/torque/server_priv/nodes
# cat /var/spool/torque/server_priv/nodes
hpbla1.yuba.is.uec.ac.jp np=2 smp
hpbla2.yuba.is.uec.ac.jp np=2 smp
hpbla3.yuba.is.uec.ac.jp np=2 smp
hpbla4.yuba.is.uec.ac.jp np=2 smp
hpbla5.yuba.is.uec.ac.jp np=2 smp
hpbla6.yuba.is.uec.ac.jp np=2 smp
hpbla7.yuba.is.uec.ac.jp np=2 smp
hpbla8.yuba.is.uec.ac.jp np=2 smp

Torqueサーバの再起動

# qterm -t quick
# pbs_server

Torqueの動作テスト

> globus-job-run hpbla1.yuba.is.uec.ac.jp/jobmanager-pbs -np 8 /bin/hostname -f
hpbla8.yuba.is.uec.ac.jp
hpbla7.yuba.is.uec.ac.jp
hpbla6.yuba.is.uec.ac.jp
hpbla5.yuba.is.uec.ac.jp
hpbla4.yuba.is.uec.ac.jp
hpbla1.yuba.is.uec.ac.jp
hpbla2.yuba.is.uec.ac.jp
hpbla3.yuba.is.uec.ac.jp

2007/07/02(月) 大島

$ whoami
hpclab
$ xhost +
$ chmod o+rwx /dev/nvidiactl
$ chmod o+rwx /dev/nvidia0

この状態であれば、cudaにsshアクセスした状態から直接CUDA関連プログラムが実行できます。

2007/06/26(火) 大島

CUDA 1.0 の導入

  • インストール=本家からスクリプトを拾って実行すればOK

$ sudo sh NVIDIA_CUDA_Toolkit_1.0_rhel5_x86.run

* Please make sure your PATH includes /usr/local/cuda/bin
* Please make sure your LD_LIBRARY_PATH includes /usr/local/cuda/lib
*   or add /usr/local/cuda/lib to /etc/ld.so.conf and run ldconfig as root

* Please read the release notes in /usr/local/cuda/doc/CUDA_Release_Notes_1.0.txt

* To uninstall CUDA, delete /usr/local/cuda
* Installation Complete

$ sudo sh NVIDIA_CUDA_SDK_1.0.run

* Please make sure your PATH includes /usr/local/cuda/bin
* Please make sure your LD_LIBRARY_PATH includes /usr/local/cuda/lib

* To uninstall the NVIDIA CUDA SDK, please delete /opt/NVIDIA_CUDA_SDK
* Installation Complete

# あれ?両方入れる必要はあったのか???

  • 動作確認=サンプルを拾って実行してみた

ユーザhpclab(/usr/local/home/hpclab)にて実行を確認。~/work/cuda以下にサンプルdeviceQuery,matrixMl,templateを突っ込んでmakeし実行、正しく動作している模様。

  • 実行時の注意

相変わらずX周りの権限が重要なようで、Xにログインしているユーザでないと実行できません。逆に言えば、hpcllabでXにログインしていればsshからの実行もOK。

恐らく、何らかの権限を誤魔化してやれば何とかなると思います。

2007/06/25(月) 大島

CUDA実験用PC到着につき環境構築

CentOS5を導入。

インストール後、初回起動時はrunlevelを3に落とさないと画面が見えない。ドライバのせいか?

yumでめぼしいものを適当に導入。

nis/automount対応完了。

2007/06/03(日) 渡邊

hpbla1-8:

JMPI(Pure Java implementation of MPI)を使うため,/opt/j2sdk1.4.2_14 に SunのJ2SE 1.4.2_14 をインストールしました.理由は,JMPIの実装が古く,JDK1.5だとRMI関係の例外が出てしまうので,とりあえず古いバージョンを使って問題回避するためです.

また,/opt/jdk1.4 -> /opt/j2sdk1.4.2_14 というシンボリックリンクを作成しました.

2007/05/22(火) 大島

endeavor0a/endeavor0bをGPU実験ノードとして環境再構築

endeavor0a / endeavor0bをGPU実験ノードとして使うため環境構築中。大島の座席の後ろの棚の上。

Vine4.1を入れています。Vineの基本はeuc-jpらしいので注意。

  • H/W構成

0aはMT8000にGeForce7800GTXを、0bはMT8000にGeFore7600GTを搭載。HDDの接続を弄ればWindowsも利用可能。(元々はSATAのHDDにWindowsXPが入っていたが、IDEのHDDをつないでLinuxを導入。)

  • OSのインストール

Fedora6、CentOS5.0、openSUSE10.0でインストーラまでたどり着けず。外付けUSB DVDだから悪い可能性もある。Vine4.1ではインストーラの冒頭でinux irqpollを指示されるが、指定どおりやってインストーラの実行に成功。適当にインストール。

管理用にローカルユーザhpclabを作成。

  • ビデオドライバの導入

NVIDIA公式でドライバを入手し、Readmeに従って導入。2台で導入後のxorg.confに差があったので、適当に共通化。起動時にNVIDIAのロゴが出る、アプリケーション-システムツール-NVIDIA X Server Settingsを起動してGLX関係の設定が見えることを確認(以前xorg.confがおかしいときにGLX関係の設定を見ようとして落ちた記憶がある)。

  • NIS/NFSなどのシステム設定

なにはともあれapt-get updateでapt(のデータベース)自体を更新。

setupでNISの設定。システムサービス設定からypbind、ユーザ認証設定からNISの利用。

automount。/etc/auto.masterに/home auto.indirect.home --timeout 60を追記して完了。

  • その他アプリケーションの導入

apt-get install freeglut-devel : glut関連の開発に必要なものを導入。

atp-get install gcc4 : 特に重要性があったわけではないが、gccを3.3.6からバージョンアップ。依存関係でgcc4-cppも入る。

atp-get install gcc4-c++ : c++も更新。

glewの導入。glew.sourceforge.netからbinaryを拾ってきてコピー。パーミッションがまずいので適宜修正。

subversionの導入。apt-get install subversion。

  • GPGPU環境の確認

実験プログラムを走らせるが、glutInitの段階でドライバが落ちる。

GPUドライバの再インストールしたら解決。謎。

  • キーボード、マウスの接続を変更

PC切り替え器がScrollLockを利用するタイプ。tty1〜6でScrollLockを押すとシステム情報を垂れ流されて邪魔なので、計算機室からHHKL2とM$ボールマウスを強奪し、それぞれに接続。

キーボード設定をUS設定に変更。表記どおりの記号が出ます。X用はGNOMEのメニューから、それ以外はsetupを利用。

残る問題点

Xを叩くためにはXの所有権の都合で若干の不都合がある。基本的に、ログインしていないとGLEWが叩けない。実験時のみ実験者がstartxするという運営方法があるが、使い勝手的にはどうだろう?

  • とりあえずの運用方針

hpclabユーザでXにログインし、xhost +して放置する。これでどのユーザからでも「-display :0.0」でXを叩けるため、SSHログイン状態からGPUプログラムの実行が可能。

  • とりあえずの運用方針に対する問題点

実行後にちゃんとプログラムを殺しておかないと次の実行に支障をきたす。トラブルでドライバが落ちた場合は、ローカルでhpclabユーザのXログインをしなおす必要がある。

2007/5/22(火) 渡邊

Globus/GRAM PBSモジュールのバグ修正

/opt/globus/lib/perl/Globus/GRAM/JobManager/pbs.pm: line 379
change from:
hosts=\`cat \$PBS_NODEFILE\`;
to:
hosts=\`/bin/cat \$PBS_NODEFILE\`;

Torque(=jobmanager-pbs)を使って連携に成功した(5月22日13時).

逐次ジョブ:

watanabe> globus-job-run hpbla1.yuba.is.uec.ac.jp/jobmanager-pbs /bin/date
2007年  5月 22日 火曜日 13:01:24 JST

並列ジョブ:

watanabe> globus-job-run hpbla1.yuba.is.uec.ac.jp/jobmanager-pbs -np 8 /home/watanabe/junk/hello
Process 0 on hpbla8 out of 1
stty: 標準入力: 無効な引数です ←ログインシェルがtcshのために出る警告=無視
Process 0 on hpbla6 out of 1
Process 0 on hpbla1.yuba.is.uec.ac.jp out of 1
Process 0 on hpbla7 out of 1
Process 0 on hpbla5 out of 1
Process 0 on hpbla4 out of 1
Process 0 on hpbla2 out of 1
Process 0 on hpbla3 out of 1

↑並列ジョブはMPIが動作していない(調査中)

→解決策:-env PATH=`/bin/echo $PATH` -x '(jobtype=mpi)' を付けて実行する.

watanabe> globus-job-run hpbla1.yuba.is.uec.ac.jp -np 8 -env PATH=`/bin/echo $PATH` -x '(jobtype=mpi)' /home/watanabe/junk/hello
Process 0 on hpbla1 out of 8
Process 2 on hpbla4 out of 8
Process 1 on hpbla4 out of 8
Process 6 on hpbla3 out of 8
Process 5 on hpbla3 out of 8
Process 3 on hpbla2 out of 8
Process 7 on hpbla5 out of 8
Process 4 on hpbla2 out of 8

↑並列ジョブ(MPIプログラム)の正常動作を確認できた.

gsiftp(GridFTP)の動作確認

watanabe> globus-url-copy gsiftp://hpbla1.yuba.is.uec.ac.jp/home/watanabe/output.txt file:///home/watanabe/hoge.txt
watanabe> ls -l
-rw-r--r--   1 watanabe yuba-b02     489  5月 22 13:20 hoge.txt
-rw-------   1 watanabe yuba-b02     489  5月 22 13:01 output.txt
watanabe> diff output.txt hoge.txt
watanabe>

2007/5/20(日) 渡邊

Javaライブラリの登録

hpbla1-8:

root# vi /etc/ld.so.conf.d/jdk1.5.conf
root# cat /etc/ld.so.conf.d/jdk1.5.conf
/opt/jdk1.5/jre/lib/amd64
/opt/jdk1.5/jre/lib/amd64/server
root# /sbin/ldconfig

2007/5/20(日) 渡邊

globus toolkit4 への講座CAの登録

globus> /opt/globus/sbin/gpt-build globus_simple_ca_****_setup-0.13.tar.gz gcc64dbg
globus> /opt/globus/sbin//gpt-postinstall
globus> mkdir /opt/globus/etc/gpt/packages/setup/trusted_ca_setup
globus> chmod 777 /opt/globus/etc/gpt/packages/setup/trusted_ca_setup
root# /opt/globus/setup/globus_simple_ca_8f8fd714_setup/setup-gsi -default

パッケージ確認

globus> /opt/globus/sbin/gpt-verify
Verifying Bundles...
Verifying run-time dependencies...

Verifying setup dependencies...

Verifying setup packages...

The collection of packages in /opt/globus appear to be coherent.

rootでGatekeeperの立ち上げ(globusアカウントで立ち上げようとするとHOMEが見つからないエラー)

root# vi /etc/hosts
root# cat /etc/hosts
192.168.208.190         hpbla1.yuba.is.uec.ac.jp hpbla1 #Globusではフルで書いていないとエラー
/etc/services
/etc/xinetd.d/gatekeeper
/etc/xinetd.d/gsiftp
globus> chmod 666 /opt/globus/var/globus-gatekeeper.log

Torque(=jobmanager-pbs)を使うとハングし,連携に失敗している(5月22日10時).

Torqueの管理者情報の修正

root@hpbla1#
Qmgr: set server managers = globus@hpbla1.yuba.is.uec.ac.jp
Qmgr: set server operators = globus@hpbla1.yuba.is.uec.ac.jp

mpiexecのconfigureオプション変更

watanabe> ./configure --prefix=/opt/mpiexec-0.82 --with-pbs=/opt/torque-2.1.8 --with-default-comm=mpich-p4 --with-mpicc=/opt/mpich/bin/mpicc --disable-p4-shmem

付属テストプログラムでnpiexecとTorqueとを連携させ81個のサンプルの正常動作を確認した.

2007/5/18(木) 平澤

globus toolkit4 のインストール、Ninf-Gのインストール

参考

  • hpbla1
globus> cd /tmp/gt4.0.4-all-source-installer
globus> ./configure --prefix=/opt/gt4.0.4 --enable-wsgram-pbs --with-flavor=gcc64dbg
globus> make # make -j 4 で問題が発生した
globus> make install
ln -s /opt/gt4.0.4 /opt/globus
globus> cd /opt/globus/setup/globus
globus> ./setup-globus-job-manager-pbs --remote-shell=rsh
globus> cd /tmp/ng-4.2.2
globus> ./configure --prefix=/opt/ng-4.2.2 --with-globusFlavor=gcc64dbg
globus> make
globus> make install
globus> cd utility/script
globus> ./server_install
globus> ln -s /opt/ng-4.2.2 /opt/ng
globus> cd /tmp
globus> mv gt4.0.4-all-source-installer/ ng-4.2.2/ ~/

/opt/globus/etc/grid-info-slapd.conf がなかったため編集せず

2007/5/17(木) 渡邊

mpiexecのインストール

  • hpbla1
watanabe> ./configure --prefix=/opt/mpiexec-0.82 --with-pbs=/opt/torque-2.1.8 --with-default-comm=mpich-p4 --with-mpicc=/opt/mpich/bin/mpicc --with-comm=shared
watanabe> make
watanabe> make install

Torqueのpbs_server設定の修正(4CPU,SMP対応,pbs_serverの再起動)

  • hpbla1
root# vi /var/spool/torque/server_priv/nodes
root# cat /var/spool/torque/server_priv/nodes
hpbla1 np=4 smp
hpbla2 np=4 smp
hpbla3 np=4 smp
hpbla4 np=4 smp
hpbla5 np=4 smp
hpbla6 np=4 smp
hpbla7 np=4 smp
hpbla8 np=4 smp
root# qterm -t quick
root# pbs_server

2007/5/16(水) 平澤

Torqueのインストール

参考

  • hpbla1
# mkdir /var/spool/torque
# chown globus:globus /var/spool/torque
globus> ./configure --prefix=/opt/torque-2.1.8
globus> make
# make install
  • bluebase
# chown -R root:root /opt/torque-2.1.8
# chmod 755 pbs_mom pbs_sched pbs_server
  • hpbla1
# torque.setup globus
# pbs_sched
  • hpbla2-8
# cd /home/globus/torque-2.1.8
# make install
  • hpbla1-8
# vi /var/spool/torque/mom_priv/config
> $pbsserver hpbla1
> $usecp *:/home /home
# pbs_mom

2007/4/27(火) 池辺

  • 共用WindowsPC(optiplex64f)
    • cygwin(フルパッケージ)
    • Latex環境 (/usr/local)
      • Ghostscript
      • Ghostgum
      • dviout
    • FireFox2
    • eclipse
      • texlipse
    • JavaVM Runtime

2007/4/24(火) 平澤

  • 共用WindowsPC(optiplex64f)
    • Windows Vista Business (FS MSDNAA 2007/4/23 hirasawa)
      • 管理者ユーザ: HPC管理者
      • 一般ユーザ: hpclab
    • MS Office Standard 2007 (ISCC HPC講座分 No1)
    • Adobe Acrobat 7.0 Professional (HPC講座所有 Adobe-Acrobat 06-02)
    • Adobe Illustrator CS2 (HPC講座所有 Adobe-Illustrator 06-01)
    • Symantec AntiVirus 10.2 for Vista (CC所有分)
    • MP-C3500設定

2007/3/27(火) 平澤

  • hpbla1
# cd /usr/local
# ln -s /opt/tsb .

2007/3/6(火) 町田

  • hpbla1

Subversionのインストール

$su
#yum install subversion

2006/11/16(木) 町田

  • hpblb
電源,LANケーブルの接続.
LANケーブルはhpbla群が接続されているスイッチングハブに追加して接続.
1本不足していたため,hpblb8には適当なCat5eケーブルを探して接続.
hpblb1,hpblb2,hpblb3はインストール完了.アップデート済み.
hpblb5,6,7,8はインストール完了,未アップデート.
hpblb4が起動せず.

2006/10/24(火) 平澤

  • hpbla1
vi /etc/fstab
yum install ncurses.i386

2006/10/18(水) 平澤

  • hpbla1
yum install postfix
/usr/sbin/alternatives --config mta -> postfix
yum install dovecot
  • hpbla1-8
/etc/profile.d/lab.sh
/etc/hosts.equiv

2006/10/17(火) 平澤

mpich2 の mpdboot の問題解決

  • hpbla1-7
vi /etc/resolv.conf
vi /etc/hosts

2006/10/14(土) 平澤

/opt が起動時マウントされない問題

  • hpbla8
vi /etc/resolv.conf
vi /etc/hosts

同じ症状http://lists.centos.org/pipermail/centos/2006-October/070878.html

まだ解決されない

2006/10/13(金) 平澤

MPICH1のインストール

  • hpbla1
mkdir mpich-1.2.7p1
./configure --prefix=/opt/mpich-1.2.7p1
make
cd example/test
make testing
cd ../..
make install
ln -s mpich-1.2.7p1 mpich

環境設定

  • hpbla1
vi /etc/profile.d/lab.sh
mv krb5.sh krb5.sh-nouse
mv krb5.csh krb5.csh-nouse

2006/10/12(木) 平澤

globus toolkit4 のインストール、Ninf-Gのインストール

  • hpbla1
mkdir /opt/globus-4.0.3
cd /tmp/gt4.0.3-all-source-installer
./configure --prefix=/opt/globus-4.0.3 --with-flavor=gcc64dbg
make -j 3
make install
ln -s /opt/globus-4.0.3 /opt/globus
export GLOBUS_LOCATION=/opt/globus
export GPT_LOCATION=/opt/globus
mkdir /opt/ng-4.1.0
cd /tmp/ng-4.1.0
./configure --prefix=/opt/ng-4.1.0 --with-globusFlavor=gcc64dbg
make
make install
ln -s /opt/ng-4.1.0 /opt/ng

2006/10/6(金) 平澤

32ビットライブラリ、gcc32のインストール

  • hpbla1
yum groupinstall "Legacy Software Development"
yum install glibc-devel.i386

2006/10/2(月) 平澤

yum環境、MPICH2

  • hpbla1-8
yum install yum-plugin-fastestmirror
vi /etc/yum.conf
-> add "plugins=1"
yum install yumex rsh-server
chkconfig rsh on
/etc/init.d/xinetd restart
vi /etc/fstab
-> add "bluebase:/home/opt/linux-64bit	/opt	nfs	defaults"
mount /opt
  • hpbla1
mkdir /opt/mpich2-1.0.4p1
./configure --prefix=/opt/mpich2-1.0.4p1
make
make install
ln -s mpich2-1.0.4p1 mpich2

2006/10/1(日) 町田

作業情報

残りすべてのブレードのup2dateを完了.

2006/9/30(土) 町田

作業情報

hpbla6,7のアップデートを終了.

hpbla4が安定してネットに接続できるようになりました.原因は不明.

hpbla2,3,4は途中のまま放置して帰ります.

2006/9/29(金) 町田

作業情報

各ブレードを,up2dateを用いて更新.hpbla1,5,8は修正が終わりました.

libibverbs,libmthca,libspdについては依存の関係でアップデートしていません.

hpbla4については,ネットに繋がったり繋がらなくなったり….接触不良だと思います.

他のブレードについては,現在更新処理中です(21:10の時点).その更新が終わったら,hpbla4をいじってみようと思います.

2006/9/28(木) 町田

作業情報

hpbla1のインストール作業を行いました.

2006/9/18(月) 町田

作業情報

hpbla4,hpbla5,hpbla6,hpbla7,hpbla8のインストール作業を行いました.

今回はインストール時のキーボードの設定でjp106を使いました.実際,手元にあるキーボードも日本語キーボードなので,そちらのほうが良いかもしれません.

hpbla1にログインできません.rootアカウントのパスワードが管理パスワードでない様子.ホスト名もhpbl1(本来はhpbla1)になっています.

hpbla4

NICが有効になりません.

Linuxからはアクティブになっている様子.が,正面のnicランプが点灯していない上に,背面のポートのランプも点灯していない.ケーブルを抜き差ししても状況は変わらず.ハードウェア的にオフになっているのだろうか.BIOS画面らしきものをあれこれ見回しても,それらしい設定はONになっているので,原因がわからず,そのまま.

NISとntpの設定以外は完了.

hpbla5

正常にインストール,設定の完了.

hpbla6

hpbla4と全く同じ状況.

hpbla7

正常にインストール,設定の完了.

hpbla8

正面のnicランプがついたり消えたり.正常に接続できていない様子.よってほぼhpbla4と同じ状況.

hpblaの情報について

本当は別ページにまとめたほうが良いと思うが,とりあえずここにメモしておく.

いつか役に立つかもしれない,各ホストのIPとMACアドレス一覧.

  • hpbla1
    • eth0 192.168.208.190, 00:16:35:3B:C1:E6
    • eth1 nothing, 00:16:35:3B:02:6B?
    • eth2 nothing, 00:16:35:3B:E1:1D?
    • eth3 nothing, 00:16:35:3B:A5:07?
  • hpbla2
    • eth0 192.168.208.191, 00:16:35:3B:91:A0
    • eth1 nothing, 00:16:35:3B:22:53
    • eth2 nothing, 00:16:35:3B:22:4F
    • eth3 nothing, 00:16:35:3B:05:58
  • hpbla3
    • eth0 192.168.208.192, 00:16:35:38:E1:48
    • eth1 nothing, 00:15:60:A9:4C:4F
    • eth2 nothing, 00:15:60:A9:4C:4E
    • eth3 nothing, 00:16:35:3B:05:15
  • hpbla4
    • eth0 192.168.208.193, 00:16:35:38:24:E6
    • eth1 nothing, 00:16:35:38:64:04
    • eth2 nothing, 00:16:35:38:54:D8
    • eth3 nothing, 00:16:35:3B:95:E2
  • hpbla5
    • eth0 192.168.208.194 00:16:35:3B:C1:C5
    • eth1 nothing, 00:16:35:3B:02:90
    • eth2 nothing, 00:16:35:3B:02:93
    • eth3 nothing, 00:16:35:3B:05:63
  • hpbla6
    • eth0 192.168.208.195 00:15:60:0E:F0:91
    • eth1 nothing, 00:15:60:0E:C0:99
    • eth2 nothing, 00:15:60:0E:C0:98
    • eth3 nothing, 00:16:35:3B:F3:D5
  • hpbla7
    • eth0 192.168.208.196 00:16:35:3B:C1:9F
    • eth1 nothing, 00:16:35:3B:02:49
    • eth2 nothing, 00:16:35:3B:E1:7B
    • eth3 nothing, 00:16:35:3B:05:07
  • hpbla8
    • eth0 192.168.208.197 00:16:35:3B:C1:47
    • eth1 nothing, 00:16:35:3B:E1:6E
    • eth2 nothing, 00:16:35:3B:02:56
    • eth3 nothing, 00:16:35:3B:05:14

その他

FSWikiになかなか慣れません.

2006/9/14(木) 町田

作業情報

hpbla3のインストール作業を終えました.

ネットの不調かnisが引けないのでどうしたものか.

FSWikiは初めて使いますが,wiki同士でここまで方言が違うとは思ってもいませんでした….

インストール手順の詳細については,今後つくっていきます.


2006/9/11(月) 町田

作業情報

ページ新設

HPのブレードサーバhpblの管理情報について.

平澤さんとともにhpbla1のインストール作業.

TODO

ソフトインストール

VMWare Server

Eclipse

OpenOffice.org

gcc4

環境

hpblのインストール情報

  • RAIDの解除

RAIDが有効になっている場合があるが,今回はそれを使わないので,以下のようにしてRAIDを無効に設定する.

起動時のメッセージを見て,

Slot0 Smart Array Gi ...

等の文字が表示された時点でF8を押し,設定画面に入る.

View Logical Drive

でドライブ情報を見る.ここでドライブが

---Available Logical Drives---
Logical Drive#1, RAID1+0 33.9GB

のように1つだけであればRAID化されているので,

Delete Logical Drive

でRAID化されたドライブを削除する.

Create Logical Drive

にて新しくドライブを設定する.

Maximum Boot Partition
[X]Disable(4GB Maximum)
[ ]Enable(8GB Maximum)

ドライブの設定が終わったら再起動し,CentOSのCDから起動する.

インストールモードはテキストモード

linux text

Welcomeメッセージが表示される.

Language Select
jp
キーボード
101

現在は日本語106キーボードが繋がっているが,後にHappy Hacking Keyboardなどを接続する可能性があるため.

インストールの種類
custom
ディスクパーティションの設定
手動で設定

自由領域に,2つのパーティションを作成する.

マウントポイント /
ファイルシステム ext3
容量 10280MB
[*] 第1パーティションとして強制指示
マウントポイント(利用不可)
ファイルシステムタイプ swap
容量 1024 (MB)
ブートローダの設定
(*)GRUBを使用
システムが正しく機能するためには,起動時にカーネルに対して
特別なオプションを渡す必要があります.

と表示されるが,空欄で次へ.

GRUBパスワード なし
マスタブートレコード
/dev/sciss/c0d0
eth0用のネットワーク設定
[ ] DHCPを使用して設定
[*] 起動時にアクティブにする.
IP: 192.168.208.XXX
ネットマスク: 255.255.255.0

eth1から3までは,DHCP,起動時アクティブをともにOFFにしておく.

その他のネットワークの設定
ゲートウェイ: 192.168.208.129
DNS: 192.168.208.51
ホスト名の設定
[ ] DHCP経由で自動設定
[*] 手動で
ファイアウォール
なし

次画面でセキュリティに関する警告が出るが,続行

Security Enhanced Linux
( ) 無効
( ) 警告
(*) アクティブ
言語サポート
JapaneseとEnglish(USA)を選択
標準の言語
English(USA)
Japanese
タイムゾーンの選択
[*] System Clock Uses UTC
アジア/東京
rootパスワードの設定
パッケージグループの選択
以下を選んで3,346MBから3,664MBになれば良い.

[*] X Window System
[*] GNOMEデスクトップ環境
[ ] KDE(Kデスクトップ環境
[*] エディタ
[*] □□系と科□系(文字が化けている)
[*] グラフィカルインターネット
[*] テキストベースのインターネット
[*] Office/生□性
[*] サウンドとビデオ
[*] 著作と発行
[*] グラフィクス
[*] ゲームと□□
[*] サーバ設定ツール
[*] Webサーバ
[ ] メールサーバ
[ ] Windowsファイルサーバ
[ ] DNSネームサーバ
[*] FTPサーバ
[ ] PostgreSQLサーバ
[ ] MySQLサーバ
[ ] ニュースサーバ
[ ] ネットワークサーバ
[ ] レガシーなネットワークサーバ
[*] 開発ツール
[ ] Xソフトウェア開発
[ ] GNOMEソフトウェア開発
[ ] KDEソフトウェア開発
[ ] 互換アーキテクチャ開発のサポート
[ ] レガシーソフトウェアの開発
[*] 管理ツール
[*] システムツール
[ ] 印刷サポート
[ ] 互換アーキテクチャのサポート
[ ] すべて

インストールが終わると再起動し,GUI画面で起動する.

ウェルカムメッセージが表示されるので[次へ]

ライセンス同意書が表示されるので,同意したら

●はい,私はライセンス同意書に同意します

を選んで[次へ]

日付と時刻
ネットワークタイムプロトコル(ntp)を有効にする
red.yuba.is.uec.ac.jp

を追加する.もともとある3つのntp設定は消しておく.

ディスプレイ
[Configure]
Generic LCD Display
 LCD Panel 1024X768
解像度: 1024X768
色の深さ: 数百万の色
nisの設定
ドメイン: yuba.is.uec.ac.jp
nisサーバ: red.yuba.is.uec.ac.jp

以上でセットアッププロセスの終了になる.

インストール後の設定

vi /etc/resolv.conf
vi /etc/hosts
vi /etc/fstab
-> add "bluebase:/home/opts/linux-64bit	/opt	nfs	rsize=8192,wsize=8192"
mount /opt
vi /etc/auto.master
->home auto.indirect.home
yum install yum-plugin-fastestmirror
vi /etc/yum.conf
-> add "plugins=1"
yum install yumex rsh-server
chkconfig rsh on
/etc/init.d/xinetd restart
vi /etc/profile.d/lab.sh
mv /etc/profile.d/krb5.sh /etc/profile.d/krb5.sh-nouse
mv /etc/profile.d/krb5.csh /etc/profile.d/krb5.csh-nouse
vi /etc/hosts.equiv

最終更新時間:2010年03月30日 21時18分12秒