March 2024  |  01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

PBSサーバがすぐ終わってた、pbs_comm ? TPP 初期化エラー?

JUGEMテーマ:コンピュータ

 

PBSPro がインストールできたので、さっそく起動してみたところ、うまくいっているのかいないのか、よくわからない。

 

[root@localhost ~]# /etc/init.d/pbs start
Starting PBS
PBS Home directory /var/spool/pbs needs updating.
Running /opt/pbs/libexec/pbs_habitat to update it.
***
*** Setting default queue and resource limits.
***
Connecting to PBS dataservice....connected to PBS dataservice@localhost
pbs_iff: cannot connect to host
pbs_iff: cannot connect to host
No Permission.
qmgr: cannot connect to server
Connection refused
qmgr: cannot connect to server
Connection refused
qterm: could not connect to server  (111)
*** End of /opt/pbs/libexec/pbs_habitat
Home directory /var/spool/pbs updated.
/opt/pbs/sbin/pbs_comm ready (pid=3919), Proxy Name:localhost:17001, Threads:4
PBS comm
PBS mom
PBS sched
Connecting to PBS dataservice.....connected to PBS dataservice@localhost
Licenses valid for 1000000 Floating hosts
PBS server

一見うまくいってそうなので、サーバに接続してみるとだめだった。

 

[root@localhost ~]# /opt/pbs/bin/qmgr
Connection refused
qmgr: cannot connect to server

というわけで、調査。。。

 

確認したところ、たしかにサーバは走っていない。

 

[root@localhost ~]# /etc/init.d/pbs status
pbs_server is not running
pbs_mom is not running
pbs_sched is not running
pbs_comm is not running

TORQUEではなかったサービスのチェックもされている。このpbs_commというサービスはなんだろう?

ログが comm_logs/ディレクトリ下にあったので眺めてみると、"tpp init failed" で終わってる。

[root@localhost pbs]# cd /var/spool/pbs

[root@localhost pbs]# more comm_logs/20171019
10/19/2017 11:04:43;0002;Comm@localhost;Svr;Log;Log opened
10/19/2017 11:04:43;0002;Comm@localhost;Svr;Comm@localhost;pbs_version=14.1.0
10/19/2017 11:04:43;0002;Comm@localhost;Svr;Comm@localhost;pbs_build=mach=N/A:security=N/A:configure_args=N/A
10/19/2017 11:04:43;0002;Comm@localhost;Svr;Comm@localhost;/opt/pbs/sbin/pbs_comm ready (pid=3728), Proxy Name:localhost:17001, Threads:4
10/19/2017 11:04:43;0c06;Comm@localhost;TPP;alloc_router(Main Thread);Failed to resolve address, pbs_comm=localhost:17001
10/19/2017 11:04:43;0001;Comm@localhost;Svr;Comm@localhost;main, tpp init failed

その他のサービスのエラーも、以下のとおり tpp_init が関係関係してそうだった。

 

 

mom_logs/20171019
::::::::::::::

10/19/2017 11:04:43;0d80;pbs_mom;TPP;pbs_mom(Main Thread);TPP set to use reserved port authentication
10/19/2017 11:04:43;0c06;pbs_mom;TPP;tpp_init(Main Thread);Failed to resolve address, err=0
10/19/2017 11:04:43;0006;pbs_mom;Svr;pbs_mom;rpp_init failed

 

sched_logs/20171019
::::::::::::::

10/19/2017 11:04:43;0d80;pbs_sched;TPP;pbs_sched(Main Thread);TPP set to use reserved port authentication
10/19/2017 11:04:43;0c06;pbs_sched;TPP;tpp_init(Main Thread);Failed to resolve address, err=0

 

server_logs/20171019
::::::::::::::

10/19/2017 11:04:40;0c06;Server@localhost;TPP;tpp_init(Main Thread);Failed to resolve address, err=0
10/19/2017 11:04:40;0001;Server@localhost;Svr;Server@localhost;Server@localhost, tpp_init failed
10/19/2017 11:04:40;0002;Server@localhost;Svr;Server@localhost;Stopping PBS dataservice

 

TPPとは、PBSインストールガイド13.0(PBS Professional 13.0 Installation & Upgrade Guide - PBS Works) によると、 "TCP-based Packet Protocol" のことで、以前のバージョンの RPP (Reliable Packet Protocol)に代わるもので、PBS各サービス間の通信に使われるプロトコルのこと。PBSの各サービスは pbs_comm を通してTPPで通信を行う。

 

 

 

スポンサーサイト

comments

   

trackback

pagetop