Miniruby -e 'Process.kill(:INT, $$)' hang under cron

Issue #9820 has been updated by Kazuki Tsujimoto.

> なかださん
修正ありがとうございます。

ただ、gdbでProcess.kill(:TRAP, $$)によるシグナルを受けた後にcontinueすると
ruby_kill内のnative_cond_waitで待機したままになります。

Rubyでsignal handlerを設定していない場合にはruby_killではなくkillを呼び出すようにすればよさそうですが、
何か問題あるでしょうか。

diff --git a/signal.c b/signal.c
index 171f5ac..7a83dbc 100644
--- a/signal.c
+++ b/signal.c
@@ -487,7 +487,11 @@ rb_f_kill(int argc, const VALUE *argv)
       default:
         t = signal_ignored(sig);
         if (t) {
-      if (t < 0) ruby_kill(pid, sig);
+      if (t < 0) {
+          if (kill(pid, sig) < 0) {
+        rb_sys_fail(0);
+          }
+      }
       break;
         }
         signal_enque(sig);

Bug #9820: miniruby -e ‘Process.kill(:INT, $$)’ hang under cron

  • Author: Akira T.
  • Status: Closed
  • Priority: Normal
  • Assignee:
  • Category:
  • Target version:
  • ruby -v: ruby 2.2.0dev (2014-05-09 trunk 45884) [x86_64-linux]
  • Backport: 2.0.0: DONTNEED, 2.1: REQUIRED

最近、しばたさんが運用を始めた chkbuild で、
TestBeginEndBlock#test_propagate_signaled が hang しています。
http://chkbuild002.hsbt.org/chkbuild/ruby-trunk/log/20140509T060013Z.fail.html.gz

調べて再現コードを小さくしていった結果、

miniruby -e ‘Process.kill(:INT, $$)’

というのを cron から動かしたときは hang し、
端末から動かしたときは hang しない、ということが判明しました。

strace した結果をみると、
cron 下では timer thread が prctl の直後に poll を呼び出してそれが終わらないという挙動なのに対し、
端末ではそのあたりで context switch が起きている、ような気がします。

strace の結果を strace.cron.log と strace.term.log として添付します。

なにかわかるひとはいますでしょうか?

% ./miniruby -v
ruby 2.2.0dev (2014-05-09 trunk 45884) [x86_64-linux]
% uname -mrsv
Linux 3.2.0-4-amd64 #1 SMP Debian 3.2.54-2 x86_64
% lsb_release -idrc
Distributor ID:  Debian
Description:  Debian GNU/Linux 7.5 (wheezy)
Release:  7.5
Codename:  wheezy

なお、コミッタならしばたさんに頼むとそのマシンにアカウントを作ってくれる模様です。

—Files--------------------------------
strace.cron.log (15.8 KB)
strace.term.log (17.6 KB)