Issue #10078 has been reported by Hiroki Najima.
Bug #10078: String#count() returns wrong count under specific conditions
- Author: Hiroki Najima
- Status: Open
- Priority: Normal
- Assignee:
- Category:
- Target version:
- ruby -v: ruby 2.0.0p481 (2014-05-08) [i386-mingw32]
- Backport: 2.0.0: UNKNOWN, 2.1: UNKNOWN
以下の条件の場合、String#countが誤った文字数を返します。
- 文字コードがWindows-31J (文字コード体系が違うせいか、UTF_8, ISO2022_JP, EUC_JPでは再現せず)
- countの引数が1バイト文字一つのみ
- Stringにcountに指定された文字と一致する文字コードが含まれる。
異常な例: 和は0x9861, aは0x61
>ruby -ve "puts 'a-和'.count('a')"
ruby 2.0.0p481 (2014-05-08) [i386-mingw32]
2
正常な例: countに2バイト以上与えると動作が正しくなります。
'a-a’などtr由来のcountの動作も的確ですが、'a-a’と’a’は等価なはずなのに異常な例と結果が異なります。
>ruby -ve "puts 'a-和'.count('a-a')"
ruby 2.0.0p481 (2014-05-08) [i386-mingw32]
1
>ruby -ve "puts 'a-和'.count('ab')"
ruby 2.0.0p481 (2014-05-08) [i386-mingw32]
1