gsubでSegmentation Error

締切済

質問者：hercle
質問日時：2010/03/11 20:23
回答数：1件

以前同様の質問をしましたが、
具体的に内容を書きます。

XMLファイルを読み込みで、
余分な空白や空行をとるため、
下記のソースを実行しました。

xml_str = xml_str.gsub(/>\s+/, ">")
xml_str = xml_str.gsub(/\s+</, "<")

すると、Segmentation Faultが発生します。

困るのは、必ずある条件で発生するのではなく、
ソースの修正に合わせて(XMLの方ではなく)
起こったり、起こらなかったりするのです。

ネットで調べた結果
なんとなくgsubとstrip的なことを組み合わたときに
発生するのかな？という気もしています。

もし、回避方法をご存知の方がいましたら
教えてください。

ちなみに、
自分でgsubメソッドも作ってみましたが、
result << t_str[pre_pos..pos - 1]
で同じエラーが発生しました。
もうお手上げです(TT)
patternは正規表現です

def self.gsub(str, pattern, replacement = "")

t_str = str
pre_pos = 0
pos = t_str =~ pattern
return t_str unless pos

result = ""
while pos
rep_str = Regexp.last_match[0]
len = rep_str.length

result << t_str[pre_pos..pos - 1]
result << replacement
pre_pos = pos + len
pos = t_str =~ pattern
end

result << t_str[pre_pos..-1]

return result

end

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (1件)

最新から表示
回答順に表示

No.1

回答者： yugui
回答日時：2010/03/12 15:03

Ruby自体のバグのようですから、ソースの修正によって発生したりしなかったりするということもあるでしょう。

差し支えない範囲で、再現するに足るソースとXMLデータをいただければRubyを修正できる可能性もあります。あるいは、新しいバージョンのRubyでは修正されていることを確認できるかも知れません。

(1) xml_strを取得する部分も含めて、完全なソースをいただけますか?
xml_str = xml_str.gsub(/>\s+/, ">")
xml_str = xml_str.gsub(/\s+</, "<")

(2) 差し支えない範囲で、再現に足るXMLデータをいただけますか

(3) 念のため、Rubyのバージョン(ruby -vの結果)を再度いただけますか。

この回答への補足

ご回答いただき、ありがとうございます。

ソースについては（１）のソースより前は
File.readくらいです。
ただ、XML自体は５万行ほどあります。
大変申し訳ないのですが、
仕事用なのでデータを出すことができません。
下記のものが５０００個くらい並んでいます。
<?xml version="1.0" encoding="UTF-8"?>
<kanji>
<KanChar char="亜">
<read>
<On>ア</On>
<Kun>つ…ぐ</Kun>
<Name>つぎ</Name>
<Name>つぐ</Name>
</read>
</char>
・
・
・
</kanji>

ファイルはUTF-8になっています。

ruby -vの出力は以下のとおりです
ruby 1.9.1p376 (2009-12-07 revision 26041)

実行環境はlinuxです。
このバグの対応方法に行き詰まっています。
最悪、Ｃでソースを作って、読み込ませようかと思っていますが、
正規表現までの対応まで考えると
頭の痛いところです。

お手数かけますが、
ご対応いただけましたら、本当に助かります。