以前同様の質問をしましたが、
具体的に内容を書きます。
XMLファイルを読み込みで、
余分な空白や空行をとるため、
下記のソースを実行しました。
xml_str = xml_str.gsub(/>\s+/, ">")
xml_str = xml_str.gsub(/\s+</, "<")
すると、Segmentation Faultが発生します。
困るのは、必ずある条件で発生するのではなく、
ソースの修正に合わせて(XMLの方ではなく)
起こったり、起こらなかったりするのです。
ネットで調べた結果
なんとなくgsubとstrip的なことを組み合わたときに
発生するのかな?という気もしています。
もし、回避方法をご存知の方がいましたら
教えてください。
ちなみに、
自分でgsubメソッドも作ってみましたが、
result << t_str[pre_pos..pos - 1]
で同じエラーが発生しました。
もうお手上げです(TT)
patternは正規表現です
def self.gsub(str, pattern, replacement = "")
t_str = str
pre_pos = 0
pos = t_str =~ pattern
return t_str unless pos
result = ""
while pos
rep_str = Regexp.last_match[0]
len = rep_str.length
result << t_str[pre_pos..pos - 1]
result << replacement
pre_pos = pos + len
pos = t_str =~ pattern
end
result << t_str[pre_pos..-1]
return result
end
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
Ruby自体のバグのようですから、ソースの修正によって発生したりしなかったりするということもあるでしょう。
差し支えない範囲で、再現するに足るソースとXMLデータをいただければRubyを修正できる可能性もあります。あるいは、新しいバージョンのRubyでは修正されていることを確認できるかも知れません。(1) xml_strを取得する部分も含めて、完全なソースをいただけますか?
xml_str = xml_str.gsub(/>\s+/, ">")
xml_str = xml_str.gsub(/\s+</, "<")
(2) 差し支えない範囲で、再現に足るXMLデータをいただけますか
(3) 念のため、Rubyのバージョン(ruby -vの結果)を再度いただけますか。
この回答への補足
ご回答いただき、ありがとうございます。
ソースについては(1)のソースより前は
File.readくらいです。
ただ、XML自体は5万行ほどあります。
大変申し訳ないのですが、
仕事用なのでデータを出すことができません。
下記のものが5000個くらい並んでいます。
<?xml version="1.0" encoding="UTF-8"?>
<kanji>
<KanChar char="亜">
<read>
<On>ア</On>
<Kun>つ…ぐ</Kun>
<Name>つぎ</Name>
<Name>つぐ</Name>
</read>
</char>
・
・
・
</kanji>
ファイルはUTF-8になっています。
ruby -vの出力は以下のとおりです
ruby 1.9.1p376 (2009-12-07 revision 26041)
実行環境はlinuxです。
このバグの対応方法に行き詰まっています。
最悪、Cでソースを作って、読み込ませようかと思っていますが、
正規表現までの対応まで考えると
頭の痛いところです。
お手数かけますが、
ご対応いただけましたら、本当に助かります。
次の2点を行ったことで、
今のところうまく動いているような気がします。
(1)結局、Cのgsubを作りました。
(2)処理の前後でガベージコレクションを止める(GC.disable)
ご回答ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ビーリアルのユーザー名を変え...
-
Ruby on railsをrails sで立ち...
-
VBScriptでExcel(2019)上のデー...
-
100万件越えCSVから条件を満た...
-
C言語の入力した文字を反転させ...
-
英数字を含む文字列(0-9,A-Z)...
-
秀丸エディタで、同じ記号で囲...
-
(再質問)エクセルのマクロボ...
-
pandasでsqlite3にテーブル作成...
-
pythonエラー
-
電子書籍作成、epubファイルの...
-
A4 持ち込み
-
前回の質問の続き
-
あせんうぶり言語
-
これらは書誌情報だと思うので...
-
情報の表現。()内がどうしても...
-
pythonのerrorコード
-
三項でたとえば交換って
-
WinSCPで画像のように puttyを...
-
パソコンのスクリーンセーバー...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ビーリアルのユーザー名を変え...
-
(再質問)エクセルのマクロボ...
-
A4 持ち込み
-
パソコンのスクリーンセーバー...
-
教えてください
-
100万件越えCSVから条件を満た...
-
pandasでsqlite3にテーブル作成...
-
VBScriptでExcel(2019)上のデー...
-
Accessで文字列のバイト数読み込み
-
1、Rstudioで回帰直線を求める...
-
VBA メモ帳の上書き保存がしたい
-
Ruby on railsをrails sで立ち...
-
英数字を含む文字列(0-9,A-Z)...
-
再起動後必ず2つのエラーが出...
-
pythonエラー
-
クリスタルレポートで困ってい...
-
Beautiful Soupのインストール...
-
実行時エラー450:引数の数が一...
-
前回の質問の続き
-
符号付整数の演算結果を答えよ ...
おすすめ情報