はじめて質問します。
私は印刷会社に勤務しているのですが、職務上テキスト処理を行う事が多いので、テキストに強いソフトはないか調べていた所、Perlを見つけ、今勉強中のところです。
初めはActivePerlの5.8.3を使っていたのですが、まだシフトJISに問題があるようで、文字化けをして使い物にならないので、Jperlに最近変えました。
一様Jperlは、文字化けをしないか、総ての文字を調べました。結果は、Perlのような文字化けは無かったですが、まだ、実際に仕事に使えるものなのか、不安です。
==========================
(質問)
(1)Perlにはいろいろ種類があるようなのですが、どれが一番日本語のテキスト処理に向いているのでしょうか?Jperl以外にありましたら、教えてください。
(2)Jperlの今のバージョンより最新バージョンはありますか?教えて下さい。
(3)JperlにもActivePerlのように、文字がおかしくなるようなバグがあるのでしょうか?
==========================
環境はWindous2000 Jperl(5.005_03)
文字はSjis
ご解答お願いしますm(..)m
No.1ベストアンサー
- 回答日時:
>>初めはActivePerlの5.8.3を使っていたのですが、
>>まだシフトJISに問題があるようで、
>>文字化けをして使い物にならないので、Jperlに最近変えました。
基本的に、機種依存の文字コードを処理する事は別問題なのでPerlのバグということではありません。
>>(3)JperlにもActivePerlのように、
>>文字がおかしくなるようなバグがあるのでしょうか?
バグではないですが、一部正しく処理できない事はあります。
Jperlは、楽に文字コード処理をしたいと
言うことで出来たPerlですので漢字処理は比較的
うまくやってくれます<ActivePerlは別のJcode.plが必要となったりしますので・・・逆に言うと
追加モジュールを組めば同じ事です
この回答への補足
Aruku-20030515さん
ありがとうございます。
Perlの文字化けはバグではなかったんですね、わかりました(^_^)
>>Jperlも一部正しく処理できない
とありますが、具体的にはどういった事ですか?
No.3
- 回答日時:
(1)5.8以上のバージョンでは、日本語を扱えるようになりました。
質問文の内容での文字化けは、他の回答者も答えられているようなshift_jisに起因するものだと思います。
プログラムの最初に
use encoding 'shiftjis';
とすることで、入力ファイルがシフトJISであることを認識し、内部的にunicodeで処理するようになるので、大丈夫です。
(2)(1)でも述べたように5.8以上で標準的に日本語(ユニコードによるので日本語とは限らない)が扱えるようになったので、今後バージョンアップはされなくなると思います。
No.2
- 回答日時:
Perl の文字化け現象は、一部の文字がエスケープシーケンス(¥)を使用してしまっており、それを Perl がシステムコードと誤解することで発生します。
よって(3)に関しては「ノー」といえます。
ただし、一般に JPerl と呼ばれているのは日本語に対応した Perl プログラムの総称で、特定のソフトウェアを指す言葉ではありません(違うソフトがそれぞれ個別に JPerl を名乗りあってるからです)。
よって、(2)に関しては明確な返答ができません。
Perl が文章解析に強いと言われているのは、
・初心者の登竜門である文字解析技術の訓練に気軽に使える
・正規表現が気軽に使える
という2点が大きいところです。
よって、言語としてのレベルが高くてよく、なおかつ正規表現をさほど使わないのであれば、C言語とかでもご希望の処理は可能です。
返答ありがとうございます!
正規表現は結構使うので、やっぱりPerlですかね・・。でも、どうにかPerlとうまくやっていけそうな気がしてきました!文字化けも大丈夫そうなので。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Strawberry Perl for Windows ...
-
perlで文字の置換又は抽出に関...
-
Perlのエラーについてご教授く...
-
テキストファイルで提出とは?
-
Perl言語について。
-
bashスクリプト
-
openした後、closeしないでプロ...
-
ターミナルで特定の文字と文字...
-
サクラエディターの設定の仕方...
-
逆スラッシュを使わずにメタ文...
-
配列へのリファレンスへのリフ...
-
同一の検索値が複数存在する場...
-
Perl n列目の最小値 条件付き
-
Perl 仮登録、本登録システムに...
-
Perl 正規表現
-
Perl テキスト 重複 個数
-
perl このテキストファイルを簡...
-
Raspberry Pi
-
VB.net
-
perl パターンマッチの前後の文...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
テキストファイルで提出とは?
-
INDIRECT 横に再度抽出したい
-
perlをバージョンアップしたら...
-
openした後、closeしないでプロ...
-
アルファベットに付いて質問し...
-
Strawberry Perl for Windows ...
-
bashスクリプト
-
Perlのエラーについてご教授く...
-
Perlで特定文字列から特定文字...
-
画像が表示でnull; this.src
-
Wallpaper Engineでおすすめの...
-
Perl言語について。
-
perl LWPでURLにアクセスした時...
-
Perlで時間の計算
-
Perlで、「が」を、「...
-
ファイルアイコンの左下に緑の□...
-
Perl の外部モジュールの利用方法
-
このファイルを開く方法で困っ...
-
perlで2次元配列をサブルーチ...
-
Windows10においての『Perl』の...
おすすめ情報