dポイントプレゼントキャンペーン実施中!

単語の表記のゆれを吸収したいのですが、
アルゴリズムが考え出せません。
大文字を小文字にしたり、ジをヂにしたり、
ツィをティにしたりしたいです。
こういう場合どのようにしたらいいのでしょうか?
入力は単語と出力は吸収した単語となると思います。
よろしくお願い致します。

A 回答 (2件)

複数の文字列が与えられたとき、それらの共通する部分と異なる部分についての研究は、自然言語処理のほかにも、生物情報学の研究の一環として、例えばタンパク質内のアミノ酸の並び方について、すでに多くの研究がされてきたことと思います。



独自に考える以前に、既存のプログラムを試してみたり、これらの分野の文献を検索するか、あるいは学生であれば、先生に直接尋ねることが有効だと思われます。

また、ここで質問されるのであれば、Perl、あるいは、その他プログラミング、または、生物学の分野で質問をした方がよいように思います。
    • good
    • 0

アルゴリズムですね。



  単語を読み込む
  単語の中に大文字がある場合、それを対応する小文字に変更する
  単語の中に「ジ」がある場合、それを「ヂ」にする
  単語の中に「ツィ」がある場合、それを「ティ」にする
  単語を出力する
  ・・・を、読み込む単語がなくなるまで繰り返す

ではいかがでしょうか。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!