
Postgresのtextsearch_jaを設定しました。
そこでMecabを使用しています。
例として以下のテーブルで
create table table1 ( id int, col1 text, col2 text, tsv tsvector );
更新処理時にtsvカラムに解析データが入るようにトリガを設定しました。
col1に「田中00001」をINSERTします。
解析するtsvカラムには「田中」と「00001」が入ります。
ここで、「0000」と検索しても、レコードを取得できませんでした。
投げたSQLは以下のような感じです。
select * from table1 where tsv @@ to_tsquery('japanese', '0000')
select * from table1 where tsv @@ to_tsquery('japanese', '0000')
とした場合はレコードを取得することができます。
以下も試しましたがレコードは取得できませんでした。
select * from table1 where tsv @@ plainto_tsquery('japanese', '0000')
「0000」にて検索した場合に、全文検索の機能でレコードを取得する方法はありますでしょうか?
postgres8.4.5
Mecab 0.98
No.1ベストアンサー
- 回答日時:
MeCab が 00001 を 1 つの単語として切り出してインデックスを作っているので、基本的には 0000 で検索してもヒットしません。
MeCab を使うような分かち書き方式の全文検索では、単語を切り出すときに使う辞書によるので、お望みのようなことを行うには N-gram 方式の全文検索が適しています。PostgreSQL では Senna や Groonga といった N-Gram 方式の全文検索エンジンと組み合わせた textsearch_senna や textsearch_grronga を使うのがいいでしょう。
ただ、PostgreSQL 8.4 以上をお使いのようですので、前方一致であれば MeCab でも 0000 をインデックスを使って検索できます。
SELECT * FROM table1 WHERE tsv @@ to_tsquey('japanese', '0000*');
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
SQLのこと:distinctして並び替...
-
SELECT INTOで一度に複数の変数...
-
PostgreSQLのtimestamp型で時間...
-
既にテーブルが存在する場合の...
-
sqlに記述できない文字
-
フラグをたてるってどういうこ...
-
truncate tableを使って複数の...
-
selectの単純繰り返し
-
テーブル定義書(Oracle) 【IX】...
-
テーブル名が可変の動的SQLをフ...
-
Accessの構成をコピーしたい
-
結合したテーブルをSUMしたい
-
csvデータ不要列の削除をbatフ...
-
SELECTした結果に行番号を求めたい
-
既存データをINSERT文にして出...
-
ADO+ODBCでテーブルに接続する...
-
集計でテストの各教科の最高得...
-
Activation codeとは
-
oracle ora-02298
-
SQLで、過去で一番大きい日付の...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
2つの列からの最大値取得
-
joinの場合のテーブル名の別名...
-
SQLで期間をずらした集計処理
-
複数行の結果を単一列に連結
-
PostgreSQL で自動採番する方法
-
SQLのこと:distinctして並び替...
-
order byで並び変えし最大値の...
-
SQLで2年連続で値が上昇した年...
-
CREATE VIEWについて
-
SELECT INTOで一度に複数の変数...
-
【SQL】他テーブルに含まれる値...
-
フラグをたてるってどういうこ...
-
sqlに記述できない文字
-
truncate tableを使って複数の...
-
オラクルのUPDATEで複数テーブル
-
既存データをINSERT文にして出...
-
副問合せを使わずにUNIONと同様...
-
SQLで、Join句で結合したテ...
-
UPDATEで既存のレコードに文字...
-
PostgreSQLのtimestamp型で時間...
おすすめ情報