文系プログラマによるTIPSブログ

文系プログラマ脳の私が開発現場で学んだ事やプログラミングのTIPSをまとめています。

2012-05-03から1日間の記事一覧

solrで日本語を扱う

solrで日本語の検索をするには、いくつか設定があります。 tomcatを使う場合の設定をまとめます。1,tomcatの文字コード設定 $TOMCAT_HOME/conf/server.xmlに「URIEncoding="UTF-8" 」という設定します。 <Server port="8005" shutdown="SHUTDOWN"> <Service name="Catalina"> </service></server>

solr3.6で形態素解析のユーザ定義辞書を使用する

前回は同義語の設定をしたので、今回はユーザ定義辞書を使ってみます。まずは辞書も同義語も設定していない状態。 「形態素解析」という文字列を検索したのですが、 クエリー・インデックス共に「形態素」「解析」となってしまいましたね。 ではここから辞書…