NLP

OpenNLP Toolsによる英語の解析: 構文解析編

以前のエントリで、Javaの自然言語処理ライブラリOpenNLP Toolsを使った英語の品詞解析(POS tagging)について書いたんですが、構文解析についても方法を知りたがっている方が多いようなので、手順を簡単に説明します。1. OpenNLP Toolsのダウンロード以下…

形態素解析するときは未知語の扱いに注意

僕が全文検索システムを作るときに使っている方法は、 Senでテキストを形態素に分解して、FULLTEXTインデックスを張ったMySQLのMyISAMテーブルに突っ込む。 LuceneにJapaneseAnalyzer(Sen)を組み合わせて使う。 のどちらかです。MySQL+FULLTEXTよりLuceneの…

JWNLを使ってJavaからWordNetにアクセスする方法のメモ

OpenNLPに続いて、NativeChecker関連ネタを書いてみます。NativeCheckerでは、WordNetをオンメモリ展開して、スペルミスチェックと類義語検索に使っています。ここで利用しているのがJWNLです。僕がJavaのWordNetライブラリをいくつか試した中では、JWNLの出…

OpenNLP Toolsによる英語の品詞解析

英文校正サイト [NativeChecker] では、入力した英文の各単語の品詞表示を行っています。 この品詞解析処理には、自然言語処理プロジェクト群であるOpenNLP中のOpenNLP Toolsを使っています。 OpenNLP Toolsによる品詞分析について、Web上に日本語の資料があ…