- 2008-02-18 (Mon) 17:10
- 形態素解析 | ActionScript3.0
最近は3dとか物理エンジンとか、グラフィックっぽいことばかりだったので、
少し違うことを。
JavaScript で形態素解析もどき
このあたりを参考に形態素解析もどきで遊んでみます。
まずは、参考サイトのように、日本語の文章を、漢字やひらがな、カタカナで分割してみます。
と、言ってもほんの2行ですね。
var pattern:RegExp = /([一-龠々〆ヵヶ]+)|([ぁ-んー-―]+)|([ァ-ヴー-―]+)|([a-zA-ZazA-Z]+)|([0-90-9.]+)|[、。!!??()()「」『』-]/g;
output_text = input_text.match(pattern).join(" | ");
正規表現で分割して、とりあえず今回は「|」で区切ってみました。
ちなみに文章のサンプルはWikipediaからActionscriptの項です。
「原文」のテキストエリアに文章を入れて、「解析」ボタンを押すと文章をパースします。
今日はここまで。
- Newer: [as3]メモリリークをデバッグ(1)
- Older: [as3][FOAM]初めてのFOAM(2) 多角形の表示
Comments:0
Trackbacks:0
- Trackback URL for this entry
- http://www.jinten.net/blog/archives/46/trackback
- Listed below are links to weblogs that reference
- [as3][言語解析]ActionScript3.0で形態素解析もどき(1) from Jinten Blog