Home > 形態素解析 | ActionScript3.0 > [as3][言語解析]ActionScript3.0で形態素解析もどき(1)

[as3][言語解析]ActionScript3.0で形態素解析もどき(1)

最近は3dとか物理エンジンとか、グラフィックっぽいことばかりだったので、
少し違うことを。

JavaScript で形態素解析もどき
このあたりを参考に形態素解析もどきで遊んでみます。

まずは、参考サイトのように、日本語の文章を、漢字やひらがな、カタカナで分割してみます。

と、言ってもほんの2行ですね。

var pattern:RegExp = /([一-龠々〆ヵヶ]+)|([ぁ-んー-―]+)|([ァ-ヴー-―]+)|([a-zA-ZazA-Z]+)|([0-90-9.]+)|[、。!!??()()「」『』-]/g;
output_text = input_text.match(pattern).join(" | ");

正規表現で分割して、とりあえず今回は「|」で区切ってみました。
ちなみに文章のサンプルはWikipediaからActionscriptの項です。
「原文」のテキストエリアに文章を入れて、「解析」ボタンを押すと文章をパースします。


今日はここまで。

Comments:0

Comment Form
Remember personal info

Trackbacks:0

Trackback URL for this entry
http://www.jinten.net/blog/archives/46/trackback
Listed below are links to weblogs that reference
[as3][言語解析]ActionScript3.0で形態素解析もどき(1) from Jinten Blog

Home > 形態素解析 | ActionScript3.0 > [as3][言語解析]ActionScript3.0で形態素解析もどき(1)

Search
Google
Feeds
Meta
Advertisement

Return to page top