Flex ActionScript 関連覚書などなど

最近は3dとか物理エンジンとか、グラフィックっぽいことばかりだったので、
少し違うことを。

JavaScript で形態素解析もどき
このあたりを参考に形態素解析もどきで遊んでみます。

まずは、参考サイトのように、日本語の文章を、漢字やひらがな、カタカナで分割してみます。

と、言ってもほんの2行ですね。

var pattern:RegExp = /([一-龠々〆ヵヶ]+)|([ぁ-んー-―]+)|([ァ-ヴー-―]+)|([a-zA-ZazA-Z]+)|([0-90-9.]+)|[、。!!??()()「」『』-]/g;
output_text = input_text.match(pattern).join(" | ");

正規表現で分割して、とりあえず今回は「|」で区切ってみました。
ちなみに文章のサンプルはWikipediaからActionscriptの項です。
「原文」のテキストエリアに文章を入れて、「解析」ボタンを押すと文章をパースします。


今日はここまで。

コメント

コメントする