ようじょのおえかきちょう

ふぇぇ お医者さんにペン持ったらダメっていわれた〜〜

nlp

言語処理100本ノック2015 をRubyでやる【第6章】

コードは GitHub に上げています。この記事では省略した長い出力も output/ ディレクトリに置いてます。 github.com 今回は第 6 章「英語テキストの処理」です。やっと折り返しですね! 英語のテキスト(nlp.txt)に対して,以下の処理を実行せよ. 50. 文区…

言語処理100本ノック2015 をRubyでやる【第5章 後半】

コードは GitHub に上げています。この記事では省略した長い出力も output/ ディレクトリに置いてます。 github.com 今回は第 5 章「係り受け解析」です。長いので前半と後半に分けます。 夏目漱石の小説『吾輩は猫である』の文章(neko.txt)をCaboChaを使…

言語処理100本ノック2015 をRubyでやる【第5章 前半】

昨日 4/18 に第 10 章の問題 99 までなんとか終えることができました。ブログ更新のほうサボってたので、これから解説をがんばります。 コードは GitHub に上げています。この記事では省略した長い出力も output/ ディレクトリに置いてます。 github.com 今…

言語処理100本ノック2015 をRubyでやる【第4章】

コードは GitHub に随時上げていきます。この記事では省略した長い出力も output/ ディレクトリに置いてます。 github.com 今回は第 4 章「形態素解析」です。 夏目漱石の小説『吾輩は猫である』の文章(neko.txt)をMeCabを使って形態素解析し,その結果をn…

言語処理100本ノック2015 をRubyでやる【第3章】

コードは GitHub に随時上げていきます。この記事では省略した長い出力も output/ ディレクトリに置いてます。 github.com 今回は第 3 章「正規表現」です。 Wikipediaの記事を以下のフォーマットで書き出したファイルjawiki-country.json.gzがある. 1行に1…

言語処理100本ノック2015 をRubyでやる【第2章】

コードは GitHub に随時上げていきます。 github.com 実は 12/28 現在、6 章まで進んでいるのであともうちょっと! って感じです。見た感じ 7 章もいけそうなので、8 章以降は Ruby で機械学習ライブラリ使えるかにかかっています。 今回は第 2 章「UNIXコマ…

言語処理100本ノック2015 をRubyでやる【第1章】

自然言語処理を扱う研究室に配属になったので、この秋から課題として「言語処理100本ノック 2015」をやっています。先輩も同期も Python で書いているのですが、みんな一緒はつまんないので Ruby で書いてみることにしました。コードは GitHub に随時上げて…