MeCab
2018.08.16
MeCabは、奈良先端科学技術大学院大学出身、現GoogleソフトウェアエンジニアでGoogle 日本語入力開発者の一人である工藤拓氏によって開発されたオープンソースの形態素解析エンジン。京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発された。名称は開発者の好物「和布蕪(めかぶ)」から。
開発開始当初はChaSenを基にしており、「ChaSenTNG」という名称で開発されていたが、現在はChaSenとは独立してスクラッチによって開発されている。言語、辞書、コーパスに依存しない汎用的な設計を基本方針とし、パラメータの推定には Conditional Random Fields (CRF) を用いているため、ChaSenが採用している「隠れマルコフモデル」に比べ性能が向上している。(解析精度は同程度で、解析速度は平均3-4倍速い) また、平均的に ChaSen, Juman, KAKASIより高速に動作する。
品詞情報を利用した解析・推定を行うことができる。辞書は、ChaSenと同様にIPA品詞体系で構築されたIPADICが一般的に用いられている。 Googleが公開した大規模日本語n-gramデータの作成にも使用された実績がある。
【特徴】
■辞書、コーパスに依存しない汎用的な設計
■条件付き確率場(CRF)に基づく高い解析精度
■ChaSen や KAKASI に比べ高速
■辞書引きアルゴリズム/データ構造に高速な TRIE 構造である Double-Arrayを採用
■再入可能なライブラリ
■各種スクリプト言語バインディング(perl/ruby/python/java/C#)
関連記事
TAG CLOUDS
TOPICS
-
手書き文字の答案をAIが採点⇒ワイの達筆についてこれるものなら…
大量の“手書き答案”をAIが98%の精度で読み取る! 小学校の新学習指導要領全面実施(2020年4月から)に向け、テクノロジーで教育にイノベーションを起こす「EdTech(エドテック)」領域を手がける企業の取り組み本格化が見込まれる。(「EdTech」は、EducationとTechnologyを組み合わせた言葉) 新学習指導要領では小学5・6年生を対象にプログラミング教育が導入されるため、文部科学省、総務省、経済産業省が、機運醸成を目指し、この9月を『未来の学び プログラミング……
2019.08.26
-
【ファッショントレンド】オーダースーツにAIソムリエ!?乗り遅れるな、おじさん
AIがお客の警戒を解く 高島屋がオーダースーツ売り場で人工知能導入の背景 高島屋、一部店舗で展開する紳士服のオーダーサロン『タカシマヤ スタイルオーダー サロン』で、人工知能(AI)を活用した接客ツール『感性AIソムリエ』を常設展開する。『タカシマヤ スタイルオーダー サロン』は高島屋が2017年から紳士服のパターンオーダーを提案するスタイルのサロンで、都市部の5店舗で展開している。 団塊世代の退職ラッシュや、職場のカジュアル化などでスーツ需要が減りつつあることに伴い、現在のス……
2019.08.26
-
【介護革命】ケアマネージャーのケアプランをAIが支援
人工知能で介護は変わるか。 福祉プラットフォームを展開する福祉ベンチャーのウェルモは、11.7億円の資金調達(シリーズB)を実施した。これで、同社が実施した資金調達の累計額は約17億円に達する。出資した主な企業は、あいおいニッセイ同和損保、アカツキ、グローバルキッズCOMPANY、コニカミノルタ、eumo、LINE Venturesなど。 ウェルモは、介護サービスプラットフォーム「MILMO」や人工知能を活用したケアプラン作成支援の「ケアプランアシスタント」、障害児童支援・教育を……
2019.08.26