漢字→カタカナ変換ツールMecab
漢字→カタカナ変換ツールMecab
当ツールはMecabを使用して構築しています。
Mecab Copyright (c) 2001-2008, Taku Kudo, Copyright (c) 2004-2008, Nippon Telegraph and Telephone Corporation All rights reserved.
漢字→カタカナ変換ツールMecab概要
「漢字→カタカナ変換ツールMecab」は日本語テキストをカタカナに変換するツールです。オープンソースのMecabを利用して構築しています。
学校や自宅でのお子様の教育などに活用頂けます。
漢字→カタカナ変換ツールMecabの使い方
テキストを入力します
ツールの上段のテキストエリアに変換したい日本語テキストを入力します。漢字→カナ変換ボタンを押します
変換結果がツール下段に表示されます
関連オンラインツール
- 英語テキスト朗読ツールMaryTTS・オンライン
- テキスト朗読ツールJTalk・オンラインツール
- 音源分割ツールspleeter・オンラインツール
- 漢字→ひらがな変換Mecab・オンラインツール
- 感情分析ツールML-Ask・オンラインツール
免責事項
著作権
本ツールは無料で公開しておりますが、著作権を放棄しておりません。 著作権はぴよ猫に帰属します。ソフトウェアの修正、複製、再配布
本サイトのURLは自由に掲載して頂いて問題ありません。 ただし、本サイトのツールを無断で改変し設定・設置することは出来ません。ソフトウェアを使用したことによる損害、保証等
本ツールを使用したことによる一切の損害(一次的、二次的に関わらず)に対し、ぴよ猫は責任を負いません。当サイトではフリーツールを公開すると共に、IT関連の豆知識やツールの実装方法等も紹介しています。興味があれば以降の記事も是非ご一読下さい。
↓↓↓
Mecabとは
Mecab概要
MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソースの形態素解析エンジンです。 BSDライセンスで公開されており規約を守れば自由に利用することが出来ます。Mecabのインストール方法(CentOS 7.0)
Mecabのyumリポジトリを登録する
/etc/yum.repos.d/groonga.repoを編集する。
# porgの入手
[groonga]
name=Groonga for CentOS $releasever - $basearch
baseurl=https://packages.groonga.org/centos/6/$basearch/
gpgcheck=1
enabled=1
gpgkey=https://packages.groonga.org/centos/RPM-GPG-KEY-groonga
yumでMecabをインストールする
yum install -y mecab mecab-devel
NAIST辞書をインストールする
wget https://iij.dl.sourceforge.jp/naist-jdic/53500/mecab-naist-jdic-0.6.3b-20111013.tar.gz
tar xvzf mecab-naist-jdic-0.6.3b-20111013.tar.gz
cd mecab-naist-jdic-0.6.3b-20111013
./configure --with-charset=utf8 --with-mecab-config=/usr/bin/mecab-config
make
make install
/etc/mecabrcを編集し、dicdirの参照先を変更する。
; dicdir = /usr/lib64/mecab/dic/ipadic
dicdir = /usr/lib64/mecab/dic/naist-jdic
Mecabの実行方法(シェル)
mecab
すもももももももものうち
# 以下の結果が出力されます。
# すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
# も 助詞,係助詞,*,*,*,*,も,モ,モ
# もも 名詞,一般,*,*,*,*,もも,モモ,モモ
# も 助詞,係助詞,*,*,*,*,も,モ,モ
# もも 名詞,一般,*,*,*,*,もも,モモ,モモ
# の 助詞,連体化,*,*,*,*,の,ノ,ノ
# うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
# EOS
参考サイト
Mecabの実行方法(PHP 7.0)
function conv2kana($text){
// 使用する辞書のパスを設定
$options = array('-d', '/usr/lib64/mecab/dic/naist-jdic');
// MeCabのインスタンスを生成
$mecab = new \MeCab\Tagger($options);
// テキストを要素に分割
$nodes = $mecab->parseToNode($text);
// 要素毎に結果を取得
foreach($nodes as $n){
echo $n->getFeature();
}
}
必要ライブラリ
php-mecab
【インストール方法】
cd /usr/local/src/
git clone https://github.com/rsky/php-mecab.git
cd /usr/local/src/php-mecab/mecab
phpize
./configure --with-php-config=/usr/bin/php-config --with-mecab=/usr/bin/mecab-config
make
make test
make install
### extensionファイル作成
vi /etc/php.d/mecab.ini
extension=mecab.so
参考サイト
github.com/nihongodera/php-mecab-documentation
漢字→カタカナ変換ツールMecabまとめ
作った動機は漢字を含む日本語でかかれた文章をカタカナで検索出来たら良いなと思ったからです。ちょっと漢字がうろ覚えでも検索できると便利だと思う。
Mecabは人名や企業名も正しい読みに変換できるのが驚きました。これがあれば、自分のやりたいことが出来るかも。前述のツールも出来たら公開したいと思います。