テキストマイニングの頻度分析ツール
文章を形態素解析し、単語の出現頻度やTF-IDFスコアに基づいたランキング形式で可視化するツールです。
仕様
本ツールの仕様は以下の通りです:
- 対応言語: 日本語
- 解析エンジン: MeCab(日本語形態素解析ライブラリ)
- 辞書: mecab-ipadic-neologd(新語・固有表現に強い辞書)
- 入力文字数制限: 10,000文字まで
- 出力形式: 表形式
- 集計単位:
- 原形(辞書に登録されている基本形)で集計
- 品詞は「名詞・動詞・形容詞」を対象に集計
- TF-IDFスコアで重要度を算出
- TF-IDFスコアの高い順にランキング表示
- 出力項目:
- 単語:原形ベースで統一
- 品詞:名詞・動詞・形容詞
- 出現回数:文章中に現れた回数
- 出現率:全単語に対する割合(%)
- スコア:TF-IDFスコアによる重要度
- 上位出力件数: 100件(固定)
- 動作環境: ブラウザ上で直接動作
使い方
本ツールの使い方は以下の通りです:
- テキストボックスに解析したい文章を入力します。
- 「解析する」ボタンをクリックします。
- 下部に単語ごとの解析結果が一覧表示されます。
- 必要に応じて以下を選択することができます。
- 「CSVをダウンロードする」ボタン
- 解析結果をCSVファイルとして保存できます。
- 「クリップボードにコピーする」ボタン
- 解析結果をクリップボードにコピーできます。
- 「CSVをダウンロードする」ボタン
テキストマイニングの頻度分析ツールを使ってみる
0/10000文字