テキストマイニングの頻度分析ツール

文章を形態素解析し、単語の出現頻度やTF-IDFスコアに基づいたランキング形式で可視化するツールです。

仕様

本ツールの仕様は以下の通りです:

  • 対応言語: 日本語
  • 解析エンジン: MeCab(日本語形態素解析ライブラリ)
  • 辞書: mecab-ipadic-neologd(新語・固有表現に強い辞書)
  • 入力文字数制限: 10,000文字まで
  • 出力形式: 表形式
  • 集計単位:
    • 原形(辞書に登録されている基本形)で集計
    • 品詞は「名詞・動詞・形容詞」を対象に集計
    • TF-IDFスコアで重要度を算出
    • TF-IDFスコアの高い順にランキング表示
  • 出力項目:
    • 単語:原形ベースで統一
    • 品詞:名詞・動詞・形容詞
    • 出現回数:文章中に現れた回数
    • 出現率:全単語に対する割合(%)
    • スコア:TF-IDFスコアによる重要度
  • 上位出力件数: 100件(固定)
  • 動作環境: ブラウザ上で直接動作

使い方

本ツールの使い方は以下の通りです:

  1. テキストボックスに解析したい文章を入力します。
  2. 「解析する」ボタンをクリックします。
  3. 下部に単語ごとの解析結果が一覧表示されます。
  4. 必要に応じて以下を選択することができます。
    • CSVをダウンロードする」ボタン
      • 解析結果をCSVファイルとして保存できます。
    • クリップボードにコピーする」ボタン
      • 解析結果をクリップボードにコピーできます。

テキストマイニングの頻度分析ツールを使ってみる

0/10000文字

テキストマイニングの頻度分析ツール | いっしー@Webエンジニア