Social Insight

日本でもっとも使われているソーシャルメディア解析ツール : ソーシャルインサイト

Q&A : よくご質問いただく項目と回答

■テキストマイニング分析結果の利用について

テレビ番組や新聞・雑誌等の記事内で、分析した結果を掲載することはできますか?

 まず、(1)掲載概要を問い合わせフォームから通知していただき、(2)掲載時のクレジット表記をしていただければ、メディア記事や番組中にてデータをご利用いただけます。利用料金はかかりません。

弊社窓口

-----------------------
【テキストマイニング利用通知】
以下の媒体にて、テキストマイニングの結果データを利用する予定です。
・貴社名・媒体名;
・媒体URL;
・掲載予定日・放送予定日時;
・ご担当者氏名;
-----------------------

 掲載時のクレジット表記は以下のようにお願いします。

【クレジット表記例】
※ユーザーローカル テキストマイニングツール( http://textmining.userlocal.jp/ )で分析
または、
※UserLocalテキストマイニングで分析

などの形式でお願いいたします。


テキストマイニング結果を、論文や学会発表、レポートに掲載していいですか?

 はい。テキストマイニング結果は、許諾なく論文などで無料で使用いただけます。これまでも多くの学生・研究者の方にご利用いただいております。
 ご利用時は、論文中、脚注や参考文献等に、弊社ツール名とURLを記載してください。

【記述例】
※ユーザーローカル テキストマイニングツール( http://textmining.userlocal.jp/ )による分析

 論文をWebで公開なさる場合、そのURLを弊社窓口にご一報いただけますと幸いです。今後のツール機能強化の参考とさせていただきます。


企業でテキストマイニングツールを利用したいのですが大丈夫ですか?

 はい。ご利用いただけます。Twitterなどのクチコミデータを分析できるSocial Insightも提供しております。


入力したデータの内容が勝手に公開されることはありますか?

 テキストマイニングツールでご入力いただいた情報は、お試しになったご本人様が結果URLを外部に公開しないかぎり勝手に公開されることはございません。ご安心いただければと思います。



■データに関する質問

「共起」ってどんな意味ですか?

 共起とは、一文(改行や「。」などで区切られた各文)の中に、単語のセットが同時に出現するという意味です。共起回数は、一緒に出現した回数を指します。たとえば、

「あのメーカーが作った自転車は、とても速いらしい」
「速いスピードで自転車が駆け抜けていった」

という2文をテキストマイニングした場合、「自転車(名詞)」と「速い(形容詞)」という単語がセットで出現する(=共起している)回数は、それぞれ2回です。

・結果サンプルURL
https://textmining.userlocal.jp/home/result/30b2c8f7cedf6c4972f85c2acbb7c3c2

 一緒に出てくる単語を線で結んだものを「共起ネットワーク」と呼んでいます。


「スコア」について詳しく教えてください。

 スコアは、その単語の「重要度」を表す値です。以下で、スコアがなぜ必要なのかと、その算出方法についてご紹介します。

 一般的な文書では、単語の出現回数だけでいえば「今日」や「思う」「ある」などといった、”ごく一般的な単語”が何度も出現してしまいます。ただ、このような単語は、どういった文書にも出現する単語であるため、たとえ出現回数が多いとしても、意味が薄い、あまり重要ではない単語といえます。単純に回数だけをランキング化しても、一般的な語が混じってしまいその文章の特徴をつかむことができません。

 この問題を解決するため、テキストマイニングでは、「一般的な文書でよく出る単語は、重要ではないため、重み付けを軽くする」、いっぽう「一般的な文書ではあまり出現しないけれど、調査対象の文書だけによく出現する単語は重視する」仕組みを取り入れています。

 こういった特徴語を抽出するためのロジックとして、一般的にTF-IDF法という統計処理をします。

・参考URL
https://ja.wikipedia.org/wiki/Tf-idf

 この手法によって、出現回数だけでなく、重要度を加味した値が「スコア」です。スコアが高い単語は、そのテキストを特徴づける単語であるといえます。