学習済み日本語word2vecとその評価について – 株式会社ホクソエムのブログ

ホクソエムサポーターの白井です。 今回は日本語の word2vec に着目し、日本語の学習済み word2vec の評価方法について紹介します。 自然言語は非構造化データであるため、単語や文章を計算機で扱いやすい表現に変換する必要があります。 そのための方法の1つに word2vec があり、Bag of Words (BoW) や tf-idf とならんでよく用いられます。 一般に、word2vec は Mikolovが提案した手法 (CBOW, Skip-gram) をはじめ、 GloVe や fastText など、単語をベクトルで表現する単語分散表現のことを指します。 word2vec…
— 読み進める blog.hoxo-m.com/entry/2020/02/20/090000

RStudioのGUIからデータ読み込み

RStudioではメニューから選んで各種のデータフォーマットを読み込むことができます。csv、Excel、SPSSからの読み込みについてご紹介:
http://qiita.com/kazutan/items/70e9e4f683555ef74cd9

rstudio.ozekis.netのシステムライブラリのgooglesheetsパッケージを使うと(GUIじゃないけど)Googleドキュメントのスプレッドシートから直接データを読み込むこともできます。Googleドキュメントではフォームを作ってアンケートなどを取りスプレッドーシートに蓄積する流れが簡単に作れますので、そこから直接Rのデータセットに読み込めるのは便利かも:
https://cran.r-project.org/web/packages/googlesheets/README.html

その他にも、rstudio.ozekis.netのシステムライブラリにはMySQLデータベースからデータを取り込めるRMySQLパッケージもインストールしてありますので、Moodleなどのデータから直接取り込みたい方もお試しください。GUIじゃないけど。