ホクソエムサポーターの白井です。 今回は日本語の word2vec に着目し、日本語の学習済み word2vec の評価方法について紹介します。 自然言語は非構造化データであるため、単語や文章を計算機で扱いやすい表現に変換する必要があります。 そのための方法の1つに word2vec があり、Bag of Words (BoW) や tf-idf とならんでよく用いられます。 一般に、word2vec は Mikolovが提案した手法 (CBOW, Skip-gram) をはじめ、 GloVe や fastText など、単語をベクトルで表現する単語分散表現のことを指します。 word2vec…
— 読み進める blog.hoxo-m.com/entry/2020/02/20/090000
カテゴリー: Tips
Rを使うヒントその他
R_stan_intro.ipynb – Colaboratory
R_stan_intro.ipynb – Colaboratory
— 読み進める colab.research.google.com/drive/19CLGcyT95hndh26hxqQuh35LcPFjfC1U
細かすぎて伝わってなさそうなRStudioの便利ボタン
RStudioのGUIからデータ読み込み
RStudioではメニューから選んで各種のデータフォーマットを読み込むことができます。csv、Excel、SPSSからの読み込みについてご紹介:
http://qiita.com/kazutan/items/70e9e4f683555ef74cd9
rstudio.ozekis.netのシステムライブラリのgooglesheetsパッケージを使うと(GUIじゃないけど)Googleドキュメントのスプレッドシートから直接データを読み込むこともできます。Googleドキュメントではフォームを作ってアンケートなどを取りスプレッドーシートに蓄積する流れが簡単に作れますので、そこから直接Rのデータセットに読み込めるのは便利かも:
https://cran.r-project.org/web/packages/googlesheets/README.html
その他にも、rstudio.ozekis.netのシステムライブラリにはMySQLデータベースからデータを取り込めるRMySQLパッケージもインストールしてありますので、Moodleなどのデータから直接取り込みたい方もお試しください。GUIじゃないけど。