N自然言語処理を学習されている方、必見です。
`(日本語において)品質の高い、つまり、字面ではなく文脈を踏まえた文の意味が近いほど近いベクトルになるという性質を持ったベクトルを作る話です。
趣味や実務で意味が近い文を探すなどの目的で、文ベクトルを作るということをしている人は一定数いると思います。
しかし、単語ベクトルの平均でも悪くはないけれども、いまいちな場面が出てきて、気がつくとヒューリスティクスという名の迷路に迷い込んだりしていないでしょうか(特定の単語や品詞をストップワードにしてみたり、謎の重み付けを加えてみたり。え、根拠は?と)。
他にも、単語ベクトルの平均では多義語が扱えずに困ったり、文脈が考慮されないため「そこじゃない」という単語に着目した類似文検索になったり。
一方、Universal Sentence Encoderのような既存の深層ニューラルネットワークを用いた文ベクトルモデルの学習は計算コストが高すぎて、自分で学習させるのは辛かったりも。
こういう悩みを抱えている同志向けに、論文 Sentence-BERT: Sentence Embeddings using Siamese BERT-Networksで提案された手法を使い高品質な日本語文ベクトルモデルを作り、公開します。`
出典:Qiita 【日本語モデル付き】2020年に自然言語処理をする人にお勧めしたい文ベクトルモデル
以下の記事は、Qiita @sonoisaさんの紹介記事です。
Related posts:
【ニュース】逢いたいのに逢えない 今 だからECサイト『地場めし』で"リモート父の日"
【ニュース】世界70ヶ国以上・累計10万人が利用するチャット英会話アプリ「Eigooo!」がさらに学びやすくバージョンアップ
【ニュース】農機具シェアリングプラットフォーム「AGRICOM」を提供開始
【ニュース】「オンライン海外旅行」にビデオ通話機能が追加!依頼からサービス提供までのワンストップ化を実現
【コラム】テレワークでも生産性を落とさない営業プロセスの在り方とは?
【コラム】テレワークを実現しにくかった業種にも対応できる――、レノボがテレワーク環境構築の実績とノウハウをアピール
【コラム】テレワークの課題にみる「次なるビジネスチャンス」
【コラム】「キャリアパスと評価制度を刷新」Gunosyエンジニア組織が取り組む改革の裏側を聞いてみた
【コラム】コードを書かない系エンジニア(プリセールスエンジニア)の仕事と価値
【Column】24 Programming Languages That Pay Top Salaries: Scala and More
【Kotlin】MockKはKotlin独自の言語仕様をほぼ網羅しているモックライブラリ
【ニュース】営業自粛でキャンセルになった大量の洋服を救いたい!洋服好きによる、洋服好きのための、洋服を救う期間限定プロジェクト「SAVE THE CLOTHES PROJECT」。
【ニュース】日本初!医療・介護・福祉 複業家レンタルサービス 「じぶんはけん」
【ニュース】リラクゼーション業界のトレンドも店舗型から宅配型へ。リラクゼーションマッチングアプリ「HOGUGU(ホググ)」が東京進出に向けてビジネスを加速。
【ニュース】モイ、アバターで通話を楽しむ音声SNS「パルミン」をリリース
【ニュース】オンライン次代のウェディング新サービス 『Web結婚式』登場!
【ニュース】ホテルに住める定額プラン、利用会員募集スタート〜ANA提携路線も7月より大幅増便〜
【ニュース】プログラミングしないエンジニアが急増中! 日本初のNoCode専門サロン「NoCodeCamp」募集開始
【ニュース】日本で活躍する外国人エンジニア向けコミュニティ”CodeGate”発足のお知らせ
【ニュース】STEM教育に最適!直感的に組み立てるだけで200種類以上のアクションが楽しめるプログラミングロボット「Clicbot」
【特集記事】ITエンジニアに必要な基礎スキル6つ|おすすめの勉強法を紹介!
【ニュース】無料のプログラミング学習プラットフォーム「LINE entry」、ゲーム感覚でプログラミングを学べる「ミッション」をリリース
【Kotlin】Unit Testing Firebase with Kotlin
【Analytics】Native Analytics on Apache Cassandra with Knowi: Tutorial
【Column】99% of Successful Software Engineers Practice These 10 Habits and Skills
【Swift】7 Awesome Open Source SwiftUI Projects to Inspire You (Part 2)
【Swift】7 Awesome Open Source SwiftUI Projects To Inspire You
【機械学習】Machine Learning: Google Colab- Why, When and How to Use it
【Column】The Future of Code Is in Your Browser
【Firebase】Top 3 open-source Firebase alternatives for 2020