Как рассчитать TF-IDF запроса?

Как рассчитать ---- +: = 0 =: + ---- для запроса?Я понимаю, как рассчитать tf-idf для набора документов со следующими определениями:tf = вхождения в документе /всего слов в документеidf = log (#documents /#documents, где встречается терминНо я не понимаю, как это соотносится с запросами.Например , я прочитал ресурс, в котором указаны значения запроса « ---- +: = 1 =: + ---- »жизнь |tf = .5 |idf = 1.405507153 |tf_idf = 0,702753576обучение |tf = .5 |idf = 1.405507153 |tf_idf = 0.702753576Значения ---- +: = 2 =: + ---- Я понимаю, каждый термин появляется только один раз из двух возможных, то есть 1/2, но я понятия не имею, где ---- +:= 3 =: + ---- происходит от.Я бы подумал, что #documents = 1 и instance = 1, log (1) = 0, поэтому ---- +: = 4 =: + ---- будет 0, но, похоже, это не так..На основе каких документов вы используете?Как вы вычисляете tf-idf для запроса?
7 голосов | спросил Codarus 9 Mayam16 2016, 03:13:03

0 ответов


Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132