lucene — все вопросы

1ответ
14 голосов
Как машинное обучение включено в дизайн поисковой системы?
В настоящее время я строю небольшую внутреннюю поисковую систему на базе Apache Lucene. Его цель проста - основанная на некоторых ключевых словах, она предложит некоторые статьи, написанные внутри н
1ответ
10 голосов
Elasticsearch использует слишком много дискового пространства
У меня есть сервер CentOS 6.5 , на котором я установил Elasticsearch 1.3.2 . Конфигурационный файл My elasticsearch.yml - это минимальная модификация одной доставки с elasticsearch по умолчанию
3ответа
3 голоса
NLP - запросы с использованием семантических подстановочных знаков в полнотекстовом поиске, может быть, с Lucene?
Предположим, у меня большой корпус (например, на английском или произвольном языке), и я хочу выполнить некоторый семантический поиск на нем. Например, у меня есть запрос: «Будьте осторожны: [art
1ответ
1 голос
Является ли lucene.net/solrnet хорошим решением для поиска списка имен с нечетким сопоставлением? [закрыто]
В настоящий момент мы используем полнотекстовый поиск в sql-сервере, но он слишком негибкий. Главное, что мы делаем, - это поиск имен людей из базы данных на основе поискового запроса. Поиски дол
6ответов
142 голоса
Разница между сольром и люценом
Я знаю, что Lucene и Solr - это две разные проекты Apache , которые созданы для совместной работы, но я не не понимаю, какова цель каждого проекта. До сих пор я понял, что Lucene используется дл
6ответов
45 голосов
Как оценить размещенные решения для полнотекстового поиска?
Какие есть варианты, когда речь идет о SaaS /размещенном полнотекстовом поиске? Как мне оценить различные доступные варианты? Я ищу что-то, что использует Lucene, solr или sphinx в бэкэнде и пред
3ответа
44 голоса
Нет необходимости в использовании балансировщика нагрузки с ElasticSearch?
У меня есть кластер из 3 узлов ElasticSearch, работающих на AWS EC2. Эти узлы настраиваются с помощью OpsWorks /Chef. Мое намерение состоит в том, чтобы сделать этот кластер очень упругим и эластичн
8ответов
38 голосов
Есть ли чистый Python Lucene?
У ребят из ruby ​​есть Ferret . Кто-нибудь знает о какой-либо подобной инициативе для Python? В настоящее время мы используем PyLucene, но я хотел бы изучить переход на чистый поиск Python.
2ответа
35 голосов
Solr /Solrj: Как я могу определить общее количество документов в индексе?
Как определить общее количество документов в индексе Solr с помощью Solrj? После нескольких часов самостоятельных поисков у меня действительно есть ответ (приведенный ниже); Я только публикую это
4ответа
34 голоса
Поисковая система Lucene vs База данных поиска
Я использую базу данных MySQL и использую поиск по базе данных. Какие-либо преимущества и недостатки систем баз данных и поисковой системы Lucene? Я хотел бы получить предложения о том, когда и где и
3ответа
33 голоса
Что такое сегменты в Lucene?
Что такое сегменты в Lucene ? Каковы преимущества сегментов?
2ответа
23 голоса
TFIDF для большого набора данных
У меня есть корпус, который содержит около 8 миллионов новостных статей, мне нужно получить представление TFIDF в виде разреженной матрицы. Я смог сделать это, используя scikit-learn для сравнительн
3ответа
21 голос
Ускоренный поиск в Lucene - есть ли способ сохранить весь индекс в оперативной памяти?
Есть ли способ сохранить индекс в оперативной памяти вместо того, чтобы хранить его на жестком диске? Мы хотим сделать поиск быстрее.
6ответов
20 голосов
Как создать новое ядро ​​в Solr 5?
В настоящее время мы используем распределение Apache Solr 4.10.3 ИЛИ H eliosearch D для S olr [HDS] как поисковая система для индексации наших данных. Теперь, после этого, я получил нов
3ответа
19 голосов
Solr - LockObtainFailedException для нескольких одновременных записей
Мое приложение очень часто пишет по нескольким клиентам через REST. Я использую функцию автоматической фиксации с помощью атрибута commitWithin. LockObtainFailedException начинают появляться после н
0ответов
18 голосов
Обновить определенное поле в индексе SOLR
Я хочу использовать solr для поиска по статьям У меня есть 3 таблицы: Группа (идентификатор, имя группы) ArticleBase (id, groupId, другое поле) Article (id, articleBaseId, title, date, ..
1ответ
18 голосов
Что такое omitNorms и поле версии в схеме Solr?
Я не понимаю, когда использовать omitNorms = "true". Я прочитал 2-3 ссылки, но до сих пор мне не ясно, с их смыслом. что означает "Установите в значение true, чтобы опустить нормы, связанные с этим п
6ответов
18 голосов
Поиск по ключевым словам (ИЛИ, И) в Lucene
Я использую Lucene на своем портале (на основе J2EE) для служб индексирования и поиска. Проблема в ключевых словах Lucene. При использовании одного из них в поисковом запросе вы получите ошибку.
4ответа
18 голосов
Безопасность (ака Permissions) и Lucene - Как? Это должно быть сделано?
Сначала немного предыстории моего вопроса. Отдельные объекты могут иметь разрешения на чтение. Если пользователь не проходит проверку прав на чтение , он не может увидеть этот экземпляр. П
0ответов
18 голосов
Создайте гистограмму Kibana с использованием сегментов, динамически создаваемых агрегацией терминов ElasticSearch
Я хочу иметь возможность сочетать функциональность Kibana Термин График (иметь возможность создавать сегменты на основе уникальности значений из определенного атрибута) и График гистограммы (р
1 2 3 4 5

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132