lucene — все вопросы

4ответа
10 голосов
Как я могу избежать группы специальных символов в Java одним методом?
Я использую lucene search, но в lucene есть куча специальных символов, которые можно экранировать, например: - && || ! ( ) { } [ ] ^ " ~ * ? : \ У меня проблемы с экранированием этих си
3ответа
10 голосов
Запросник Lucene с «/» в критериях запроса
Когда я пытаюсь найти что-то типа "обходной путь /исправление" в Lucene, он выдает эту ошибку: org.apache.lucene.queryparser.classic.ParseException: Cannot parse 'workaround/fix': Lexical error at
2ответа
10 голосов
Как использовать TermVector Lucene 4.0
В методе индексации я использую следующую строку: Field contentsField = new Field("contents", new FileReader(f), Field.TermVector.YES); Однако в Lucene 4.0 этот конструктор устарел, и вместо ne
2ответа
10 голосов
Запрос функции длины строки в Solr
Мне нужно найти все документы в моей коллекции, для которых длина определенного поля превышает определенный предел. Тип поля - строка. Есть ли запрос функции, который возвращает длину строкового поля
7ответов
10 голосов
WildcardQuery ошибка в Solr
Я использую solr для поиска документов, и при попытке поиска документов по этому запросу "id:*" я получаю этот анализатор запросов исключение говорит о том, что он не может проанализировать запрос с
3ответа
10 голосов
Как мне индексировать и искать текстовые файлы в Lucene 3.0.2?
Я новичок в Lucene, и у меня возникли проблемы с созданием простого кода для запроса коллекции текстовых файлов . Я попытался этот пример , но несовместим с новой версией Lucene. UDPATE:
2ответа
11 голосов
Solr исключение на stats.field?
   Можно пометить определенные фильтры и исключить эти фильтры при огранке. Обычно это необходимо при многократном выделении фасетов. Возможно ли нечто подобное для stats.field? stats.field={!
3ответа
11 голосов
Какой самый простой способ реализации майнинга терминов ассоциации в Solr?
Майнинг ассоциаций дает хорошие результаты для получения связанных терминов в текстовом корпусе. Есть несколько работ на эту тему, включая известный метод LSA . Самый простой способ найти ассоц
1ответ
11 голосов
NullPointerException в методе readByte SegmentIndexInput от Lucene-Appengine
Я получаю следующую трассировку ошибок при запуске Lucene. Я включаю сегмент кода, который вызвал ошибку. Конкретный проект /коннектор - Lucene для Appengine CODE public static void resetAl
2ответа
11 голосов
Соландра против Elasticsearch
Мы работаем с базой данных Cassandra, которая будет хранить данные в диапазоне петабайт. Мы подумываем об использовании ElasticSearch или Solandra, но мы весело проводим время, решая, какой из них и
2ответа
11 голосов
Как Lucene (Solr /ElasticSearch) так быстро учитывает отфильтрованные термины?
С точки зрения структуры данных, как Lucene (Solr /ElasticSearch) так быстро учитывает отфильтрованные термины? Например, учитывая все документы, содержащие слово «бекон», найдите количество всех сл
7ответов
11 голосов
Sitecore Lucene: индекс сервера доставки контента не обновляется при публикации
Я создал пользовательскую страницу поиска, используя sitecore_web_index, и все работало, пока я не перешел в свою тестовую среду с отдельным содержимым серверы управления и доставки контента. Индекс
4ответа
11 голосов
Как хранить данные дерева в индексе Lucene /Solr /Elasticsearch или в базе данных NoSQL?
Скажем, вместо документов у меня есть небольшие деревья, которые мне нужно хранить в индексе Lucene. Как мне это сделать? Пример узла в дереве: class Node { String data; String type;
1ответ
12 голосов
Где я могу найти тесты производительности для Apache Lucene /Solr
Есть ли какие-либо ссылки /ресурсы для оценки производительности для Lucene /Solr для больших наборов данных. Наборы данных выше диапазона 500 ГБ ~ 5 ТБ Спасибо
4ответа
12 голосов
SOLR и разбор естественного языка - могу ли я его использовать?
Требования Алгоритм частоты слов для обработки естественного языка Использование Solr Хотя ответ на этот вопрос отличный, мне было интересно, смогу ли я использовать все время, потраченно
1ответ
13 голосов
Что делает хороший запрос на автоматическое согревание в Solr и как они работают?
Этот вопрос является продолжением этот вопрос о нечастых, изолированных тайм-аутах чтения в установке solr. В качестве возможной проблемы были обнаружены пропущенные /неверные запросы автопогре
4ответа
13 голосов
Кассандра или SOLR? Что дает лучшую производительность для запросов чтения frond end?
Моя команда попросила меня выбрать между Cassandra и SOLR для более быстрого ответа на конечные запросы. Я сказал им, что Cassandra - это NOSQL db, в то время как SOLR индексирует. Но затем они гово
1ответ
13 голосов
В чем разница между запросом фразы и использованием фильтра с галькой?
В настоящее время я индексирую веб-страницу, используя lucene. Цель состоит в том, чтобы иметь возможность быстро извлечь, какая страница содержит определенное выражение (обычно 1, 2 или 3 слова) и
5ответов
13 голосов
Как заставить Lucene соответствовать всем словам в запросе?
Я использую Lucene, чтобы позволить пользователю искать слова в большом количестве документов. По умолчанию Lucene возвращает все документы, содержащие любое из введенных слов. Можно ли изменить
3ответа
13 голосов
Как искать в поле int в Lucene 4?
Я пытаюсь реализовать индекс документов (примерно соответствующий строкам БД), где одно из полей является целым числом. Я добавляю их в индекс как: Document doc = new Document(); doc.add(new Strin
1 2 3

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132