Добавление тега переполнения стека в систему Google Custom Search

Как настроить Google Custom Search для включения только страниц из тега переполнения стека?

Например, добавление http://stackoverflow.com/questions/tagged/guava не найдет страницы статьи. Нет общего URL шаблона для страниц, а теги не являются поддоменами.

7 голосов | спросил Thomas Jung 6 Mayam11 2011, 10:19:16

1 ответ


3

Это невозможно, как сказано в комментариях.
Google действительно плохо объясняет, что может сделать пользовательская поисковая система (CSE).

Взяв ваш пример https://stackoverflow.com/questions/tagged/guava

Первый вопрос (в текущий момент этого сообщения)

Вопрос о шаблонах Java Generics

Итак, давайте попробуем получить это из CSE.

Использование шаблона URL

www.stackoverflow.com/questions/tagged/guava?*, который согласно Страница справки :

  

Совпадает со всеми URL-адресами, начинающимися с www.example.com или example.com

Это должно заботиться о вопросах

Получается для пользовательского поиска для «Java» ... нет результатов

Попытка повторного дублирования с обычным старым поиском
site:stackoverflow.com/questions/tagged/guava -inurl:java Java inurl:page

Обратите внимание, что без inurl:page мы получаем один из результатов

Текстовый файл в Java С помощью Commons или Guava

Не результат, который мы хотели, но результат, тем не менее. Итак, пришло время уточнить CSE, потому что теперь это означает, что CSE не ищет первую страницу stackoverflow.com/questions/tagged/guava, а только те, которые находятся под разбивкой по страницам.

Итак, обновленные шаблоны URL

www.stackoverflow.com/questions/tagged/guava?* www.stackoverflow.com/questions/tagged/guava

, где вторая должна соответствовать только одной странице в соответствии с Страница справки . Имеет ли это ? Нет. Он соответствует шаблону URL www.stackoverflow.com/questions/tagged/guava*. Сначала я подумал, что, возможно, это неявно, но я перечитываю справочный центр:

  

Например, шаблон «www.foo.com/bar» будет соответствовать только одной странице «www.foo.com/bar». Чтобы охватить все страницы, на которых URL начинается с «www.foo.com/bar», , вы должны явно добавить '*' в конец

Итак, я не добавил шаблон шаблона и CSE пошел вперед и искал результаты , которые я не хотел

Сравнивая результаты

Google CSE

Поиск Google

Итак, по крайней мере, они возвращают те же результаты. Хотя мы до сих пор не получили первый результат Вопрос о шаблонах Java Generics . Известно, что количество результатов изменяется по любой причине в Google, попробуем уточнить поиск и предположим, что результат все равно можно найти с помощью «Java Generics».

Это делает результаты действительно разными, поскольку CSE дает 0 результатов и Google Search дает 21 результат. Поэтому, в конце концов, я действительно не думаю, что вы должны полагаться на поиск Google так, как вы хотите это сделать. Похоже, что он не ищет должным образом.

Другим способом, который я пробовал, является использование параметра link:

link:https://stackoverflow.com/questions/tagged/guava

, но вы не можете использовать другие параметры при использовании.

Третий способ - использовать StackOverflow Search

https://stackoverflow.com/search?q=%5Bguava%5D

(но это ограничение скорости, вы далеко не достигнете), и вы не можете связать его с CSE.

Вам может потребоваться поиск сайта с надлежащей атрибуцией (это находится внизу каждой страницы Stackoverflow) и организует вопросы в соответствии с тегами

Пример

http://wolfrevokcats.com/questions/java?generics&guava/java-generics-wildcards-question

Или что-то в этом роде, таким образом, это будет более дружественным Google к вашим потребностям.

ответил phwd 17 Mayam11 2011, 00:23:28

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132