Web Scraping в расширении Google Chrome (API JavaScript + Chrome)

Каковы наилучшие варианты выполнения веб-скрапинга для не открытой в настоящее время вкладки из расширения Google Chrome с помощью JavaScript и любых других доступных технологий. Другие JavaScript-библиотеки также принимаются.

Важно замаскировать очистку, чтобы она вел себя как обычный веб-запрос . Нет указаний на AJAX или XMLHttpRequest, например X-Requested-With: XMLHttpRequest или Origin

Извлеченное содержимое должно быть доступно из JavaScript для дальнейшей обработки и представления в расширении, скорее всего, в виде строки.

Есть ли какие-либо хуки в любом API, специфичном для WebKit /Chrome, которые можно использовать для создания обычного веб-запроса и получения результатов для манипулирования?

var pageContent = getPageContent(url); // TODO: Implement
var items = $(pageContent).find('.item');
// Display items with further selections

Бонусные баллы за выполнение этой работы из локального файла на диске для начальной отладки. Но если это единственное, что останавливает решение, не обращайте внимания на бонусные баллы.

65 голосов | спросил Seb Nilsson 28 J0000006Europe/Moscow 2011, 18:48:33

0 ответов


Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132