beautifulsoup — все вопросы

2ответа
4 голоса
не может правильно распечатать комбинированный стол из Beautifulsoup
Поскольку эта таблица URL объединена, невозможно распечатать таблицу, как ожидается, и форматирование вывода очень странное, спасибо! # -*- coding:UTF-8 -*- from pyvirtualdisplay import Display di
2ответа
4 голоса
Как извлечь цену за безопасность в виде текста с сайта через Python Selenium BeautifulSoup
Я пытаюсь просто узнать цену за безопасность, указанную по адресу https: //investor.vanguard.com/529-plan/profile/4514 . Я запускаю этот код: from selenium import webdriver from bs4 import Beauti
2ответа
4 голоса
selfClosingTags в BeautifulSoup
Использование BeautifulSoup для анализа моего XML import BeautifulSoup soup = BeautifulSoup.BeautifulStoneSoup( """<alan x="y" /><anne>hello</anne>""" ) # selfClosingTags=['alan
3ответа
4 голоса
Помогите интерпретировать фрагмент кода
Я очень новичок в Python и BeautifulSoup. В выражении for, что такое incident Может кто-нибудь объяснить мне этот код? for incident in soup('td', width="90%"): where, linebreak, what = in
2ответа
4 голоса
Красивая навигация по div по атрибуту без findAll
Как мне найти определенный div, вызвав атрибуты супа? то есть что-то вроде soup.html.body.div однако я не вижу, как получить конкретный div с помощью id='idname' здесь? Я могу сделать soup.findAl
1ответ
4 голоса
BeautifulSoup: Как удалить пустые таблицы, сохранив таблицы, которые частично пусты или не пусты
У меня есть старый веб-сайт, первоначально созданный в MS Frontpage, который я пытаюсь дефронтировать. Я написал скрипт BeautifulSoup, который делает большую часть этого. Осталось только удалить пус
4ответа
4 голоса
Как использовать Beautiful Soup, чтобы найти тег с изменяющимся идентификатором?
Я использую Beautiful Soup в Python. Вот пример URL: http: //www.locationary. ком /место /RU /US /Ohio /Миддлтон /McDonald% 27s-p1013254580.jsp В HTML есть несколько тегов, и я могу указа
1ответ
4 голоса
Может ли разделы CDATA быть сохранены BeautifulSoup?
Я использую BeautifulSoup для чтения, изменения и записи файла XML. У меня проблемы с удалением разделов CDATA. Вот упрощенный пример. XML-файл виновника: <?xml version="1.0" ?> <foo&g
1ответ
4 голоса
Что означает «объект модуля не может быть вызван»?
Я использую метод .get_data () с mechanize, который, по-видимому, выводит нужный мне HTML-код. Я также проверяю тип того, что он печатает, и тип 'str'. Но когда я пытаюсь проанализировать str с B
2ответа
4 голоса
Позволяет ли Beautiful Soup исключать HTML-код с помощью div (или других фильтров)?
Позволяет ли Beautiful Soup исключать HTML-код с помощью div (или других фильтров)? Я пытаюсь проанализировать код, который написан очень плохо, и в нем нет подходящего тега, идентификатора, клас
1ответ
4 голоса
Python - сохранять запросы или объект BeautifulSoup локально
У меня есть довольно длинный код, поэтому его запуск занимает много времени. Я хочу просто сохранить объект запросов (в данном случае «имя») или объект BeautifulSoup (в данном случае «суп») локально
1ответ
4 голоса
Как автоматически получать содержимое фреймов, если браузер не поддерживает фреймы + не может напрямую получить фрейм
Я пытаюсь автоматически загружать PDF-файлы с таких URL-адресов, как это , чтобы создать библиотеку резолюций ООН. Если я использую красивый суп или механизировал, чтобы открыть этот URL, я полу
1ответ
4 голоса
Прекрасный суп: элемент разбора «Span»
Я продолжаю врезаться в стены, но чувствую, что я здесь близко. HTML-блок собирается: <div class="your-price"> <span class="label">Your Price</span>
1ответ
4 голоса
Pandas Dataframe
Я хочу представить данные с помощью pandas dataframe, имя столбца - Название продукта и заполнить т. Например: Название продукта Marvel: коллекция фильмов Marvel Diney Movie и т. д.
2ответа
4 голоса
Разбор Beautifulsoup - работа с верхним индексом?
Это сегмент HTML, из которого я пытаюсь извлечь информацию: <td class="yfnc_tablehead1" width="74%">Market Cap (intraday)<font size="-1"><sup>5</sup></font>:</td&g
2ответа
4 голоса
Python - печать на одной линии
Я очень новичок и пытаюсь научиться чистить столы. У меня есть следующий код, но я не могу получить две переменные для печати на одной строке; они печатаются на отдельных строках. Чего мне не хватае
1ответ
4 голоса
BeautifulSoup выскабливает вложенные таблицы
Я пытался собрать данные с веб-сайта, который использует большое количество таблиц. Я изучал документацию по BeautifulSoup, а также здесь о стекаповороте, но все еще потерялся. Вот эта таблица:
1ответ
4 голоса
ВНИМАНИЕ: root: некоторые символы не могут быть декодированы и были заменены символом ЗАМЕНА С просьбами и Beastuifulsoup
У меня был этот код очистки веб-страниц несколько минут назад, но теперь я получаю это предупреждение и кодировку. Поскольку этот запрос не возвращает html, Beautifulsoup возвращает тип None при пои
2ответа
4 голоса
Получить содержимое таблицы в BeautifulSoup
У меня есть следующая таблица на веб-сайте, которую я извлекаю с помощью BeautifulSoup Это URL (я также прикрепил изображение В идеале я хотел бы, чтобы каждая компания находилась в одной строк
2ответа
4 голоса
Использование BeautifulSoup для извлечения заголовка ссылки
Я пытаюсь извлечь заголовок ссылки, используя BeautifulSoup. Код, с которым я работаю, выглядит следующим образом: url = "http://www.example.com" source_code = requests.get(url) plain_text = sourc
1 2 3 4 5

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132