Извлечение данных¶
Методы для извлечения информации со страницы.
get_page_source()¶
Возвращает полный HTML-код страницы в виде строки.
html = driver.get_page_source()
# Сохранить в файл
with open("page.html", "w", encoding="utf-8") as f:
f.write(html)
# Разобрать с помощью BeautifulSoup
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
BeautifulSoup не обязателен
cdriv не зависит от BeautifulSoup. Установите отдельно при необходимости:
pip install beautifulsoup4
get_title()¶
Возвращает заголовок страницы (содержимое тега <title>).