from selenium import webdriver
from bs4 import BeautifulSoup
def get_source_html(url, driver_path):
options = webdriver.ChromeOptions()
service = webdriver.chrome.service.Service(driver_path)
driver = webdriver.Chrome(service=service, options=options)
driver.maximize_window()
try:
driver.get(url=url)
print("Страница успешно загружена")
# with open('g://page.html', 'w', encoding='utf-8') as f:
# f.write(driver.page_source)
# Парсинг HTML страницы с помощью BeautifulSoup
soup = BeautifulSoup(driver.page_source, 'html.parser')
# Далее можно использовать объект soup для извлечения нужных данных из HTML страницы
headings = soup.find_all('h3')
for heading in headings:
print(heading.text)
except Exception as _ex:
print(_ex)
finally:
print("Нажмите Enter, чтобы закрыть браузер...")
input()
driver.close()
print("Браузер закрыт")
def main():
driver_path = 'C:\chromedriver_win32\chromedriver.exe'
get_source_html('https://lenta.ru/parts/news/', driver_path)
if __name__ == '__main__':
main()
Файлы
109.0.5414.120_chrome_installer_2.7z
chromedriver.7z