Парсинг Динамических Сайтов в Python | Парсер OZON
Эксклюзивный ролик с разбором парсера WildBerries -
Сейчас ты узнаешь: Как парсить динамические сайты при помощи Python на примере парсинга маркетплейса OZON. Научимся пользоваться веб-драйвером совместно с Selenium. Рассмотрим как обходить защиту от ботов, используя модуль selenium_stealth. Изучим модуль BeautifulSoup для анализа HTML-кода, Узнаем, как отправлять HTTP GET запросы через модуль curl_cffi, используя инструмент CURL.
В конце видео у нас будет готовый парсер маркетплейса Озон. У нас будет функционал парсинга главной страницы, на которой контент генерируется случайно, а так же функционал парсинга товаров через поиск.
Привет! Меня зовут Игорь. На моём канале ты сможешь найти уроки по нейронным сетям, языку программирования Python и программированию в целом.
Моя цель - сделать программирование более доступным и понятным. Для просмотра моих видео вам не нужно высшее образование по Computer science. Все непонятные темы и термины я стараюсь разъяснять и показывать на примерах.
Оставайся с нами, и чтобы не пропустить ни одного видео - подписывайся на канал и нажимай на колокольчик!
Тайм-коды:
00:00 - Отличие парсинга статических и динамических сайтов
02:03 - Парсинг динамических сайтов при помощи HTTP запросов
02:48 - Особенности HTTP GET запросов
03:25 - Особенности HTTP POST запросов
04:26 - Парсинг динамических сайтов при помощи WebDriver
05:55 - Установка Chrome WebDriver
06:28 - Особенности парсинга маркетплейса Озон
06:48 - Обход защиты от скрапинга при помощи selenium_stealth
07:41 - Автоматическая прокрутка страницы
08:24 - Анализ HTML сайта Озон
09:50 - Поиск карточек товаров на главной странице
13:26 - Сохранение подробной информации о товарах
15:58 - Парсинг поисковой страницы Озон
18:12 - Что со всем этим делать?
► Ссылки из видео:
Видео с парсингом сайта Хабр -
Видео про использование JSON в Python -
POSTMAN приложение для анализа HTTP запросов -
Сайт для загрузки Веб-драйвера Chrome -
GitHub репозиторий проекта -
✈️ Telegram канал –
✅ Группа VK с Псевдо Мемами -
💲💲 Поддержи проект на Boosty -
11 views
7
1
2 months ago 00:08:59 1
Linux для начинающих | Терминал Linux | Основные команды
4 months ago 00:27:01 4
Парсинг на Python, Selenium и BS4 | Выполняем заказ на фрилансе | Парсинг динамического сайта
4 months ago 00:17:10 1
Обучение парсингу на Python #12 | Выполняем заказ на фрилансе | Парсинг динамического сайта
4 months ago 00:14:20 1
Обучение парсингу на Python #6 | Как собрать информацию с любого сайта | Requests BS4 Selenium
4 months ago 00:21:51 1
Обучение парсингу на Python #3 | Парсинг динамического сайта | Выполняем заказ на фрилансе
4 months ago 00:10:14 6
Пентест для новичков | CTF | TryHackMe - Pickle Rick
4 months ago 00:13:29 2
Обучение Python | Управление мышкой и клавиатурой | Парсинг