Добро пожаловать в проект парсера на Python для сайта Zona — популярного ресурса для просмотра фильмов.
Этот инструмент позволяет:
✅ Получать подробную информацию о фильмах (рейтинг, описание, жанр, актёры и т.д.)
✅ Сохранять данные в базу MySQL
✅ Скачивать фильмы напрямую 🚀
1️⃣ Основной модуль main.py
📌 Запускайте именно этот файл.
- Используются библиотеки
requestsиBeautifulSoup (bs4). - Парсер получает HTML-страницы фильмов (
⚠️ это не видео, а страницы фильмов). - Извлекаются ссылки на страницы, которые будут обработаны дальше.
2️⃣ Модуль selenium_pars
- Подключается Selenium.
- Здесь происходит переход на страницу фильма и извлечение реальной ссылки на видео.
⚠️ В модуле укажите свой путь кchromedriver, чтобы Selenium работал корректно. service = Service(r"your_path_chromedriver")
3️⃣ Модуль download
- Получив ссылку на видео, управление переходит в этот модуль.
- Скачивание выполняется через aria2 ⚡
⚠️ В коде указан мой путь кaria2, у вас путь будет другой — обязательно замените на свой(aria2c_path = r"you_path_aria").
- При желании можно заменить aria2 на
requests, но скорость будет ниже.
- 📊 Базу фильмов с рейтингами, жанрами, описанием и метаданными.
- 🎥 Возможность скачать фильмы напрямую.
- 🚀 Ускоренное скачивание с помощью aria2.
- Python 3.8+
- Установленные библиотеки:
pip install requests beautifulsoup4 selenium mysql-connector-python