Skip to content

Akmal-5/scraping_project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🎬 Инструкция моего парсера

Добро пожаловать в проект парсера на Python для сайта Zona — популярного ресурса для просмотра фильмов.

Этот инструмент позволяет:
✅ Получать подробную информацию о фильмах (рейтинг, описание, жанр, актёры и т.д.)
✅ Сохранять данные в базу MySQL
✅ Скачивать фильмы напрямую 🚀


⚙️ Как работает парсер

1️⃣ Основной модуль main.py

📌 Запускайте именно этот файл.

  • Используются библиотеки requests и BeautifulSoup (bs4).
  • Парсер получает HTML-страницы фильмов (⚠️ это не видео, а страницы фильмов).
  • Извлекаются ссылки на страницы, которые будут обработаны дальше.

2️⃣ Модуль selenium_pars

  • Подключается Selenium.
  • Здесь происходит переход на страницу фильма и извлечение реальной ссылки на видео.
  • ⚠️ В модуле укажите свой путь к chromedriver, чтобы Selenium работал корректно. service = Service(r"your_path_chromedriver")

3️⃣ Модуль download

  • Получив ссылку на видео, управление переходит в этот модуль.
  • Скачивание выполняется через aria2
    • ⚠️ В коде указан мой путь к aria2, у вас путь будет другой — обязательно замените на свой(aria2c_path = r"you_path_aria").
  • При желании можно заменить aria2 на requests, но скорость будет ниже.

🎁 Что вы получите

  • 📊 Базу фильмов с рейтингами, жанрами, описанием и метаданными.
  • 🎥 Возможность скачать фильмы напрямую.
  • 🚀 Ускоренное скачивание с помощью aria2.

📦 Требования

  • Python 3.8+
  • Установленные библиотеки:
pip install requests beautifulsoup4 selenium mysql-connector-python

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages