Проверка лемм на страницах
Принимает Excel-результат инструмента «Массовое недопокрытие лемм по ЯВМ», парсит содержимое каждой страницы и проверяет, присутствует ли лемма на ней. Результат: XLSX с дополнительным столбцом «На странице» (Да/Нет).
Как работает инструмент
- Читает Excel с леммами и URL (результат «Массового недопокрытия лемм»).
- Извлекает уникальные URL и асинхронно загружает содержимое каждой страницы.
- Лемматизирует текст страницы (spacy) и проверяет наличие каждой леммы.
- Добавляет столбец «На странице»: Да / Нет / N/A (не удалось загрузить).
