Проверка лемм на страницах
Принимает Excel-результат инструмента «Массовое недопокрытие лемм по ЯВМ», парсит содержимое каждой страницы и проверяет, присутствует ли лемма на ней. Результат: XLSX с дополнительным столбцом «На странице» (Да/Нет).
Какую задачу решает инструмент
Проверяет, присутствуют ли леммы из семантического ядра непосредственно на страницах сайта. Берёт результат инструмента «Массовое недопокрытие лемм по ЯВМ» и для каждой пары «лемма + URL» парсит страницу, лемматизирует её текст и фиксирует наличие или отсутствие слова.
Как пользоваться
1. Подготовьте данные
Используйте результат инструмента «Массовое недопокрытие лемм по ЯВМ» — Excel-файл с обязательными столбцами «Лемма» и «URL».
2. Загрузите и обработайте
Загрузите файл и нажмите «Запустить». Инструмент скачает содержимое каждой уникальной страницы, лемматизирует текст через spacy и проверит наличие каждой леммы.
3. Результат
XLSX-файл с исходными данными и дополнительным столбцом «На странице»: Да (лемма найдена), Нет (не найдена) или N/A (страница не загрузилась).
