Массовый парсинг текстов с URL BETA
БЕТА-ВЕРСИЯ: инструмент находится в стадии тестирования. Возможны ошибки. Используйте с осторожностью.
Загрузите XLSX с столбцами «Запрос» и «URL» — на выходе ZIP с:
- /full/ — полные тексты страниц
- /selected/ — сокращённая версия по ключевым тегам
- result.xlsx — таблица соответствий и статистика
Какую задачу решает инструмент
Массово скачивает HTML-страницы по списку URL из Excel-файла и извлекает из них текстовый контент. Группирует результаты по запросам — один TXT-файл на каждый запрос со всеми связанными страницами.
Как пользоваться
1. Подготовьте данные
Подготовьте XLSX-файл с двумя столбцами: запросы и URL. Файл без заголовков — первая строка сразу данные. Укажите буквы столбцов (A, B, C...).
2. Загрузите и обработайте
Загрузите файл, выберите столбцы с запросами и URL, нажмите «Запустить». Обработка занимает 5-15 минут в зависимости от объёма.
3. Результат
ZIP-архив с папками /full/ (полные тексты), /selected/ (сокращённые по ключевым тегам) и result.xlsx со статистикой по каждому запросу. Кодировка UTF-8.
