Настройка парсера по расписанию (cron) для 1С-Битрикс

Наша компания занимается разработкой, поддержкой и обслуживанием решений на Битрикс и Битрикс24 любой сложности. От простых одностраничных сайтов до сложных интернет магазинов, CRM систем с интеграцией 1С и телефонии. Опыт разработчиков подтвержден сертификатами от вендора.
Предлагаемые услуги
Показано 1 из 1 услугВсе 1626 услуг
Настройка парсера по расписанию (cron) для 1С-Битрикс
Простая
~1 рабочий день
Часто задаваемые вопросы
Наши компетенции:
Этапы разработки
Последние работы
  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1175
  • image_bitrix-bitrix-24-1c_fixper_448_0.png
    Разработка веб-сайта для компании ФИКСПЕР
    811
  • image_bitrix-bitrix-24-1c_development_of_an_online_appointment_booking_widget_for_a_medical_center_594_0.webp
    Разработка на базе Битрикс, Битрикс24, 1С для компании Development of an Online Appointment Booking Widget for a Medical Center
    564
  • image_bitrix-bitrix-24-1c_mirsanbel_458_0.webp
    Разработка на базе 1С Предприятие для компании МИРСАНБЕЛ
    747
  • image_crm_dolbimby_434_0.webp
    Разработка сайта на CRM Битрикс24 для компании DOLBIMBY
    655
  • image_crm_technotorgcomplex_453_0.webp
    Разработка на базе Битрикс24 для компании ТЕХНОТОРГКОМПЛЕКС
    976

Настройка парсера по расписанию (cron) для 1С-Битрикс

Разовый парсинг — это разовое решение. Реальная польза начинается, когда парсер запускается автоматически по расписанию: обновляет цены, остатки, описания без участия человека. В Битриксе это можно организовать через встроенные агенты, через системный cron или через очереди — у каждого подхода свои ограничения.

Агенты Битрикса vs системный cron

Агенты (b_agent) — встроенный механизм. Работают при веб-запросах к сайту: агент выполняется, когда кто-то открывает страницу и срабатывает проверка CAgent::CheckAgents(). Проблема: при малом трафике агенты не запускаются вовремя. Надёжность агентов повышается включением режима «Точный запуск агентов» через cron — тогда агенты запускаются системным заданием, а не браузером посетителя.

Системный cron — надёжнее для парсеров. Прямой вызов PHP-CLI без зависимости от трафика:

*/30 * * * * /usr/bin/php -f /var/www/site/local/scripts/parser_run.php >> /var/log/parser.log 2>&1

Для тяжёлых парсеров (10 000+ позиций) системный cron предпочтителен — нет ограничений PHP-FPM по времени выполнения.

Защита от параллельного запуска

Парсер работает 25 минут, cron запускает следующий через 30 — два экземпляра не пересекутся. Но если вдруг парсер завис и работает 35 минут? Защита:

$lockFile = '/tmp/parser_' . md5($parserName) . '.lock';
if (file_exists($lockFile) && (time() - filemtime($lockFile)) < 3600) {
    exit('Already running');
}
touch($lockFile);
// ... работа парсера ...
unlink($lockFile);

Для распределённых систем (несколько серверов) — блокировка через Redis: SET lock:parser NX EX 3600.

Настройка агентов Битрикса для парсинга

Если всё же используем агенты — регистрируем через CAgent::AddAgent():

CAgent::AddAgent(
    'MyParserAgent::Run();',  // функция-агент
    'mymodule',               // модуль
    'N',                      // не точный
    3600,                     // интервал в секундах
    '',                       // дата первого запуска
    'Y',                      // активный
    date('d.m.Y H:i:s', time() + 3600)  // следующий запуск
);

Агент должен быть зарегистрирован в include.php модуля или в init.php.

Логирование и мониторинг

Парсер без логов — чёрный ящик. Минимальная схема логирования:

file_put_contents($logFile, date('[Y-m-d H:i:s] ') . $message . PHP_EOL, FILE_APPEND);

Для продакшена — структурированные логи с уровнями (info/warning/error) и ротацией через logrotate. Алерт при ошибке: если в логе за последний запуск есть строки с ERROR — отправляем email через \Bitrix\Main\Mail\Event.

Таймлайн работ

Этап Срок
Настройка системного cron или агента Битрикса 1–2 часа
Реализация блокировки параллельных запусков 1–2 часа
Настройка логирования и алертов 2–4 часа
Тестирование расписания 2–4 часа

Итого: 6–12 часов — задача несложная, но критичная для надёжности всей системы парсинга.