Автонаполнение блога из внешних источников 1С-Битрикс
Корпоративный блог требует регулярных публикаций — это и SEO-трафик, и демонстрация экспертизы. Но внутренние ресурсы для создания контента ограничены. Автонаполнение из внешних источников (отраслевые новости, статьи партнёров, публикации в профессиональных сообществах) позволяет поддерживать активность раздела с минимальным участием редактора.
Отличие от RSS-агрегации новостей
Блог — это не новостная лента. Ключевые отличия в подходе к контенту:
- Новости: актуальность важнее качества, публикуется быстро, часто анонс+ссылка
- Блог: качество важнее скорости, нужен уникальный угол зрения, длинные материалы
Для блога автоматический импорт — это черновик, а не финальный материал. Система создаёт записи со статусом ACTIVE = N, редактор просматривает и публикует вручную (или с минимальными правками).
Источники контента для блога
Профессиональные платформы (Habr, Medium, dev.to) — через RSS API. Habr предоставляет RSS по хабам: https://habr.com/ru/rss/hubs/php/articles/.
YouTube-каналы — через YouTube Data API v3. Берём транскрипт видео через youtube-transcript-api (Python) или сторонние сервисы → адаптируем в текст.
Telegram-каналы — через MTProto API (Telethon/Pyrogram) или публичные каналы через RSS-конвертеры (rsshub.app).
Собственная база статей в нескольких языках — если у компании есть блог на одном языке, автоматический перевод на другие языки через DeepL API или GPT.
Обработка и адаптация контента
Агрегированный материал нельзя публиковать as-is. Минимальный pipeline обработки:
- Очистка HTML — HTMLPurifier с разрешённым набором тегов (p, h2-h4, ul, ol, li, strong, em, a, img)
- Удаление брендинга источника — regex-замена упоминаний компании-источника
- Адаптация заголовка — переформулировка через AI или шаблонное добавление тематики сайта
- Добавление вступления — AI генерирует 1-2 вступительных абзаца в стиле блога сайта
- Добавление CTA — автоматически в конец материала добавляется блок со ссылкой на профильную услугу или товар
Рабочий процесс с редактором
Система работает как помощник редактора, а не его замена:
- Система создаёт черновик в инфоблоке блога (
ACTIVE = N,ACTIVE_FROM = дата+3дня) - Редактор получает уведомление о новых черновиках (daily digest через
\Bitrix\Main\Mail\Event) - Редактор просматривает, при необходимости правит, публикует
- Если черновик не просмотрен 7 дней — повторное уведомление
Дополнительно: AI-скоринг каждого черновика по параметрам (уникальность, читаемость, релевантность тематике сайта). Редактор видит оценку и может фильтровать по ней.
Технические компоненты в Битриксе
Блог реализован через стандартный инфоблок. Дополнительные свойства под автонаполнение:
-
SOURCE_URL— ссылка на оригинал -
SOURCE_NAME— название источника -
AUTO_DRAFT— флаг автоматически созданного черновика -
CONTENT_SCORE— оценка качества контента (0–100) -
PUBLICATION_DATE_PLANNED— дата запланированной публикации
Таймлайн работ
| Этап | Срок |
|---|---|
| Разработка коллекторов (RSS, YouTube, Telegram) | 3–5 дней |
| Pipeline обработки контента | 2–3 дня |
| Система черновиков и уведомлений для редактора | 1–2 дня |
| Административный интерфейс, AI-скоринг | 1–2 дня |
Итого: 7–12 рабочих дней в зависимости от набора источников.







