Автонаполнение блога из внешних источников 1С-Битрикс

Наша компания занимается разработкой, поддержкой и обслуживанием решений на Битрикс и Битрикс24 любой сложности. От простых одностраничных сайтов до сложных интернет магазинов, CRM систем с интеграцией 1С и телефонии. Опыт разработчиков подтвержден сертификатами от вендора.
Предлагаемые услуги
Показано 1 из 1 услугВсе 1626 услуг
Автонаполнение блога из внешних источников 1С-Битрикс
Средняя
~1-2 недели
Часто задаваемые вопросы
Наши компетенции:
Этапы разработки
Последние работы
  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1169
  • image_bitrix-bitrix-24-1c_fixper_448_0.png
    Разработка веб-сайта для компании ФИКСПЕР
    811
  • image_bitrix-bitrix-24-1c_development_of_an_online_appointment_booking_widget_for_a_medical_center_594_0.webp
    Разработка на базе Битрикс, Битрикс24, 1С для компании Development of an Online Appointment Booking Widget for a Medical Center
    564
  • image_bitrix-bitrix-24-1c_mirsanbel_458_0.webp
    Разработка на базе 1С Предприятие для компании МИРСАНБЕЛ
    743
  • image_crm_dolbimby_434_0.webp
    Разработка сайта на CRM Битрикс24 для компании DOLBIMBY
    655
  • image_crm_technotorgcomplex_453_0.webp
    Разработка на базе Битрикс24 для компании ТЕХНОТОРГКОМПЛЕКС
    976

Автонаполнение блога из внешних источников 1С-Битрикс

Корпоративный блог требует регулярных публикаций — это и SEO-трафик, и демонстрация экспертизы. Но внутренние ресурсы для создания контента ограничены. Автонаполнение из внешних источников (отраслевые новости, статьи партнёров, публикации в профессиональных сообществах) позволяет поддерживать активность раздела с минимальным участием редактора.

Отличие от RSS-агрегации новостей

Блог — это не новостная лента. Ключевые отличия в подходе к контенту:

  • Новости: актуальность важнее качества, публикуется быстро, часто анонс+ссылка
  • Блог: качество важнее скорости, нужен уникальный угол зрения, длинные материалы

Для блога автоматический импорт — это черновик, а не финальный материал. Система создаёт записи со статусом ACTIVE = N, редактор просматривает и публикует вручную (или с минимальными правками).

Источники контента для блога

Профессиональные платформы (Habr, Medium, dev.to) — через RSS API. Habr предоставляет RSS по хабам: https://habr.com/ru/rss/hubs/php/articles/.

YouTube-каналы — через YouTube Data API v3. Берём транскрипт видео через youtube-transcript-api (Python) или сторонние сервисы → адаптируем в текст.

Telegram-каналы — через MTProto API (Telethon/Pyrogram) или публичные каналы через RSS-конвертеры (rsshub.app).

Собственная база статей в нескольких языках — если у компании есть блог на одном языке, автоматический перевод на другие языки через DeepL API или GPT.

Обработка и адаптация контента

Агрегированный материал нельзя публиковать as-is. Минимальный pipeline обработки:

  1. Очистка HTML — HTMLPurifier с разрешённым набором тегов (p, h2-h4, ul, ol, li, strong, em, a, img)
  2. Удаление брендинга источника — regex-замена упоминаний компании-источника
  3. Адаптация заголовка — переформулировка через AI или шаблонное добавление тематики сайта
  4. Добавление вступления — AI генерирует 1-2 вступительных абзаца в стиле блога сайта
  5. Добавление CTA — автоматически в конец материала добавляется блок со ссылкой на профильную услугу или товар

Рабочий процесс с редактором

Система работает как помощник редактора, а не его замена:

  1. Система создаёт черновик в инфоблоке блога (ACTIVE = N, ACTIVE_FROM = дата+3дня)
  2. Редактор получает уведомление о новых черновиках (daily digest через \Bitrix\Main\Mail\Event)
  3. Редактор просматривает, при необходимости правит, публикует
  4. Если черновик не просмотрен 7 дней — повторное уведомление

Дополнительно: AI-скоринг каждого черновика по параметрам (уникальность, читаемость, релевантность тематике сайта). Редактор видит оценку и может фильтровать по ней.

Технические компоненты в Битриксе

Блог реализован через стандартный инфоблок. Дополнительные свойства под автонаполнение:

  • SOURCE_URL — ссылка на оригинал
  • SOURCE_NAME — название источника
  • AUTO_DRAFT — флаг автоматически созданного черновика
  • CONTENT_SCORE — оценка качества контента (0–100)
  • PUBLICATION_DATE_PLANNED — дата запланированной публикации

Таймлайн работ

Этап Срок
Разработка коллекторов (RSS, YouTube, Telegram) 3–5 дней
Pipeline обработки контента 2–3 дня
Система черновиков и уведомлений для редактора 1–2 дня
Административный интерфейс, AI-скоринг 1–2 дня

Итого: 7–12 рабочих дней в зависимости от набора источников.