Настройка автоматической проверки мета-тегов и структурированных данных

Наша компания занимается разработкой, поддержкой и обслуживанием сайтов любой сложности. От простых одностраничных сайтов до масштабных кластерных систем построенных на микро сервисах. Опыт разработчиков подтвержден сертификатами от вендоров.

Разработка и обслуживание любых видов сайтов:

Информационные сайты или веб-приложения
Сайты визитки, landing page, корпоративные сайты, онлайн каталоги, квиз, промо-сайты, блоги, новостные ресурсы, информационные порталы, форумы, агрегаторы
Сайты или веб-приложения электронной коммерции
Интернет-магазины, B2B-порталы, маркетплейсы, онлайн-обменники, кэшбэк-сайты, биржи, дропшиппинг-платформы, парсеры товаров
Веб-приложения для управления бизнес-процессами
CRM-системы, ERP-системы, корпоративные порталы, системы управления производством, парсеры информации
Сайты или веб-приложения электронных услуг
Доски объявлений, онлайн-школы, онлайн-кинотеатры, конструкторы сайтов, порталы предоставления электронных услуг, видеохостинги, тематические порталы

Это лишь некоторые из технических типов сайтов, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента

Предлагаемые услуги
Показано 1 из 1 услугВсе 2065 услуг
Настройка автоматической проверки мета-тегов и структурированных данных
Средняя
~2-3 рабочих дня
Часто задаваемые вопросы

Наши компетенции:

Этапы разработки

Последние работы

  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1262
  • image_web-applications_feedme_466_0.webp
    Разработка веб-приложения для компании FEEDME
    1171
  • image_websites_belfingroup_462_0.webp
    Разработка веб-сайта для компании БЕЛФИНГРУПП
    874
  • image_ecommerce_furnoro_435_0.webp
    Разработка интернет магазина для компании FURNORO
    1094
  • image_crm_enviok_479_0.webp
    Разработка веб-приложения для компании Enviok
    831
  • image_bitrix-bitrix-24-1c_fixper_448_0.png
    Разработка веб-сайта для компании ФИКСПЕР
    851

Автоматическая проверка мета-тегов и структурированных данных

Мета-теги и Schema.org разметка влияют на внешний вид сниппетов в поиске и корректность отображения в соцсетях. Автоматическая проверка выявляет дублирующиеся title, пустые description, невалидный JSON-LD и отсутствующие OG-теги до того, как Google проиндексирует страницы.

Структура проверки

Краулер → Playwright (рендер JS) → Парсинг мета-тегов →
→ Валидация правил → Отчёт по страницам → Алерт при критических проблемах

Реализация

// scripts/meta-checker.ts
import { chromium, Browser, Page } from 'playwright';

interface MetaAudit {
  url:        string;
  title:      string | null;
  description: string | null;
  canonical:  string | null;
  robots:     string | null;
  og_title:   string | null;
  og_image:   string | null;
  og_desc:    string | null;
  twitter_card: string | null;
  schema_types: string[];
  schema_errors: string[];
  issues:     Issue[];
}

interface Issue {
  severity: 'critical' | 'warning' | 'info';
  rule:     string;
  message:  string;
}

async function auditPage(page: Page, url: string): Promise<MetaAudit> {
  await page.goto(url, { waitUntil: 'networkidle' });

  const meta = await page.evaluate(() => {
    const getMeta = (name: string) =>
      document.querySelector(`meta[name="${name}"]`)?.getAttribute('content') ||
      document.querySelector(`meta[property="${name}"]`)?.getAttribute('content') || null;

    // Парсим JSON-LD
    const jsonldScripts = Array.from(document.querySelectorAll('script[type="application/ld+json"]'));
    const schemas: any[] = [];
    const schemaErrors: string[] = [];

    for (const script of jsonldScripts) {
      try {
        schemas.push(JSON.parse(script.textContent || ''));
      } catch (e) {
        schemaErrors.push(`Invalid JSON-LD: ${e.message}`);
      }
    }

    return {
      title:       document.title,
      description: getMeta('description'),
      canonical:   document.querySelector('link[rel="canonical"]')?.getAttribute('href') || null,
      robots:      getMeta('robots'),
      og_title:    getMeta('og:title'),
      og_image:    getMeta('og:image'),
      og_desc:     getMeta('og:description'),
      twitter_card: getMeta('twitter:card'),
      schema_types: schemas.map(s => s['@type']).filter(Boolean),
      schema_errors: schemaErrors,
    };
  });

  const issues: Issue[] = [];

  // Правила валидации
  if (!meta.title) {
    issues.push({ severity: 'critical', rule: 'title-missing', message: 'Отсутствует title' });
  } else if (meta.title.length < 10) {
    issues.push({ severity: 'warning', rule: 'title-too-short', message: `Title слишком короткий: ${meta.title.length} символов` });
  } else if (meta.title.length > 70) {
    issues.push({ severity: 'warning', rule: 'title-too-long', message: `Title слишком длинный: ${meta.title.length} символов (макс. 70)` });
  }

  if (!meta.description) {
    issues.push({ severity: 'critical', rule: 'desc-missing', message: 'Отсутствует meta description' });
  } else if (meta.description.length > 160) {
    issues.push({ severity: 'warning', rule: 'desc-too-long', message: `Description слишком длинный: ${meta.description.length} символов` });
  }

  if (!meta.canonical) {
    issues.push({ severity: 'warning', rule: 'canonical-missing', message: 'Отсутствует canonical URL' });
  } else if (!meta.canonical.startsWith('https://')) {
    issues.push({ severity: 'warning', rule: 'canonical-http', message: 'Canonical использует HTTP вместо HTTPS' });
  }

  if (!meta.og_image) {
    issues.push({ severity: 'warning', rule: 'og-image-missing', message: 'Отсутствует og:image' });
  }

  if (meta.schema_errors.length > 0) {
    meta.schema_errors.forEach(err =>
      issues.push({ severity: 'critical', rule: 'schema-invalid-json', message: err })
    );
  }

  return { url, ...meta, issues };
}

async function auditSite(urls: string[]): Promise<MetaAudit[]> {
  const browser = await chromium.launch({ headless: true });
  const results: MetaAudit[] = [];

  // Параллельно, но не более 5 одновременно
  const BATCH = 5;
  for (let i = 0; i < urls.length; i += BATCH) {
    const batch = urls.slice(i, i + BATCH);
    const pages = await Promise.all(batch.map(() => browser.newPage()));

    const batchResults = await Promise.all(
      batch.map((url, j) => auditPage(pages[j], url))
    );
    results.push(...batchResults);
    await Promise.all(pages.map(p => p.close()));
  }

  await browser.close();
  return results;
}

Поиск дублирующихся title и description

function findDuplicates(audits: MetaAudit[]): { titles: Map<string, string[]>, descs: Map<string, string[]> } {
  const titleMap = new Map<string, string[]>();
  const descMap  = new Map<string, string[]>();

  for (const audit of audits) {
    if (audit.title) {
      const existing = titleMap.get(audit.title) || [];
      titleMap.set(audit.title, [...existing, audit.url]);
    }
    if (audit.description) {
      const existing = descMap.get(audit.description) || [];
      descMap.set(audit.description, [...existing, audit.url]);
    }
  }

  // Оставляем только дубликаты
  return {
    titles: new Map([...titleMap].filter(([, urls]) => urls.length > 1)),
    descs:  new Map([...descMap].filter(([, urls]) => urls.length > 1)),
  };
}

Валидация JSON-LD через Google Rich Results API

async function validateSchemaWithGoogle(url: string): Promise<any> {
  const apiUrl = `https://searchconsole.googleapis.com/v1/urlTestingTools/mobileFriendlyTest:run`;
  // Используем Google Search Console API для проверки rich snippets
  // Альтернатива: schema.org валидатор
  const validator = await fetch(
    `https://validator.schema.org/validate?url=${encodeURIComponent(url)}&format=json`
  );
  return validator.json();
}

Сроки

Автоматический аудит мета-тегов с проверкой JSON-LD и поиском дублей: 2–3 рабочих дня.