Настройка Elasticsearch-фасетной агрегации 1С-Битрикс
Фильтр каталога с 50 000 товаров через CIBlockElement::GetList с группировкой по свойствам — это минуты на MySQL. Elasticsearch решает ту же задачу за десятки миллисекунд через aggregations API. Но стандартный модуль поиска Битрикс (search) не поддерживает фасеты из коробки. Нужна кастомная интеграция.
Как фасеты работают в Elasticsearch
Aggregations — запрос, который одновременно возвращает результаты поиска и статистику по полям: количество документов для каждого значения фильтра. Один запрос к Elasticsearch заменяет N запросов к MySQL для подсчёта по каждому фасету.
Пример: каталог ноутбуков. Один запрос возвращает:
- 240 товаров, удовлетворяющих текущему фильтру
- По бренду: ASUS (45), Dell (38), HP (31)...
- По RAM: 8 ГБ (89), 16 ГБ (104), 32 ГБ (47)
- По диагонали: 15.6" (130), 14" (65)...
Это и есть фасеты.
Маппинг для фасетных полей
Для фасетной агрегации поля должны быть либо keyword (точное значение), либо integer/float для числовых диапазонов. Поля типа text не агрегируются (или агрегируются по токенам, что бессмысленно для фасетов).
Маппинг при создании индекса:
curl -X PUT http://localhost:9200/bitrix_catalog_s1 \
-H "Content-Type: application/json" \
-d '{
"mappings": {
"properties": {
"title": {
"type": "text",
"analyzer": "russian",
"fields": {
"keyword": {"type": "keyword"}
}
},
"brand": {"type": "keyword"},
"price": {"type": "float"},
"category_id": {"type": "integer"},
"properties": {
"type": "nested",
"properties": {
"code": {"type": "keyword"},
"value": {"type": "keyword"},
"value_num": {"type": "float"}
}
}
}
}
}'
Свойства товара храним как nested объекты — это позволяет корректно фильтровать по комбинации значений одного свойства.
Запрос с агрегациями из PHP
Класс для работы с Elasticsearch через официальный клиент elasticsearch/elasticsearch:
use Elasticsearch\ClientBuilder;
class CatalogElasticSearch
{
private $client;
private $index = 'bitrix_catalog_s1';
public function __construct()
{
$this->client = ClientBuilder::create()
->setHosts(['localhost:9200'])
->build();
}
public function getFacets(array $filters = [], string $query = ''): array
{
$must = [];
if ($query) {
$must[] = ['match' => ['title' => $query]];
}
// Применяем выбранные фильтры
foreach ($filters as $code => $values) {
$must[] = [
'nested' => [
'path' => 'properties',
'query' => [
'bool' => [
'must' => [
['term' => ['properties.code' => $code]],
['terms' => ['properties.value' => (array)$values]]
]
]
]
]
];
}
$params = [
'index' => $this->index,
'body' => [
'query' => ['bool' => ['must' => $must]],
'aggs' => [
'brands' => [
'terms' => ['field' => 'brand', 'size' => 50]
],
'price_range' => [
'range' => [
'field' => 'price',
'ranges' => [
['to' => 10000],
['from' => 10000, 'to' => 30000],
['from' => 30000, 'to' => 60000],
['from' => 60000]
]
]
],
'properties_facets' => [
'nested' => ['path' => 'properties'],
'aggs' => [
'prop_codes' => [
'terms' => ['field' => 'properties.code', 'size' => 20],
'aggs' => [
'prop_values' => [
'terms' => ['field' => 'properties.value', 'size' => 100]
]
]
]
]
]
],
'size' => 24,
'from' => 0
]
];
return $this->client->search($params);
}
}
Индексация товаров Битрикс
Данные для индексации собираем через CIBlockElement::GetList и отправляем в Elasticsearch батчами через Bulk API:
function indexCatalogToElastic(int $iblockId): void
{
$client = ClientBuilder::create()->setHosts(['localhost:9200'])->build();
$batchSize = 200;
$offset = 0;
do {
$res = CIBlockElement::GetList(
[],
['IBLOCK_ID' => $iblockId, 'ACTIVE' => 'Y'],
false,
['nTopCount' => $batchSize, 'nPageSize' => $batchSize, 'iNumPage' => ($offset / $batchSize) + 1],
['ID', 'NAME', 'DETAIL_TEXT', 'PROPERTY_BRAND', 'PROPERTY_*']
);
$body = [];
$count = 0;
while ($el = $res->GetNextElement()) {
$fields = $el->GetFields();
$props = $el->GetProperties();
$properties = [];
foreach ($props as $code => $prop) {
if (!empty($prop['VALUE'])) {
$properties[] = [
'code' => $code,
'value' => is_array($prop['VALUE']) ? implode(', ', $prop['VALUE']) : $prop['VALUE']
];
}
}
$body[] = ['index' => ['_index' => 'bitrix_catalog_s1', '_id' => $fields['ID']]];
$body[] = [
'title' => $fields['NAME'],
'brand' => $props['BRAND']['VALUE'] ?? '',
'properties' => $properties
];
$count++;
}
if (!empty($body)) {
$client->bulk(['body' => $body]);
}
$offset += $batchSize;
} while ($count === $batchSize);
}
Post-filter для независимых фасетов
Стандартная проблема: при выборе фильтра «Бренд: ASUS» в агрегации по брендам должны остаться все бренды с актуальными количествами — иначе пользователь не может переключиться на Dell. Для этого используется post_filter: фильтрация применяется к результатам, но не к агрегациям.
{
"query": {"match_all": {}},
"post_filter": {"term": {"brand": "ASUS"}},
"aggs": {
"brands": {"terms": {"field": "brand"}}
}
}
Агрегация считается по всей базе, результаты фильтруются по ASUS. Пользователь видит полный список брендов и может переключаться.







