В OpenAI рассказали, как PostgreSQL обслуживает ChatGPT – сервис с 800–900 миллионами активных пользователей в неделю. Необычный момент заключается в том, что компания работает без шардирования, используя один основной сервер и около 50 реплик только для чтения.
Инженер OpenAI Бохан Чжан на конференции PGConf.Dev 2025 отметил, что кластер обрабатывает более миллиона запросов в секунду и отвечает в низкие двузначные миллисекунды для 99% запросов. Все это работает на стандартном PostgreSQL без модификаций — только с оптимальной настройкой соединений, запросов и индексов.
У записи есть узкое место: все операции идут на один сервер. Чтобы нагрузка не сказывалась на скорости, OpenAI переносит части записи, сглаживает пики и строго контролирует изменения схемы. Новые колонки добавляют с таймаутом 5 секунд, индексы создают через CONCURRENTLY, перезаписи таблиц избегают.
Чтение масштабируется проще: реплики распределены по регионам, а критичные запросы обслуживаются отдельными репликами. За последние девять месяцев был только один серьезный инцидент с PostgreSQL.
Подход OpenAI отличается от распространенной практики шардирования. Для ChatGPT с преобладанием чтения один кластер оказался эффективнее распределенной архитектуры.