Groq логотип

Groq

Сверхбыстрый инференс LLM на специализированных чипах LPU

Freemium
Код и разработка
Компания: Groq
Попробовать

О Groq

Groq — платформа для сверхбыстрого инференса языковых моделей на специализированных чипах LPU (Language Processing Unit). Обеспечивает скорость генерации до 500+ токенов/сек. Поддерживает Llama, Mixtral и другие open-source модели.

Преимущества

  • Рекордная скорость генерации — до 500 токенов/сек
  • Щедрый бесплатный тариф
  • Поддержка популярных open-source моделей

Недостатки

  • Ограниченный набор моделей
  • Rate limits на бесплатном плане
  • Нет собственных моделей — только хостинг

Информация об инструменте предоставлена в ознакомительных целях. Цены, возможности и условия использования могут отличаться от указанных. Рейтинг отражает субъективную оценку редакции НейроСкоп. Перед использованием рекомендуем ознакомиться с актуальной информацией на сайте разработчика.

ещё 3
Сравнить (0)