Технологический гигант Google представил седьмое поколение TPU — Ironwood. Ironwood TPU обладают рядом впечатляющих характеристик: каждый чип оснащен 192 Гбайт памяти HBM3e с пропускной способностью 7,2 Тбайт/с и способен обеспечивать до 4614 TFLOPS вычислительной мощности.
Главное преимущество Ironwood — оптимизация под инференс, а не обучение моделей. Высокая емкость памяти снижает накладные расходы на межчиповую коммуникацию, уменьшает задержки и повышает эффективность использования энергии — ключевой фактор для гипермасштабных вычислительных сред.
По данным Google, новая архитектура обеспечивает вдвое более высокую энергоэффективность по сравнению с предыдущими поколениями TPU. Эксперты отмечают, что эра AI-инференса меняет критерии оценки чипов: теперь важнее не просто количество TFLOPS, а скорость обработки запросов, задержки, энергоэффективность и стоимость выполнения операций.
В этом контексте Ironwood TPU может стать серьезным конкурентом NVIDIA, особенно учитывая, что эти процессоры будут предоставляться исключительно через Google Cloud, создавая потенциальную экосистемную привязку для клиентов.
Источник: wccftech
