Вопрос

Я ищу информацию, как двойная точность аппаратно реализована в GPU Tesla. Я прочитал, что два процессора по потоковым процессам работают над одной двойной ценностью, но я не нашел какой-либо официальной статьи от NVIDIA.

Заранее спасибо. PPS Почему большинство GPU вычисляются только с одной точностью (потому что цвета могут храниться как RR.GG.BB.TT, где каждый символ является 8-битным значением)?

PS.Google это для меня не помогло

Это было полезно?

Решение

Не поддерживая двойной, не является вопросом формата хранения, как вы сказали (rr.gg.bb.tt), но имеющие собственные внутренние силы (и настолько выделенные аппаратные средства) для обработки операций на двойной (Add, Mul, Madd и т. Д.).

Во всяком случае, большинство GPU поддерживает только одну точность, потому что, где большая часть рынка GPU лежит на игровом рынке, а геймеры не нуждаются в двойной точности. Также большинство геймеров ищут хорошие отношения производительности / цен. Реализация DP стоит в срок действия транзисторов (и TDP), и если игры не используют двойную точность, это бессмысленно.

Вот почему вы видите высокого класса ATI GPU, поддерживающие двойные (HD 59xx и HD 58xx, но не средние значения GPUS, такие как HD 57xx и меньше).

@karlphillip: Да, вы правы, IEEEE754 (вид) для GPU, как GTX 260, но тока ATI и генерация NVIDIA поддерживает IEEE 754-2008 на высококачественных частях.

Об реализации оборудования, это секреты IHVS обычно не скажут :)

Другие советы

Tesla не является графическим процессором, это линия сопроцессоров с различными высококлассными графическими процессорами. Если у вашего Tesla есть Fermi GPU внутри, он должен иметь хорошую двойную точность производительности.

Увидеть Ферми Белая бумага, стр. 9.

Одиночная точность важнее для регулярных вычислений GPU, потому что для таких применений достаточно.

В соответствии с Вики:

Для двойной точности (поддерживается только в более новых графических процессе, таких как GTX 260 [12]). Существуют некоторые отклонения от стандарта IEEE 754: круглая до ближайшего - даже является единственным поддерживаемым режимом округления для взаимного, дивижения и квадратного корня. В одной точности, денормалы и сигнальные назы не поддерживаются; Поддерживаются только два режима округления IEEE (CHOP и Round-To-ближе всего), и те, которые указываются на основании для каждого инструкции, а не в контрольном слову; И точность дивизиона / квадратного корня немного ниже, чем отдельная точность.

Там вы идете, они реализуют большую часть спецификации IEEE 754., но фактическая реализация, вероятно, является частным и секретным.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top