Теги → cln16ff+

NVIDIA: все анонсированные процессоры семейства Pascal уже в массовом производстве

В последние два месяца корпорация NVIDIA представила два процессора на базе архитектуры Pascal: GP100 и GP104. При этом, если графические карты на базе GP104 — GeForce GTX 1070 и GeForce GTX 1080 — появятся на рынке уже в ближайшие недели, то о сроках появления на рынке решений на основе GP100 ничего не сообщалось. Тем не менее, оба процессора уже находятся в массовом производстве, а значит, не за горами и появление графических и вычислительных карт на базе старшего процессора в семействе.

GP100 и GP104 производятся массово

«Мы только что анонсировали [GeForce GTX] 1070 и 1080 на [базе архитектуры] Pascal, оба этих продукта в массовом производстве», — сказал Дженсен Хуанг (Jen-Hsun Huang), исполнительный директор NVIDIA в ходе телеконференции с инвесторами и финансовыми аналитиками. «Мы также производим Tesla P100, так что все продукты на базе Pascal, которые мы уже анонсировали, находятся в массовом производстве».

NVIDIA Tesla P100

NVIDIA Tesla P100

Графический процессор NVIDIA GP100 был представлен в апреле на конференции для разработчиков GPU Technology Conference вместе с первыми продуктом на его базе, вычислительным ускорителем Tesla P100. Согласно официальным данным, Tesla P100 обладает 3584 потоковыми процессорами, а также 16 Гбайт памяти типа HBM2, размещённым в одном корпусе с GPU по технологии CoWoS (Chip-On-Wafer-On-Substrate). Память HBM2 в случае с Tesla P100 подключается к процессору при помощи 4096-разрядной шины и передаёт данные на скорости 1,4 Гтрансфера/с, обеспечивая пропускную способность в 720 Гбайт/с.

Известно, что максимальная производительность Tesla P100 на операциях с одинарной точностью (single precision, FP32) составляет около 10,6 триллиона операций с плавающей запятой в секунду (Тфлопс), тогда как мощность при операциях с двойной точностью (double precision, FP64) составляет примерно 5,3 Тфлопс. Поскольку Tesla предназначается для суперкомпьютеров, то NVIDIA пока не рассказывала о графических возможностях данного GPU. Известно лишь, что конфигурация с 3584 потоковыми процессорами не является максимально возможной, поскольку GPU включает в себя 3880 потоковых процессоров.

Некоторые компании на конференции GTC говорили, что представят решения на базе Tesla P100 осенью этого года. Судя по всему, примерно тогда же сама NVIDIA начнёт коммерческие поставки данного ускорителя заинтересованным клиентам. Время появления графических карт на базе GP100 доподлинно неизвестно, однако это может произойти как осенью этого года, так и чуть позже. Во многом выпуск игровых карт на базе GP100 будет зависеть от выхода годных кристаллов, а также от количества заказываемых клиентами NVIDIA ускорителей Tesla GP100. Учитывая, что последние продаются по цене в несколько тысяч долларов за единицу и с огромной нормой прибыльности, приоритет будет отдан именно этим решениям.

NVIDIA GeForce GTX 1080

NVIDIA GeForce GTX 1080

Что касается графического процессора GP104 (сама компания не упоминала этого названия, но учитывая типичную номенклатуру, второй по производительности графический процессор в модельном ряду Pascal первого поколения должен называться именно так), то появление первых графических карт на его основе намечено на ближайшие недели. Спецификации флагмана семейства — GeForce GTX 1080 — известны: 2560 потоковых процессоров, 160 текстурных модулей, 64 растровых конвейера и 256-разрядная шина памяти. Производительность GTX 1080 на операциях с одинарной точностью составляет около 9 Тфлопс, что на 80 % выше, чем у GTX 980, и на 33 % выше, чем у GTX Titan X. Графическая карта GTX 1080 будет экипироваться 8 Гбайт памяти GDDR5X производства Micron, которая будет работать в режиме 10 Гтрансферов/с и обеспечивать пропускную способность в 320 Гбайт/с. Учитывая, что GeForce GTX 1080 появится в продаже уже 27 мая, можно с уверенностью сказать, что массовое производство GP104 началось самое позднее в начале февраля. Что касается памяти, то компания Micron подтвердила, что первая партия GDDR5X была отправлена одному из клиентов уже некоторое время назад.  

GeForce GTX 1070 станет более доступной графической картой на базе GP104, которая будет на треть медленнее модели GTX 1080 и будет экипироваться памятью типа GDDR5. Вычислительная мощность GTX 1070 будет выше, чем у GTX 980 Ti или Titan X, однако пропускная способность памяти данной графической карты будет ниже, чем у флагманов предыдущего поколения. Таким образом, трудно сказать, будет ли GTX 1070 однозначно лучше, чем решения на базе GM200. Тем не менее, цена решения обещает быть довольно щадящей — $379 в момент появления на прилавках 10 июня.

Выход годных в норме

Разработчики микросхем редко говорят о выходе годных чипов вследствие договорённостей с контрактными производителями, а также по причине острой конкуренции. Тем не менее, NVIDIA утверждает, что процент выхода годных процессоров на базе архитектуры Pascal является «хорошим».

«Выход годных хорош», — сказал господин Хуанг. «Производство этих микросхем всегда сопровождается трудностями, но мы умеем это делать. Кроме того, с момента, когда TSMC начала выпускать первые 16-нм чипы, прошёл год. Выход годных под контролем у TSMC. […] Мы бы не стали ничего анонсировать, если бы производство и [выход годных] не были бы [предсказуемыми]. Мы в хорошей форме».

Кремниевая пластина с микросхемами, обработанная TSMC

Кремниевая пластина с микросхемами, обработанная TSMC

Для изготовления GP100 и GP104 компания NVIDIA использует технологический процесс 16 нм второго поколения компании TSMC (CLN16FF+). Судя по довольно высоким тактовым частотам GP100 и GP104, выход годных микросхем может быть весьма хорошим. Тем не менее, заметно, что NVIDIA увеличила номинальное тепловыделение у игровой GeForce GTX 1080 до 180 Вт по сравнению с 165 Вт у GTX 980. Кроме того, довольно примечательно, что NVIDIA повысила рекомендуемые цены у GeForce GTX 1080 и 1070 на $50 по сравнению с GeForce GTX 980 и 970, несмотря на существенно меньшие размеры чипа. Весьма вероятно, что выход годных кристаллов действительно удовлетворяет требованиям NVIDIA, однако себестоимость чипов выше, чем у предшественников.

Разработка всех процессоров семейства Pascal завершена

На сегодняшний день NVIDIA представила два графических процессора на базе архитектуры Pascal. Однако семейство Maxwell включало в себя пять процессоров (GM107, GM108, GM204, GM206, GM200), в то время как базе Kepler было разработано шесть микросхем (GK107, GK208, GK104, GK106, GK110 и GK210). Сколько GPU на базе Pascal планирует выпустить NVIDIA в конечном итоге — неизвестно. Однако в компании говорят, что все они либо уже существуют в кремнии, либо в виде цифровых моделей, отправленных контрактному производителю. Так или иначе, но разработка семейства завершена.

«Цифровые проекты всех микросхем семейства Pascal уже отправлены производителю», — сказал исполнительный директор NVIDIA. «Однако впереди ещё много инженерной работы».

NVIDIA Tegra

NVIDIA Tegra

Учитывая сокращение рынка ПК, сложно ожидать от NVIDIA более трёх графических процессоров для персональных компьютеров. Тем не менее, Pascal должен появиться не только в GPU для ПК, но и в системах на кристалле Tegra для целого ряда устройств. Учитывая, что требования к различным платформам разные, семейство чипов на основе Pascal может принести ряд сюрпризов.

NVIDIA может представить новый GeForce GTX Titan на базе Pascal в апреле

Вот уже более трёх лет корпорация NVIDIA анонсирует свои флагманские графические карты для потребителей серии GeForce GTX Titan во время ежегодной конференции GPU Technology Conference (GTC). Подобный подход даёт компании возможность показать свои наивысшие достижения в области создания графических процессоров (graphics processing units, GPUs) не только профессионалам, но и энтузиастам игр и ПК. Судя по слухам, в апреле этого года NVIDIA представит очередного «титана», на этот раз на базе архитектуры Pascal.

NVIDIA GeForce GTX Titan

NVIDIA GeForce GTX Titan

Семейство продукции GeForce GTX Titan традиционно базируется на самых мощных графических процессорах NVIDIA на момент представления. Так, GeForce GTX Titan, Titan Black и Titan Z использовали микросхемы GK110, тогда как Titan X использует GM200. Подобные карты предназначены не только для любителей игр, но и для энтузиастов научных вычислений на GPU. Именно поэтому все «титаны» обладают неограниченной производительностью для вычислений с двойной точностью (double precision, DP, или FP64), а также экипируются огромным количеством набортной памяти.

В этом году NVIDIA планирует провести GPU Technology Conference в начале апреля, немного позже, чем обычно. По слухам, одним из ключевых анонсов GTC 2016 станет представление архитектуры графических процессоров Pascal, а также устройств на базе новых флагманских GPU — GP100. Помимо этого, на конференции традиционно соберутся учёные, программисты, исследователи и разного рода профессионалы, использующие графические процессоры для решения научных или серьёзных практических задач.

Прототип процессорного модуля на базе GPU архитектуры Pascal с HBM памятью

Прототип процессорного модуля на базе GPU архитектуры Pascal с HBM-памятью

С точки зрения энтузиастов аппаратного обеспечения ПК, ключевым анонсом GTC 2016 станет представление нового GeForce GTX Titan на основе процессора GP100, флагмана первого поколения семейства процессоров на базе архитектуры Pascal. Точные спецификации нового GeForce GTX Titan неизвестны, но логично ожидать, что новинка будет экипироваться 16 Гбайт памяти HBM2 производства Samsung c пропускной способностью 819,2 Гбайт – 1 Тбайт/с. Стоимость нового «титана» традиционно составит около $1000 или выше.

Хотя NVIDIA ещё только предстоит раскрыть все подробности об архитектуре Pascal, очевидно, что новое поколение GPU NVIDIA станет следующим по-настоящему важным шагом в эволюции графических процессоров компании. Среди возможностей Pascal ожидается поддержка вычислений с половинной точностью; унифицированное адресное пространство памяти для CPU и GPU; поддержка новых типов памяти (HBM2, GDDR5X); шина NVLink для связи с CPU и GPU в системах для суперкомпьютерных вычислений или же нескольких GPU в одном ПК; а также новые графические, вычислительные и мультимедийные возможности.

NVIDIA GeForce GTX Titan X

NVIDIA GeForce GTX Titan X

Графические процессоры GP100 будут производиться по улучшенной технологии 16 нм с транзисторами с вертикально расположенным затвором (16nm FinFET+, CLN16FF+) на мощностях Taiwan Semiconductor Manufacturing Co. (TSMC). Благодаря увеличенной плотности транзисторов у технологии CLN16FF+, NVIDIA сможет существенно увеличить количество вентилей в GP100 по сравнению с GM200 при сохранении схожей площади ядра. Как следствие, серьёзно вырастет количество вычислительных процессоров, что, в совокупности с улучшенной микроархитектурой, приведёт к кратному увеличению производительности по сравнению с решениями на базе GK110/GK210 и GM200.

Существенное увеличение вычислительной мощности, а также использование четырёх 4-Гбайт микросхем HBM2 c пропускной способностью до 1 Тбайт/с позволит графическим картам на базе GP100 показать новый уровень скорости в разрешениях сверхвысокой чёткости — 4K (3840 × 2160, 4096 × 2160) и 5K (5120 × 2160). Кроме того, GP100 существенно увеличит скорость вычислений с двойной точностью, что будет важно для суперкомпьютеров; а также с половинной точностью, что значительно ускорит системы глубокого обучения и искусственного интеллекта.

Корпорация NVIDIA пока никак не подтверждала планы по выводу решений на базе архитектуры Pascal на рынок, ограничиваясь указанием, что новинки появятся в продаже в 2016 году. Как следствие, слухи о новом GeForce GTX Titan в апреле могут оказаться неверными.

AMD анонсировала архитектуру Polaris: новейшие GPU появятся в середине года

Подразделение Radeon Technologies Group корпорации Advanced Micro Devices официально представило новую архитектуру графических процессоров Polaris. Новая технология является четвёртой итерацией семейства архитектур Graphics Core Next (GCN) и представляет собой наиболее радикальное обновление GPU AMD с 2011 года. Первые графические процессоры на базе Polaris появятся в середине 2016 года и предложат новый уровень производительности, а также ряд новых возможностей.

Вследствие изменений намерений контрактных производителей микросхем в 2011–2012 годах, компаниям AMD и NVIDIA пришлось существенно поменять свои перспективные планы в области выпуска новых графических процессоров. Обоим разработчикам пришлось отказаться от внедрения ряда новых технологий, главным образом сосредоточившись на увеличении производительности на ватт. В 2016 году Taiwan Semiconductor Manufacturing Co. и GlobalFoundries, наконец, предложат AMD и NVIDIA новые технологические процессы, которые позволят существенно изменить архитектуру GPU, расширить их набор возможностей, одновременно увеличив производительность на ватт.

AMD Polaris

AMD Polaris

Новая архитектура Polaris обновит все ключевые блоки GPU, включая вычислительные процессоры, командные процессоры, систему кеширования данных, контроллеры памяти и системы кодирования/декодирования видео. Кроме того, новые GPU будут поддерживать новейшие интерфейсы для подключения мониторов и телевизоров — HDMI 2.0a, а также DisplayPort 1.3. Таким образом, Polaris станут одними из первых GPU, которые будут поддерживать дисплеи с разрешением 8K (7680 × 4320).

AMD Polaris: Ключевые нововведения

AMD Polaris: Ключевые нововведения

Новая вычислительная архитектура

Самым главным нововведением AMD Polaris является новая архитектура набора команд (instruction set architecture, ISA), что ускорит производительность новейших графических карт в играх и расширит их возможности в области вычислений. Увеличение производительности будет обусловлено целым рядом факторов.

AMD Polaris: Архитектурные нововведения

AMD Polaris: Архитектурные нововведения

GCN четвёртого поколения будет иметь новый блок предварительной выборки инструкций (instruction pre-fetch), который позволит сократить время простоя исполняющих устройств за счёт предвыборки кода. Кроме того, Polaris будет иметь новый диспетчер исполнения задач (hardware scheduler), что позволит быстрее распределять потоки задач между аппаратными ресурсами, тем самым увеличивая эффективность их исполнения.

Дальнейший рост эффективности работы графических процессоров семейства Polaris связан с новым алгоритмом отбрасывания невидимых полигонов и сжатия содержимого памяти. Обе технологии позволяют увеличить эффективную пропускную способность памяти, сократить требования к объёму памяти на борту и уменьшить количество вычислений над частями изображения, которые не видны в финальной сцене.

В настоящее время AMD не раскрывает существенного количества деталей о новой архитектуре, но заявляет о двукратном увеличении производительности на ватт по сравнению с предшественниками. Теоретически, это означает, что новый флагман — известный из неофициальных источников как Greenland — может быть в два раза быстрее, чем AMD Radeon R9 Fury X при одинаковом энергопотреблении. Тем не менее, действительная производительность новинок будет зависеть от массы факторов.

Новые контроллеры памяти и подсистема кеширования

Производительность графических карт всегда очень сильно зависела от пропускной способности их памяти (ПСП). В последние годы, помимо ПСП, для GPU стала крайне важна система кеширования данных.

Архитектура графических процессоров усложняется с каждым годом и современные GPU во многом напоминают центральные процессоры. Подобные тенденции обусловлены как необходимостью увеличивать производительность в традиционных приложениях (игры, создание контента), так и необходимостью исполнять всё более сложный код общего назначения для суперкомпьютерных и других вычислений.

Эволюция AMD GCN

Эволюция AMD GCN

Для дальнейшего увеличения производительности GPU разработчикам требуется не только обеспечить высокую пропускную способность памяти, но и эффективно производить предварительную выборку необходимых данных, чтобы сократить задержки и время простоя вычислительных процессоров.  

Архитектура Polaris получит новые контроллеры памяти, что даст возможность увеличить ПСП благодаря поддержке новых и более быстрых типов памяти вроде HBM2 и GDDR5/GDDR5X. Кроме того, AMD обещает внедрить новый кеш второго уровня, что может означать перепроектирования всей подсистемы кешей внутри графических процессоров GCN версии 1.3.

Принимая во внимание тот факт, что следующему поколению GPU придётся работать с играми в разрешениях 4K (3840 × 2160), а также в VR-приложениях, увеличение ПСП и низкие задержки при работе с памятью придутся как нельзя кстати.

К сожалению, в настоящее время AMD не хочет раскрывать детальной информации о подсистемах памяти и кеширования Polaris. Как следствие, выразить преимущества новинок перед имеющимися решениями в цифрах не представляется возможным.

Новое видеоядро и новый контроллер дисплея

Хотя последнее поколение графических процессоров AMD обладает неплохими возможностями в области воспроизведения видео, они не поддерживают целого ряда вещей, которые требуются пользователям в 2016 году. Семейство AMD Polaris не только сможет воспроизводить фильмы в формате Ultra HD Blu-ray, но и станет первым, которое сможет «нативно» отображать изображение в разрешении 8K.

Графические процессоры AMD Radeon поколения GCN 1.3 будут поддерживать декодирование видео, закодированного при помощи кодека HEVC/H.265 с профилем Main 10. Данный формат включает в себя цветовое пространство BT.2020 с глубиной цвета 8 или 10 разрядов, режим цветовой субдискретизации 4:2:0, а также полноценную поддержку расширенного динамического диапазона. Подобных возможностей хватит для проигрывания дисков Ultra HD Blu-ray. По какой-то причине AMD не заявляет о поддержке технологии защиты от копирования HDCP 2.2, которая требуется для просмотра указанных носителей.

Микросхема AMD

Микросхема AMD

Наконец, архитектура AMD Polaris принесёт графическим процессорам Radeon долгожданную поддержку выходов HDMI 2.0a и DisplayPort 1.3. HDMI позволит новым GPU подключаться к приёмникам с разрешением до 4096 × 2160 при частоте развёртки 60 Гц в режиме HDR. DisplayPort 1.3 — который в настоящее время не поддерживается ни одним GPU — даст возможность новому поколению графических карт AMD Radeon работать с панелями с разрешением до 8K (7680 × 4320) при 60 Гц или же 4K при частоте развёртки 120 Гц.

Новые технологические процессы

Новейшие графические процессоры AMD будут производиться с использованием технологических процессов, которые используют транзисторы с вертикально расположенным затвором (fin-shaped field-effect transistor, FinFET). Трёхмерные транзисторы позволяют существенно снизить токи утечек, а также лучше контролировать работу микросхем.

AMD Polaris: Преимущества FinFET

AMD Polaris: Преимущества FinFET

Технологические процессы 14 нм low power plus (14LPP) и 16 нм FinFET+ (CLN16FF+) компаний GlobalFoundries и TSMC позволяют увеличить плотность размещения транзисторов почти вдвое по сравнению с технологией 28-нм TSMC. Это даст возможность существенно поднять транзисторный бюджет новых GPU, увеличив количество исполнительных блоков и их возможности.

Сама архитектура FinFET транзисторов способствует значительному снижению токов утечек по сравнению с обычными «плоскими» (планарными) транзисторами. Как следствие, использование трёхмерных транзисторов снижает энергопотребление микросхем, что даст возможность создавать мощные графические процессоры с низким потреблением, или же серьёзно увеличить тактовые частоты высокопроизводительных GPU.

Существенное уменьшение энергопотребления при сохранении достойного уровня производительности позволит партнёрам AMD создавать миниатюрные графические карты для игровых ПК, а также сверхтонкие ноутбуки с высокой производительностью в играх. Хотя адаптеры вроде AMD Radeon R9 Nano являются нишевыми решениями, они дают возможность строить уникальные системы, что потенциально может увеличить выручку AMD.

AMD Polaris: Преимущества FinFET

AMD Polaris: Преимущества FinFET

К сожалению, стоимость проектирования микросхем на базе трёхмерных транзисторов примерно вдвое дороже стоимости создания чипов на основе планарных транзисторов. Некоторые аналитики полагают, что инвестиции в проектирование крупной FinFET-системы на кристалле составляет около $150 млн без учёта стоимости разработки программного обеспечения, контролирующего работу такого процессора. Как следствие, хотя GPU на базе FinFET обещают существенное снижение энергопотребления и производительности, компании-разработчики будут вынуждены сократить количество проектируемых кристаллов из-за экономических соображений.

Первые GPU семейства Polaris появятся в середине года

Из неофициальной информации, опубликованной различными источниками за последний год известно, что компания AMD планирует выпустить в 2016 году как минимум три новых графических процессора для настольных ПК — Greenland, Baffin, Ellesmere. В рамках сегодняшнего анонса AMD не раскрывает подробности о новых GPU или же точного графика анонсов.

AMD Polaris: Новые форм-факторы

AMD Polaris: Новые форм-факторы

Advanced Micro Devices утверждает, что первые графические процессоры Radeon на основе GCN четвёртого поколения появятся на рынке в середине 2016 г. Учитывая, что обычно компания выпускает в первую очередь флагман семейства, логично ожидать повторения такого сценария и в этот раз.

Тем не менее, судя по тому, что AMD демонстрирует результаты тестирования одной из графических карт на базе архитектуры Polaris в сравнении с NVIDIA GeForce GTX 950, компания уже имеет на руках рабочие образцы не только самого мощного, но и недорого GPU из указанного семейства.

AMD Polaris: Ожидаемая производительность

AMD Polaris: Ожидаемая производительность

Хотя производительность графических карт росла довольно быстрыми темпами в последние несколько лет, нельзя сказать, что сами возможности GPU существенно расширились в последние годы. Архитектура AMD Polaris поменяет эту ситуацию, одновременно увеличив скорость в играх, обеспечив новую функциональность и большую гибкость в энергопотреблении.

AMD продолжит пользоваться услугами GlobalFoundries и TSMC

Advanced Micro Devices традиционно пользовалась услугами GlobalFoundries и Taiwan Semiconductor Manufacturing Co. для производства своих микросхем. В обозримом будущем компания продолжит работать с обоими контрактными производителями, однако значение взаимодействия с GlobalFoundries будет расти.

Исторически сложилось так, что GlobalFoundries производила для AMD центральные процессоры (central processing units, CPUs) и мощные гибридные процессоры (accelerated processing units, APUs), а TSMC занималась изготовлением графических чипов и недорогих APU. Подобное разделение было логичным, поскольку GlobalFoundries использовала специализированные технологические процессы для изготовления CPU и APU для AMD. В то же время, команда инженеров-проектировщиков GPU из ATI Technologies имела длительный опыт работы с TSMC.

В последние годы ситуация стала меняться. Системы на кристалле (system-on-chips, SoCs) для игровых консолей Microsoft Xbox One и Sony PlayStation 4 производятся как TSMC, так и GlobalFoundries. Часть заказов на графические процессоры (graphics processing units, GPUs) также перешла компании GlobalFoundries.

Обработанная TSMC 300-мм кремниевая подложка

Обработанная TSMC 300-мм кремниевая подложка

Это не означает, что GlobalFoundries может получить все заказы AMD: разработчик микросхем продолжит пользоваться услугами обоих партнёров. В следующем году Advanced Micro Devices будет продавать различные микросхемы, произведённые по 14-нм технологии (14LPP) GlobalFoundries/Samsung, а также 16-нм процессу TSMC (CLN16FF+). Как 14LPP, так и CLN16FF+ используют транзисторы с вертикально расположенным затвором (fin-shaped field-effect transistor, FinFET).

«Исторически мы использовали как TSMC, так и GlobalFoundries, и мы продолжим работать с обоими производителями», — сказала Лиза Су (Lisa Su), исполнительный директор AMD, на ежегодной конференции по технологиям, медиа и телекоммуникациям инвестиционного банка Credit Suisse. «Мы используем 16-нм и 14-нм технологии TSMC и GF [для новых продуктов]. Мы очень довольны результатом у обоих контрактных производителей микросхем».

Микросхема AMD

Микросхема AMD

Одним из конкурентных преимуществ TSMC перед практически всеми контрактными производителями чипов — помимо возможностей производства интегральных схем в гигантских объёмах — является колоссальный опыт в изготовлении микросхем огромного размера. Компания отлично справилась с производством таких гигантов, как AMD Fiji (площадь ядра 596 мм², 8,9 млрд транзисторов на 28 нм), NVIDIA GM200 (площадь ядра 601 мм², 8 млрд транзисторов на 28 нм) и Oracle SPARC M7 (площадь ядра неизвестна, более 10 млрд транзисторов на 20 нм). Кроме того, TSMC предлагает услуги по упаковке и тестированию микросхем, чего не предлагают другие контрактные производители.

Хотя TSMC — неоспоримый лидер рынка контрактного производства чипов, услуги компании обходятся дороже, чем услуги конкурентов. Последнее особенно заметно в случае с новейшими и наиболее продвинутыми технологическими процессами. Именно поэтому многие компании стараются размещать заказы у GlobalFoundries и Samsung Foundry в дополнение к TSMC.

Обработанные GlobalFoundries 300-мм кремниевые подложки

Обработанные GlobalFoundries 300-мм кремниевые подложки

Очень конкурентоспособные цены GlobalFoundries, а также предполагаемый рост продаж микропроцессоров AMD в конце 2016 и в 2017 году, будут означать, что роль GF в бизнесе AMD будет расти.

«Я бы сказала, что наши отношения с GlobalFoundries крепки и будут становиться крепче», — сказала госпожа Су.

Учитывая тот факт, что GlobalFoundries, судя по неофициальным данным, будет эксклюзивным производителем процессоров Summit Ridge и Raven Ridge на базе микроархитектуры Zen, компания станет крайне важным партнёром для AMD. По сути, от способности GF обеспечить высокий выход годных кристаллов и высокую тактовую частоту вышеупомянутых микросхем во многом зависит конкурентоспособность AMD. Неудивительно, что значение GlobalFoundries для AMD вырастет в ближайший год.

Появились первые сведения о модельном ряде процессоров NVIDIA Pascal

Популярный немецкий ресурс 3DCenter опубликовал любопытную информацию, которая, несмотря на статус неофициальной, может представлять определённый интерес. В последней версии драйверов NVIDIA энтузиасты обнаружили новые данные, которые могут указывать на названия нового модельного ряда графических процессоров, базирующихся на микроархитектуре Pascal. Напомним, ранее в драйверах NVIDIA уже были замечены следы поддержки Pascal и Volta. Согласно новым данным, всего найдено шесть наименований, из чего можно сделать вывод, что NVIDIA планирует заместить всю линейку Maxwell в течение определённого временного периода. Итак, вот что обнаружили наши немецкие коллеги:

  • GP100: флагман семейства, 17 миллиардов транзисторов, 16 Гбайт HBM2, техпроцесс TSMC 16FF+;
  • GP102: нет данных; предположительно —  аналог GeForce GTX 980 Ti в сравнении с TITAN X;
  • GP104: высокопроизводительный процессор второго эшелона, замена GM204;
  • GP106: производительный процессор третьего эшелона, замена GM206;
  • GP107: массовый процессор, замена GM107;
  • GP108: процессор начального уровня, замена GM108;
  • GV100: архитектура Volta; скорее всего, замена GP100, до 64 Гбайт памяти, вероятен 10-нм техпроцесс.
Основные особенности архитектуры GP100

Основные особенности архитектуры GP100

Наибольший интерес представляет, пожалуй, чип GP102, про который не известно практически ничего. Вполне возможно, что это может быть некая усечённая версия GP100, но усечённая в чём? Вариантов не так много: либо в количестве функциональных блоков: процессоров CUDA и текстурных модулей, либо в вычислительных возможностях в режиме двойной точности. Можно также предположить, что данный вариант рассчитан на использование памяти GDDR5X вместо HBM2, ведь она также обладает высокой пропускной способностью, достаточной даже для игровой карты высшего класса, рассчитанной на разрешение 3840 × 2160. Точный ответ на этот вопрос даст лишь время. Напомним, что приведённые сведения пока следует относить к категории слухов и предположений и относиться к ним с достаточной долей скептицизма.

Прогнозы NVIDIA в области роста производительности графических процессоров

Прогнозы NVIDIA в области роста производительности графических процессоров

Остальные наименования не вызывают удивления и выглядят довольно логично: практически каждый процессор Maxwell получает соответствующую ему по ценовому диапазону (но не по производительности) замену в виде чипа Pascal. Относительно флагмана в лице GP100 существует ещё одно предположение: количество транзисторов, входящих в его состав, вдвое превышает таковое у GM200. С поправкой на более тонкий техпроцесс можно предположить площадь кристалла в районе 520‒550 квадратных миллиметров. В этом пространстве можно разместить приблизительно 5‒6 тысяч ядер CUDA. С учётом прочих архитектурных оптимизаций следует ожидать прироста производительности порядка 60‒80 %, что сделает новое решение NVIDIA первой в мире однопроцессорной графической картой, способной обеспечивать не менее 60 кадров в секунду в разрешении 3840 × 2160 даже в самых современных играх.

NVIDIA начинает добавлять поддержку графических процессоров Pascal и Volta в драйверы

Корпорация NVIDIA начала добавлять поддержку графических процессоров на базе архитектур следующих поколений в свои драйверы. Судя по всему, компания хочет, чтобы разработчики, занятые в создании программного обеспечения для суперкомпьютеров, начинали писать приложения с учётом возможностей архитектур Pascal и Volta. Готовность ПО позволит партнёрам компании начать использовать GPU на базе новых архитектур, как только они появятся на рынке.

Драйверы NVIDIA GeForce версии 358.66 содержат среду выполнения (runtime) OpenCL с поддержкой графических процессоров NVIDIA с унифицированной архитектурой шестого (Pascal) и седьмого (Volta) поколений. Для графических процессоров Pascal поддерживаются три набора вычислительных возможностей — D__CUDA_ARCH__=600, -D__CUDA_ARCH__=610 и -D__CUDA_ARCH__=620 — что говорит о том, что разные GPU данного поколения будут поддерживать разную функциональность. Для графических чипов на базе архитектуры Volta пока включена поддержка базового набора возможностей — -D__CUDA_ARCH__=700.

Кроме того, эти же драйверы содержат среду выполнения для интерфейса программирования приложений (application programming interface, API) Vulkan — nv-vk32.dll — согласно данным сайта Laptopvideo2Go, известного своими исследованиями в области драйверов.

Обновлённый перспективный план NVIDIA

Обновлённый перспективный план NVIDIA

Учитывая, что поддержка определённой функциональности графических процессоров на базе архитектур Pascal и Volta пока упоминается только в среде выполнения OpenCL, очевидно, что NVIDIA хочет, чтобы разработчики ПО в первую очередь задействовали новые вычислительные возможности упомянутых GPU. Последнее очень полезно для программистов, создающих приложения для суперкомпьютеров. При наличии у создателей ПО средств для разработки с поддержкой Pascal и Volta, они могут уже сейчас создавать приложения, которые будут учитывать возможности новых архитектур NVIDIA.

В настоящее время область высокопроизводительных вычислений (high-performance computing, HPC) является крайне важным рынком сбыта для мощных графических процессоров. AMD, Intel и NVIDIA ежегодно продают сотни тысяч ускорителей FirePro, Tesla и Xeon Phi для HPC. По планам NVIDIA, ускорители на основе Pascal и Volta будут использованы в суперкомпьютерах Summit и Sierra с производительностью в 150–300 квадриллионов (Пфлопс, PetaFLOPS) операций с плавающей запятой в секунду (floating-point operations per second, FLOPS).

Нововведения NVIDIA Pascal

Нововведения NVIDIA Pascal

Согласно неофициальной информации, NVIDIA уже располагает работающими образцами графических карт на основе GP100 — первого и самого мощного GPU на базе архитектуры Pascal первого поколения. Как ожидается, данный процессор станет основной для будущих графических ускорителей семейств GeForce GTX Titan/GTX Ti и Quadro P5000/P6000. Кроме того, GP100 и его специализированные версии будут использованы для ускорителей Tesla следующих поколений. Среди ключевых инноваций Pascal — полностью новая вычислительная архитектура с поддержкой разной точности вычислений (FP16, FP32, FP64); поддержка многослойной памяти HBM (high-bandwidth memory); новая функциональность в области работы с графикой; интеграция шины NVLink, которая ускорит работу ускорителей Tesla в составе суперкомпьютеров, а также графических подсистем из нескольких GPU. NVIDIA GP100 будет производиться компанией Taiwan Semiconductor Manufacturing Co. при помощи технологии 16 нм FinFET+ (CLN16FF+).

Графические процессоры NVIDIA на базе архитектуры Volta попадут на рынок в 2018 году, согласно недавно опубликованному перспективному плану компании. Ожидается, что новые GPU будут производится с использованием технологии 10 нм, а также обладать более совершенной функциональностью и высокой производительностью по сравнению с Pascal.

NVIDIA GeForce GTX

NVIDIA GeForce GTX

Драйверы NVIDIA GeForce версии 358.66 недоступны от NVIDIA, но их можно скачать c сервиса Windows Update. Сборка драйвера GeForce версии 358.66 датирована 14 октября, что говорит о том, что компания начала добавление поддержки Pascal, Volta и Vulkan в программное обеспечение, доступное партнёрам, относительно недавно. Поскольку появившийся драйвер рассчитан на 32-разрядные операционные системы Microsoft Windows, едва ли он представляет серьёзный интерес для энтузиастов высокопроизводительных ПК, которые уже давно использует 64-разрядные ОС.

TSMC: Мы закончим разработку 10-нм техпроцесса в этом квартале

Taiwan Semiconductor Manufacturing Co. заморозит разработку технологического процесса 10 нм в этом квартале и начнёт опытное производство микросхем, используя данную технологию, следующей весной. Хотя компания едва ли будет готова начать массовое производство 10-нм систем на кристалле уже в конце следующего года, это не вызовет проблем, поскольку клиенты TSMC не заинтересованы в столь скором использовании технологии.

«Разработка технологического процесса 10 нм идёт по плану», — сказал Марк Ли (Mark Liu), президент и соисполнительный директор TSMC, в ходе телеконференции с инвесторами и финансовыми аналитиками. «В этом квартале мы заморозим техпроцесс и начнём квалификацию технологии. Опытное производство первых продуктов для клиентов начнётся следующей весной».

Ранее в этом году TSMC продемонстрировала 300-мм кремниевую подложку с 256-Мбайт интегральными схемами памяти SRAM, обработанную с использованием 10-нм процесса изготовления полупроводников (CLN10FF). Кроме того, компания успешно произвела аттестационную модель микросхемы (validation vehicle) с четырьмя ядрами ARM Cortex-A57, межблочными соединениями и другими элементами, используя ту же технологию. Судя по всему, технологический процесс 10 нм почти готов, компании остаётся лишь зафиксировать все параметры, чтобы дать возможность клиентам завершить свои проекты.

Микросхемы, произведённые TSMC

Микросхемы, произведённые TSMC

В настоящее время TSMC уже располагает опытной линией производства для своей 10-нм технологии в комплексе Fab 15 (находится около города Синьчжу на Тайване). Как только инженеры компании завершат разработку технологического процесса, клиенты компании смогут закончить свои проекты и начать опытное производство микросхем.

Технологический процесс 10 нм компании TSMC — полностью новая технология производства полупроводников, которая не использует элементов имеющихся технологий. CLN10FF продолжит использовать транзисторы с вертикально расположенным затвором (fin-shaped field-effect transistors, FinFETs).

Согласно планам компании, CLN10FF увеличит плотность транзисторов в 2,1 раза (на 110 %) по сравнению с технологией 16 нм FinFET+ (CLN16FF+), что даст возможность производить с её помощью микросхемы невиданной сложности, с количеством транзисторов от 25 миллиардов и более. По сравнению с CLN16FF+ частотный потенциал чипов, произведённых по CLN10FF, вырастет на 20 % при постоянном энергопотреблении, а потребление энергии упадёт на 40 % при схожей сложности и тактовой частоте микросхемы.

TSMC fab 15

Производственный комплекс TSMC fab 15

Хотя технологический процесс 10 нм компании TSMC почти готов, компания не будет пытаться во что бы то ни стало начать массовое производство соответствующих микросхем как можно быстрее. Учитывая, что от начала производства первых образцов микросхем до их массового изготовления проходит год, то маловероятно, что TSMC сможет начать использовать 10-нм техпроцесс для коммерческих продуктов в конце 2016 г. Если опытное использование технологии начнётся весной 2016 г., то первые массовые 10-нм чипы начнут производиться лишь весной 2017 г.

«Мы говорили, что хотим дать возможность клиентам начать производить [10-нм интегральные схемы] в конце 2016 года», — сказал господин Ли. «Однако первый клиент, который есть у нас, решил пойти по осторожному пути и не стал устанавливать агрессивный план. Они установили свой график [производства] 10-нм [микросхем] в соответствии со своим перспективным планом [по выпуску продукции]. Этот план не менялся, a мы продолжаем разрабатывать технологию, чтобы изготовлять лучшие 10-нм чипы в соответствии с [их] графиком».

Судя по всему, абсолютное большинство клиентов TSMC в ближайшие годы продолжат использовать различные 16-нм технологии производства полупроводников. Флагманские микросхемы будут производиться при помощи технологии 16 нм FinFET Compact (CLN16FFC), а чипы попроще изготовляться при помощи CLN16FF+.

Внутри производственного комплекса TSMC fab 14

Внутри производственного комплекса TSMC fab 14

Судя по комментариям руководства компании, TSMC не планирует создание версии 10-нм технологии производства микросхем, которая бы использовала литографические сканеры, работающие в диапазоне EUV (extreme ultraviolet — излучение с длиной волны 13,5 нм), для критических слоёв. Применение EUV могло бы позволить отказаться от дорогостоящих технологий мульти-паттернинга, что удешевило бы проектирование и производство микросхем. Однако неготовность оборудования ставит крест на подобных планах, которые озвучивались ранее.

Главный конкурент TSMC — Samsung Foundry — также показывала 300-мм подложку, обработанную при помощи 10-нм технологии, ранее в этом году. Согласно публично известным планам компании, Samsung намеревается начать изготовление 10-нм микросхем в конце 2016 г. GlobalFoundries разрабатывает 10-нм процесс производства полупроводников и пока не обнародовала планов по его использованию. Intel планирует начать производство 10-нм микросхем во второй половине 2017 года.

TSMC завершает разработку третьего поколения 16-нм FinFET-техпроцессов

Taiwan Semiconductor Manufacturing Co. объявила о том, что разработка двух дополнительных технологических процессов, которые базируются на транзисторах с вертикально расположенным затвором (fin-shaped field-effect transistors, FinFETs), почти завершена. Две новые технологии относятся к классу 16 нм и предполагают дальнейшее снижение энергопотребления по сравнению с имеющимися. Кроме того, одна из технологий позволяет уменьшить размеры кристалла.

Ранее известные как 16-нм ULP [ultra-low power], технологические процессы 16 нм FinFET Compact (CLN16FFC) предназначены для производства микросхем со сверхнизким энергопотреблением, высокой плотностью транзисторов и высокой производительностью. Минимальное напряжение питания чипов, построенных при помощи CLN16FFC, будет равняться 0,55 В, что позволит создавать интегральные схемы со сверхнизким потреблением для носимых и Internet-of-things (IoT) устройств. Технологические характеристики CLN16FFC позволят производить с их помощью схемы с большим количеством транзисторов и умеренным энергопотреблением, что будет полезно для сложных мобильных систем на кристалле, графических и центральных процессоров.

Кремниевые подложки с микросхемами, произведённые TSMC

Кремниевые подложки с микросхемами, произведённые TSMC

TSMC предложит клиентам две версии техпроцесса CLN16FFC: одна будет обладать плотностью транзисторов, сравнимой с технологическими процессами 16 нм FinFET (CLN16FF) и 16 нм FinFET+ (CLN16FF+); вторая будет предлагать увеличенную плотность транзисторов, что позволит уменьшить размеры микросхем. Судя по всему, все технологические процессы CLN16FF используют металлические межблочные соединения (back end of line, BEOL), разработанные для 20-нм технологического процесса TSMC (CLN20SOC). Однако в определённых случаях компании удалось добиться увеличения плотности транзисторов за счёт разного рода оптимизаций (в частности, уменьшения размеров ячеек SRAM, допустимых минимальных параметров соединений и т. п.), не влияющих существенно на правила проектирования и технологию изготовления. Тем не менее, чтобы произвести микросхему, спроектированную для CLN16FF+, при помощи новой технологии, некоторые элементы чипов придётся перепроектировать. Помимо прочего, CLN16FFC позволит немного сократить цикл производства FinFET-микросхем, который составляет сейчас 90 и более дней.

«Сегодня мы завершили первый этап [тестирования] CLN16FFC и получили хороший результат», — сказал Марк Ли (Mark Liu), президент и соисполнительный директор TSMC, в ходе телефонной конференции с инвесторами и финансовыми аналитиками. «До конца 2016 года мы произведём в кремнии около 100 проектов от 40 клиентов по техпроцессам CLN16FF+ и CLN16FFC, включая микросхемы для мобильных телефонов, сетевого оборудования, программируемых матриц и графических карт. Мы считаем, что наш 16-нм портфель [технологий], в том числе [технологии] CLN16FF+ и CLN16FFC, является весьма конкурентоспособным».

Специалист TSMC держит в руках фотомаску

Специалист TSMC держит в руках фотомаску

TSMC не раскрывает сроков начала производства микросхем по технологическим процессам CLN16FFC. Учитывая, что набор для проектирования чипов по данному техпроцессу стал доступен в середине этого года, есть вероятность, что первые клиенты смогут получить «компактные» 16-нм схемы изготовленные TSMC в конце 2016 – начале 2017 года.

«Наш первоначальный график [выпуска CLN16FFC микросхем] на самом деле упоминал 2017 год, но мы могли бы ускорить, поскольку сейчас мы имеем две версии CLN16FFC», — сказал Си Си Вей (C.C. Wei), президент и соисполнительный директор TSMC. «Один из них сокращает размеры, второй нет».

В «чистой комнате» производственного комплекса TSMC Fab 14

В «чистой комнате» производственного комплекса TSMC Fab 14

Хотя планы TSMC в области техпроцесса CLN16FFC не до конца ясны, как не полностью понятны технические характеристики технологии, но довольно очевидно, что семейство 16-нм техпроцессов останется на рынке на очень долгий срок. Очень вероятно, что целый ряд клиентов Taiwan Semiconductor Manufacturing Co. предпочтут использовать в 2017 году опробованные технологические нормы CLN16FFC вместо нового и слабо известного им технологического процесса с транзисторным затвором 10 нм (CLN10FF).

window-new
Soft
Hard
Тренды 🔥