Forth
http://fforum.winglion.ru/

Загрузить 100 ядер на видеокарте.
http://fforum.winglion.ru/viewtopic.php?f=2&t=2294
Страница 1 из 7

Автор:  Sotnik [ Вт окт 13, 2009 11:36 ]
Заголовок сообщения:  Загрузить 100 ядер на видеокарте.

Тут много было сказано про модные ныне загрузки сотен ядер одной задачей.
Перемывались косточки различных железяк уже существующих и ожидаемых.
А "под боком" существующие многоядерные конструкции видеокарт
(да, убогие но их много) :) с нехилой производительностью. И фортом не поддерживаются!?

Вот пару ссылок, хоть и староваты они.
http://forums.overclockers.ru/viewtopic ... 2&start=60

NVIDIA анонсирует Tesla: ускорение расчётов силами видеочипов
http://www.overclockers.ru/hardnews/26013.shtml

Программы для перебора паролей RAR на GPU
http://www.password-crackers.ru/blog/?p=52

И ещё новое 20-10-2009: http://overclockers.ru/hardnews/34657.shtml
* Radeon HD 5770 -> $159, 10 SIMD блоков, 800 потоковых процессоров, 40 блоков выборки и фильтрации текстур, 16 блоков ROP, 128-битная шина памяти, тактовая частота ядра – 850 МГц, тактовая частота памяти GDDR5 – 1200 МГц (эффективная – 4800 МГц), энергопотребление в простое - 18 Вт, под нагрузкой - 108 Вт;
* Radeon HD 5750 -> $109-129, 9 SIMD блоков, 720 потоковых процессоров, 36 блоков выборки и фильтрации текстур, 16 блоков ROP, 128-битная шина памяти, тактовая частота ядра – 700 МГц, тактовая частота памяти GDDR5 – 1150 МГц (эффективная – 4600 МГц), энергопотребление в простое - 16 Вт, под нагрузкой - 86 Вт.

Автор:  garbler [ Вт окт 13, 2009 12:02 ]
Заголовок сообщения: 

вот портал http://gpgpu.org/ на котором собирают информацию по программированию общих вычислений на видеокартах.
тут и статьи и библиотеки и специализированные языки программирования....

Автор:  chess [ Вт окт 13, 2009 12:15 ]
Заголовок сообщения: 

Sotnik писал(а):
NVIDIA анонсирует Tesla: ускорение расчётов силами видеочипов

Стоимость высокопроизводительных новинок составляет $12000, $1499 и $7500 для решений Tesla S870, D870 и C870 соответственно.
Дороговато будет для рядовых-то пользователей.

Автор:  Hishnik [ Вт окт 13, 2009 15:41 ]
Заголовок сообщения: 

Sotnik писал(а):
А "под боком" существующие многоядерные конструкции видеокарт
(да, убогие но их много) с нехилой производительностью. И фортом не поддерживаются!?

Вопрос довольно неоднозначный. Речь идет о программировании интерфейса к драйверам, или о программировании непосредственно ядер? Если ядер, так они ведь сильно разные для разных чипов (в Intel Larrabee вообще P54, т.е. Pentium). А к интерфейсу GPU можно легко получить доступ через соответствующий драйвер.

Автор:  Sotnik [ Вт окт 13, 2009 16:03 ]
Заголовок сообщения: 

garbler писал(а):
вот портал http://gpgpu.org/ на котором собирают информацию по программированию общих вычислений на видеокартах.
тут и статьи и библиотеки и специализированные языки программирования....

Я имел в виду наш форум и наши форт системы. :)
А там есть Фортран. :(

Автор:  Sotnik [ Вт окт 13, 2009 16:05 ]
Заголовок сообщения: 

chess писал(а):
Sotnik писал(а):
NVIDIA анонсирует Tesla: ускорение расчётов силами видеочипов

Стоимость высокопроизводительных новинок составляет $12000, $1499 и $7500 для решений Tesla S870, D870 и C870 соответственно.
Дороговато будет для рядовых-то пользователей.

Есть и попроще в цене и в быстродействии. И дешеветь будут.
Я про ФОРТ подстроить под это дело. :)

Автор:  Sotnik [ Вт окт 13, 2009 16:15 ]
Заголовок сообщения: 

Хищник писал(а):
Вопрос довольно неоднозначный. Речь идет о программировании интерфейса к драйверам, или о программировании непосредственно ядер? Если ядер, так они ведь сильно разные для разных чипов (в Intel Larrabee вообще P54, т.е. Pentium). А к интерфейсу GPU можно легко получить доступ через соответствующий драйвер.

Ядра, какие бы они ни были, и без посредников. Мощность по любому зверская. :)
Напрямую ими порулить - как на примере многоядерного S40C18.

В ПЛИС с успехом запихнули фортовский 32-х битник.
А уменьшив его ресурс сделать 8-ми ядерник возможно? :D
Вижу что у S40C18 есть некие проблемы с патентами.
И начинать осваивать многозадачность на нём опасно.

Автор:  Hishnik [ Вт окт 13, 2009 17:54 ]
Заголовок сообщения: 

Sotnik писал(а):
Ядра, какие бы они ни были, и без посредников. Мощность по любому зверская.
Напрямую ими порулить - как на примере многоядерного S40C18.

Основа графических преобразований - операции над матрицами 4x4. Если посмотреть сведения о GPU, именно такие алгоритмы на них и получаются достаточно хорошо. Мощность-то зверская... но примерно как у Камаза, груженного DVD - скорость передачи данных огромная, но кому и для чего это надо, не вполне понятно :)
Sotnik писал(а):
В ПЛИС с успехом запихнули фортовский 32-х битник.
А уменьшив его ресурс сделать 8-ми ядерник возможно?

В самой большой из доступных мне ПЛИС помещается штук 50 32-разрядных форт-процессоров :) "Самая большая из доступных мне" <> "самая большая из существующих". Восемь ядер поместятся даже в каком-нибудь starter kit.

Автор:  forther [ Вт окт 13, 2009 18:08 ]
Заголовок сообщения: 

Sotnik писал(а):
Вижу что у S40C18 есть некие проблемы с патентами.
И начинать осваивать многозадачность на нём опасно.

Это какие же у него проблемы с патентами?

Автор:  Sotnik [ Вт окт 13, 2009 18:24 ]
Заголовок сообщения: 

forther писал(а):
Sotnik писал(а):
Вижу что у S40C18 есть некие проблемы с патентами.
И начинать осваивать многозадачность на нём опасно.

Это какие же у него проблемы с патентами?

Тут на одном из форумов про это упоминалось.
Меня это удивило - Мур и какие-то споры про его технологии... :(

Автор:  Sotnik [ Вт окт 13, 2009 18:34 ]
Заголовок сообщения: 

Хищник писал(а):
Мощность-то зверская... но примерно как у Камаза, груженного DVD - скорость передачи данных огромная, но кому и для чего это надо, не вполне понятно :)
:) :) :)
Хищник писал(а):
В самой большой из доступных мне ПЛИС помещается штук 50 32-разрядных форт-процессоров :) "Самая большая из доступных мне" <> "самая большая из существующих". Восемь ядер поместятся даже в каком-нибудь starter kit.

Предположим - восемь ядер по 50 МГц в ПЛИС за $20 - так?
Вот если бы они имели КАЖДЫЙ возможность работать с любым внешним портом
(про конфликты самому надо думать), независимость друг от друга (только общий
базовый словарь, например) и некий семафор или общее ОЗУ - и больше не надо.
Я понимаю что ты собаку на этом деле съел - какова твоя концепция? :)

Автор:  WingLion [ Вт окт 13, 2009 19:12 ]
Заголовок сообщения: 

Sotnik писал(а):
Предположим - восемь ядер по 50 МГц в ПЛИС за $20 - так?


Скорее за 120$, за 20$ влезет только одно 32-битное ядро (если судить по ПЛИС ф. ALTERA)

п.с. это если по Питерским ценам

Автор:  Hishnik [ Вт окт 13, 2009 19:19 ]
Заголовок сообщения: 

Sotnik писал(а):
Предположим - восемь ядер по 50 МГц в ПЛИС за $20 - так?

Порядок цен примерно такой, хотя если именно восемь ядер, то может получиться и 30-40$.
Sotnik писал(а):
Вот если бы они имели КАЖДЫЙ возможность работать с любым внешним портом
(про конфликты самому надо думать), независимость друг от друга (только общий
базовый словарь, например) и некий семафор или общее ОЗУ - и больше не надо.
Я понимаю что ты собаку на этом деле съел - какова твоя концепция?

Вообще, на сегодня мы предпочитаем гарвардскую архитектуру, со своей памятью программ под каждое ядро. Память данных можно опять же уникальную, но можно и общую, на шине с арбитром. Периферия опять-таки или общая, или выделенная для каждого ядра. Тут можно много и со вкусом думать, но главное - один раз нарисованная архитектура не является жестко закрепленной. На сегодняшний день все больше проявляется тенденция к проектированию "от задачи" - вместо того, чтобы ставить на кристалл всего и побольше, а потом думать, "как теперь со всем этим взлететь", появляются средства проектирования, которые откладывают собственно изготовление чипа до момента, когда все уже максимально проверено, отмакетировано в ПЛИС, и желательно уже получено согласие покупателей. ПЛИС как раз и является способом проверять разные концепции в свое удовольствие.
Навскидку по способу связи ядер:
- общая шина с арбитром (на шине память данных и периферия);
- матрица (локальные связи между соседями с помощью mailbox-ов - двунаправленное FIFO);
- выделенная периферия/память для ядра, занимающегося чем-то ответственным;
- комбинация перечисленного: например, обработка процессов в реальном времени выполняется выделенными ядрами, имеющими монопольный доступ к соответствующей периферии, выводом на диск заведует опять-таки отдельное ядро (во избежание путаницы), часть ядер образует матрицу для massively-parallel processing, а парочка сидит на общей шине и за всем этим наблюдает.
Важно, что это не надо делать "на вырост". Рисовать архитектуру можно и нужно под конкретный проект.

Автор:  Hishnik [ Вт окт 13, 2009 19:31 ]
Заголовок сообщения: 

WingLion писал(а):
Скорее за 120$, за 20$ влезет только одно 32-битное ядро (если судить по ПЛИС ф. ALTERA)

Что-то много. Вот я смотрю S3AN700 - около 14 тысяч ячеек, на ядро (proteus-32) надо около 600. Тут мы уже упремся в блоки памяти, которых 20, и желательно по блоку отдать на программу и данные. Ну пусть даже 16 ядер с 2к памяти на каждое, плюс 4 оставшихся блока дают 8 кб на общей шине. И стоит это удовольствие чуть меньше 50$. Вобщем, получается что-то вроде 3$/ядро. Кстати, жду звонка из Fastwell - нам две такие платы в формате микромодуля уже монтируют :)

Автор:  forther [ Вт окт 13, 2009 19:51 ]
Заголовок сообщения: 

Sotnik писал(а):
forther писал(а):
Sotnik писал(а):
Вижу что у S40C18 есть некие проблемы с патентами.
И начинать осваивать многозадачность на нём опасно.

Это какие же у него проблемы с патентами?

Тут на одном из форумов про это упоминалось.
Меня это удивило - Мур и какие-то споры про его технологии... :(

Это не про собственно технологии споры. А про то, как поделить деньги от продажи лицензий на технологии. И относятся эти технологии больше к армам/пентиумам, чем к S40C18. Так что кончайте вы с этими пентиумами заниматься. Опасно!

Ну или пытайтесь понимать то, что читаете.

Страница 1 из 7 Часовой пояс: UTC + 3 часа [ Летнее время ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/