Forth http://fforum.winglion.ru/ |
|
Загрузить 100 ядер на видеокарте. http://fforum.winglion.ru/viewtopic.php?f=2&t=2294 |
Страница 1 из 7 |
Автор: | Sotnik [ Вт окт 13, 2009 11:36 ] |
Заголовок сообщения: | Загрузить 100 ядер на видеокарте. |
Тут много было сказано про модные ныне загрузки сотен ядер одной задачей. Перемывались косточки различных железяк уже существующих и ожидаемых. А "под боком" существующие многоядерные конструкции видеокарт (да, убогие но их много) с нехилой производительностью. И фортом не поддерживаются!? Вот пару ссылок, хоть и староваты они. http://forums.overclockers.ru/viewtopic ... 2&start=60 NVIDIA анонсирует Tesla: ускорение расчётов силами видеочипов http://www.overclockers.ru/hardnews/26013.shtml Программы для перебора паролей RAR на GPU http://www.password-crackers.ru/blog/?p=52 И ещё новое 20-10-2009: http://overclockers.ru/hardnews/34657.shtml * Radeon HD 5770 -> $159, 10 SIMD блоков, 800 потоковых процессоров, 40 блоков выборки и фильтрации текстур, 16 блоков ROP, 128-битная шина памяти, тактовая частота ядра – 850 МГц, тактовая частота памяти GDDR5 – 1200 МГц (эффективная – 4800 МГц), энергопотребление в простое - 18 Вт, под нагрузкой - 108 Вт; * Radeon HD 5750 -> $109-129, 9 SIMD блоков, 720 потоковых процессоров, 36 блоков выборки и фильтрации текстур, 16 блоков ROP, 128-битная шина памяти, тактовая частота ядра – 700 МГц, тактовая частота памяти GDDR5 – 1150 МГц (эффективная – 4600 МГц), энергопотребление в простое - 16 Вт, под нагрузкой - 86 Вт. |
Автор: | garbler [ Вт окт 13, 2009 12:02 ] |
Заголовок сообщения: | |
вот портал http://gpgpu.org/ на котором собирают информацию по программированию общих вычислений на видеокартах. тут и статьи и библиотеки и специализированные языки программирования.... |
Автор: | chess [ Вт окт 13, 2009 12:15 ] |
Заголовок сообщения: | |
Sotnik писал(а): NVIDIA анонсирует Tesla: ускорение расчётов силами видеочипов
Стоимость высокопроизводительных новинок составляет $12000, $1499 и $7500 для решений Tesla S870, D870 и C870 соответственно. Дороговато будет для рядовых-то пользователей. |
Автор: | Hishnik [ Вт окт 13, 2009 15:41 ] |
Заголовок сообщения: | |
Sotnik писал(а): А "под боком" существующие многоядерные конструкции видеокарт
(да, убогие но их много) с нехилой производительностью. И фортом не поддерживаются!? Вопрос довольно неоднозначный. Речь идет о программировании интерфейса к драйверам, или о программировании непосредственно ядер? Если ядер, так они ведь сильно разные для разных чипов (в Intel Larrabee вообще P54, т.е. Pentium). А к интерфейсу GPU можно легко получить доступ через соответствующий драйвер. |
Автор: | Sotnik [ Вт окт 13, 2009 16:03 ] |
Заголовок сообщения: | |
garbler писал(а): вот портал http://gpgpu.org/ на котором собирают информацию по программированию общих вычислений на видеокартах.
тут и статьи и библиотеки и специализированные языки программирования.... Я имел в виду наш форум и наши форт системы. А там есть Фортран. |
Автор: | Sotnik [ Вт окт 13, 2009 16:05 ] |
Заголовок сообщения: | |
chess писал(а): Sotnik писал(а): NVIDIA анонсирует Tesla: ускорение расчётов силами видеочипов Стоимость высокопроизводительных новинок составляет $12000, $1499 и $7500 для решений Tesla S870, D870 и C870 соответственно. Дороговато будет для рядовых-то пользователей. Есть и попроще в цене и в быстродействии. И дешеветь будут. Я про ФОРТ подстроить под это дело. |
Автор: | Sotnik [ Вт окт 13, 2009 16:15 ] |
Заголовок сообщения: | |
Хищник писал(а): Вопрос довольно неоднозначный. Речь идет о программировании интерфейса к драйверам, или о программировании непосредственно ядер? Если ядер, так они ведь сильно разные для разных чипов (в Intel Larrabee вообще P54, т.е. Pentium). А к интерфейсу GPU можно легко получить доступ через соответствующий драйвер.
Ядра, какие бы они ни были, и без посредников. Мощность по любому зверская. Напрямую ими порулить - как на примере многоядерного S40C18. В ПЛИС с успехом запихнули фортовский 32-х битник. А уменьшив его ресурс сделать 8-ми ядерник возможно? Вижу что у S40C18 есть некие проблемы с патентами. И начинать осваивать многозадачность на нём опасно. |
Автор: | Hishnik [ Вт окт 13, 2009 17:54 ] |
Заголовок сообщения: | |
Sotnik писал(а): Ядра, какие бы они ни были, и без посредников. Мощность по любому зверская. Напрямую ими порулить - как на примере многоядерного S40C18. Основа графических преобразований - операции над матрицами 4x4. Если посмотреть сведения о GPU, именно такие алгоритмы на них и получаются достаточно хорошо. Мощность-то зверская... но примерно как у Камаза, груженного DVD - скорость передачи данных огромная, но кому и для чего это надо, не вполне понятно Sotnik писал(а): В ПЛИС с успехом запихнули фортовский 32-х битник.
А уменьшив его ресурс сделать 8-ми ядерник возможно? В самой большой из доступных мне ПЛИС помещается штук 50 32-разрядных форт-процессоров "Самая большая из доступных мне" <> "самая большая из существующих". Восемь ядер поместятся даже в каком-нибудь starter kit. |
Автор: | forther [ Вт окт 13, 2009 18:08 ] |
Заголовок сообщения: | |
Sotnik писал(а): Вижу что у S40C18 есть некие проблемы с патентами.
И начинать осваивать многозадачность на нём опасно. Это какие же у него проблемы с патентами? |
Автор: | Sotnik [ Вт окт 13, 2009 18:24 ] |
Заголовок сообщения: | |
forther писал(а): Sotnik писал(а): Вижу что у S40C18 есть некие проблемы с патентами. И начинать осваивать многозадачность на нём опасно. Это какие же у него проблемы с патентами? Тут на одном из форумов про это упоминалось. Меня это удивило - Мур и какие-то споры про его технологии... |
Автор: | Sotnik [ Вт окт 13, 2009 18:34 ] |
Заголовок сообщения: | |
Хищник писал(а): Мощность-то зверская... но примерно как у Камаза, груженного DVD - скорость передачи данных огромная, но кому и для чего это надо, не вполне понятно Хищник писал(а): В самой большой из доступных мне ПЛИС помещается штук 50 32-разрядных форт-процессоров "Самая большая из доступных мне" <> "самая большая из существующих". Восемь ядер поместятся даже в каком-нибудь starter kit.
Предположим - восемь ядер по 50 МГц в ПЛИС за $20 - так? Вот если бы они имели КАЖДЫЙ возможность работать с любым внешним портом (про конфликты самому надо думать), независимость друг от друга (только общий базовый словарь, например) и некий семафор или общее ОЗУ - и больше не надо. Я понимаю что ты собаку на этом деле съел - какова твоя концепция? |
Автор: | WingLion [ Вт окт 13, 2009 19:12 ] |
Заголовок сообщения: | |
Sotnik писал(а): Предположим - восемь ядер по 50 МГц в ПЛИС за $20 - так?
Скорее за 120$, за 20$ влезет только одно 32-битное ядро (если судить по ПЛИС ф. ALTERA) п.с. это если по Питерским ценам |
Автор: | Hishnik [ Вт окт 13, 2009 19:19 ] |
Заголовок сообщения: | |
Sotnik писал(а): Предположим - восемь ядер по 50 МГц в ПЛИС за $20 - так? Порядок цен примерно такой, хотя если именно восемь ядер, то может получиться и 30-40$. Sotnik писал(а): Вот если бы они имели КАЖДЫЙ возможность работать с любым внешним портом
(про конфликты самому надо думать), независимость друг от друга (только общий базовый словарь, например) и некий семафор или общее ОЗУ - и больше не надо. Я понимаю что ты собаку на этом деле съел - какова твоя концепция? Вообще, на сегодня мы предпочитаем гарвардскую архитектуру, со своей памятью программ под каждое ядро. Память данных можно опять же уникальную, но можно и общую, на шине с арбитром. Периферия опять-таки или общая, или выделенная для каждого ядра. Тут можно много и со вкусом думать, но главное - один раз нарисованная архитектура не является жестко закрепленной. На сегодняшний день все больше проявляется тенденция к проектированию "от задачи" - вместо того, чтобы ставить на кристалл всего и побольше, а потом думать, "как теперь со всем этим взлететь", появляются средства проектирования, которые откладывают собственно изготовление чипа до момента, когда все уже максимально проверено, отмакетировано в ПЛИС, и желательно уже получено согласие покупателей. ПЛИС как раз и является способом проверять разные концепции в свое удовольствие. Навскидку по способу связи ядер: - общая шина с арбитром (на шине память данных и периферия); - матрица (локальные связи между соседями с помощью mailbox-ов - двунаправленное FIFO); - выделенная периферия/память для ядра, занимающегося чем-то ответственным; - комбинация перечисленного: например, обработка процессов в реальном времени выполняется выделенными ядрами, имеющими монопольный доступ к соответствующей периферии, выводом на диск заведует опять-таки отдельное ядро (во избежание путаницы), часть ядер образует матрицу для massively-parallel processing, а парочка сидит на общей шине и за всем этим наблюдает. Важно, что это не надо делать "на вырост". Рисовать архитектуру можно и нужно под конкретный проект. |
Автор: | Hishnik [ Вт окт 13, 2009 19:31 ] |
Заголовок сообщения: | |
WingLion писал(а): Скорее за 120$, за 20$ влезет только одно 32-битное ядро (если судить по ПЛИС ф. ALTERA)
Что-то много. Вот я смотрю S3AN700 - около 14 тысяч ячеек, на ядро (proteus-32) надо около 600. Тут мы уже упремся в блоки памяти, которых 20, и желательно по блоку отдать на программу и данные. Ну пусть даже 16 ядер с 2к памяти на каждое, плюс 4 оставшихся блока дают 8 кб на общей шине. И стоит это удовольствие чуть меньше 50$. Вобщем, получается что-то вроде 3$/ядро. Кстати, жду звонка из Fastwell - нам две такие платы в формате микромодуля уже монтируют |
Автор: | forther [ Вт окт 13, 2009 19:51 ] |
Заголовок сообщения: | |
Sotnik писал(а): forther писал(а): Sotnik писал(а): Вижу что у S40C18 есть некие проблемы с патентами. И начинать осваивать многозадачность на нём опасно. Это какие же у него проблемы с патентами? Тут на одном из форумов про это упоминалось. Меня это удивило - Мур и какие-то споры про его технологии... :( Это не про собственно технологии споры. А про то, как поделить деньги от продажи лицензий на технологии. И относятся эти технологии больше к армам/пентиумам, чем к S40C18. Так что кончайте вы с этими пентиумами заниматься. Опасно! Ну или пытайтесь понимать то, что читаете. |
Страница 1 из 7 | Часовой пояс: UTC + 3 часа [ Летнее время ] |
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group http://www.phpbb.com/ |