News

Le core i7 3770K mettra 25% dans la vue à votre 2600K ?

Par , le dans Hardware - 1 Commentaire
Le core i7 3770K mettra 25% dans la vue à votre 2600K ?
Intel, encore Intel ! Oui, mais c'est alléchant !
Vous avez aimé le 2600K Sandy Bridge ? Vous allez adorer le Core i7 3770K et son gain de 7 à 25% !

Pas de long discours, des chiffres !



Cinébench étant certainement le type de calcul le plus proche de FAH on va donc espérer un gain de 15% sous FAH... Seul un vrai bench sur le client permettra de répondre, mais cette information est assez importante !


Source : Tom's Hardware France

Intel Knights Corner, 1 téraflop pour le rejeton de Larrabee !

Par , le dans Hardware - 3 Commentaires
Intel Knights Corner, 1 téraflop pour le rejeton de Larrabee !
Le projet mort-né Larrabee continue d'engendrer des évolutions. Si pour le moment rien n'est sorti du laboratoire, les chiffres avancés sont de plus en plus impressionnants.
Si un CPU classique permet de calculer environ 0,1 Teraflop et un GPU environ 0,5 Teraflop, Knights Corner avec ses 50 cores annonce 1 Teraflop !
Pour le moment pas de date de sortie ...

A quand ce type de carte co-processeur pour assister nos CPUs sur les plus grosses WU ?

Source : Tom's Hardware France

Le socket 2011 sera aussi celui des Ivy Bridge E

Par , le dans Hardware - Aucun commentaire
Le socket 2011 sera aussi celui des Ivy Bridge E
Si la sortie des nouveaux i7 Sandy Bridge E vous titille mais que vous avez peur d'investir dans une plateforme qui ne serait pas pérenne, la bonne nouvelle du jour est apportée directement de la bouche de M. Intel : Ivy Bridge E tournera sur toutes les cartes mères socket 2011.

Intel est très critiqué pour la durée de vie de ses plateformes, en effet les sockets Intel ont eu tendance dans le passé à connaître un "Turn Over" assez redoutable pour nos finances. Le pire de tous sera peut être le socket 1156 qui n'aura servi que pour la première génération d'i5 et d'i7 entrée de gamme, soit 1 an ...

Pour Ivy Bridge c'est promis, les cartes mères actuelles en 1155 et 2011 conviendront à toute la gamme de CPU. Une très bonne nouvelle pour ceux qui souhaiteraient passer dés aujourd'hui sur un processeur Hexa-Core comme le i7-3930K ou le i7-3960X, mais qui souhaiteraient par la suite faire évoluer en douceur leur plateforme vers un CPU Octo-core de la famille Ivy Bidge E.

3, 2, 1 ... A vos magasins !

Source : Tom's Hardware France

Sortie des Sandy-Bridge E d'Intel !

Par , le dans Hardware - 8 Commentaires
Sortie des Sandy-Bridge E d'Intel !
Ce n'est pas tous les jours qu'on annonce une nouvelle série de processeurs, alors délectons-nous !
L'architecture vous la connaissez déjà, c'est du Sandy Bridge. Alors qu'est ce qui change ?
  • Pas de GPU intégré (on gagne ici des transistors)
  • Un nouveau socket : 2011 (comme son année de sortie :D)
  • Gestion de 4, 6 voir 8 cores physiques (enfin 8 cores uniquement sur des Xeons)
  • Gestion mémoire sur 4 canaux (jusqu'à 8 slots mémoire sur la carte mère)
  • Nouveau chipset X79


Mais bon, concrètement, ça plie bien ? Hé bien cette source (merci à Chhosni de l'AF) donne le plus gros modèle i7 3960x aux fréquences d'usine environ à 43,500 PPD, malheureusement sans citer le projet ayant servi pour la mesure. Un gain tout de même très important par rapport aux i7 2600K aux fréquences d'origine.

Notre avis ? SPOILER !
Caché:

Une très belle vitrine technologique, mais un prix exagéré qui l'élève au rang de machine difficilement accessible. Compter au minimum 900€ pour la plateforme de base (1 CPU hexacore, 1 carte mère et 4 barettes RAM).


Source : PcINpact
Source Bench Folding : Overclockers.com (en anglais)

Le noyau Linux et sa régression de consommation en énergie bientôt corrigée !

Par , le dans OS - Aucun commentaire
Le noyau Linux et sa régression de consommation en énergie bientôt corrigée !
Cette affaire empoisonne l'autonomie des laptops depuis le début de cette année 2011, la régression dans la gestion de l'énergie du noyau 2.6.38 a été parfaitement identifiée, reproduite, et un patch a été proposé. Si son intégration dans la version 3.2 de Linux est incertaine, elle sera présente dans la version 3.3.

Le coupable ? La gestion de l'économie d'énergie sur le bus PCI-Express !

C'est une très bonne nouvelle qui permettra de retrouver de bonnes autonomies sur les distributions de 2012 ! :top

Plus de détail dans les sources pour les amateurs de technique pure et dure ;)

Source : Phoronix (en anglais)
Source supplémentaire : PcINpact

BigAdv passe à 16 cores minimum le 16 janvier 2012 !

Par , le dans Projet Folding@Home - 5 Commentaires
Petit coup de tonnerre dans le monde des plieurs acharnés, à compter du 16 janvier 2012 les projets BigAdv nécessiteront au minimum 16 cores (comprendre 16 cores physiques ou une machine disposant de 8 cores et de la technologie HyperThreading).

Stanford est parfaitement conscient que cette décision va entraîner beaucoup de frustration et de déception, les projets BigAdv étant rétribués par un très copieux bonus par rapport aux projets SMP normaux. Mais cette décision a été prise pour recentrer BigAdv sur ses objectifs initiaux : fournir un groupe de machines à la puissance largement supérieure à la moyenne des machines grand public pour travailler sur un nombre limité de très gros projets en rendant les résultats très rapidement.
Depuis le lancement de BigAdv, 8 cores sont devenus très simple à avoir grâce à la série de processeur i7 d'Intel fournissant 4 cores physiques et donc 8 avec l'HyperThreading. L'engouement massif pour ces projets a créé des pénuries, forçant les chercheurs à ouvrir plus de projets en parallèle.


Le 16 janvier donc, le flag "-bigadv" sur les machines "-SMP 8" et "-SMP 12" n'aura plus aucun effet.

Source : Le blog officiel de Vijay Pande (en anglais)

Cuda 4.1 Release Candidate lancé !

Par , le dans Drivers - 5 Commentaires
Cuda 4.1 Release Candidate lancé !
Cuda, le fameux langage de programmation GPGPU de nVidia débarque dans une nouvelle version 4.1.

Voici l'ensemble des modifications annoncées sur le site de nVidia pour les développeurs :
Citation:
Try the new compiler!

New LLVM-based compiler delivers up to 10% faster performance for many applications

New & Improved “drop-in” acceleration with GPU-Accelerated Libraries

Over 1000 new image processing functions in the NPP library
New cuSPARSE tri-diagonal solver up to 10x faster than MKL on a 6 core CPU
New support in cuRAND for MRG32k3a and Mersenne Twister (MTGP11213) RNG algorithms
Bessel functions now supported in the CUDA standard Math library
Up to 2x faster sparse matrix vector multiply using ELL hybrid format
Learn more about all the great GPU-Accelerated Libraries

Enhanced & Redesigned Developer Tools

Redesigned Visual Profiler with automated performance analysis and expert guidance
CUDA-GDB support for debugging MPI applications, multi-context debugging, and assert() in device code
CUDA-MEMCHECK now detects out of bounds access for memory allocated in device code
Parallel Nsight 2.1 CUDA warp watch visualizes variables and expressions across an entire CUDA warp
Parallel Nsight 2.1 CUDA profiler now analyzes kernel memory activities, execution stalls and instruction throughput
Learn more about debugging and performance analysis tools for GPU developers on our CUDA Tools and Ecosystem Summary Page

Advanced Programming Features

Access to 3D surfaces and cube maps from device code
Enhanced no-copy pinning of system memory, cudaHostRegister() alignment and size restrictions removed
Peer-to-peer communication between processes
Support for resetting a GPU without rebooting the system in nvidia-smi

New & Improved SDK Code Samples

simpleP2P sample now supports peer-to-peer communication with any Fermi GPU
New grabcutNPP sample demonstrates interactive foreground extraction using iterated graph cuts
New samples showing how to implement the Horn-Schunck Method for optical flow, perform volume filtering, and read cube map texture


Pour résumer :

  • Un nouveau compilateur qui offrira un gain de performances de 10% sur une grande partie des applications juste en recompilant les applications existantes.
  • Des améliorations / simplifications de fonctions mathématiques et de traitement d'image.
  • Des améliorations pour l'intégration de Cuda aux outils de développement. De nouveaux outils d'aide au débogage et optimisation.
  • Quelques nouvelles fonctionnalités dans l'API, la capacité de faire communiquer les GPU en mode "peer to peer"
  • De nouveaux exemples de code fournis pour implémenter les nouveautés.

Nous autres plieurs allons surtout retenir le potentiel gain de 10% si Stanford met à jour ses cores avec cette version et espérons que les nouvelles fonctionnalités pourront aider à l’amélioration des cores à l'avenir, même si pourtant Cuda devait progressivement être remplacé par OpenCL...

Source : PCInpact
Source complémentaire : Site des développeurs nVidia

nVidia Kepler pour la fin d'année ?

Par , le dans Hardware - 1 Commentaire
nVidia Kepler pour la fin d'année ?
Il ne se passait plus grand chose sur le marché des GPUs, c'est sur le point de changer. Des rumeurs font état d'une sortie avant Noël du segment le plus haut de gamme de la génération Kepler de nVidia.

Les rumeurs indiquent que nVidia serait en train de réduire le prix de ses actuelles GTX 5XX Fermi pour laisser de la place aux futures GTX 6XX Kepler gravée en 28nm. Pour nous les plieurs, on bave devant les conjectures circulant sur Internet, comme par exemple 1024 SP, et un bus mémoire 512 bits.

nVidia va nous mettre le feu sous le sapin ?

Source : Tom's Hardware France
Source spéculative (en anglais) : ICI

Processeurs AMD FX disponibles : des bulldozers qui écrasent la concurrence ?

Par , le dans Hardware - 1 Commentaire
Ca y’est, AMD a enfin annoncé sa nouvelle gamme processeurs basés sur l’architecture Bulldozer. Cette gamme bénéficie d’une numérotation claire indiquant rapidement ce à quoi s’attendre. Les processeurs FX ont donc une référence 4000, 6000 ou 8000 qui indique le nombre de cores (quatre, six ou huit), les trois dernier chiffres permettant de positionner la puce en terme de performances au sein de la gamme.

Un concept modulaire qui transforme le concept de core

Cependant, avec son architecture Bulldozer, AMD abandonne le concept de cores comme nous le connaissons habituellement. En effet, il est plus judicieux de parler de module Bulldozer, qu’AMD qualifie de CMT (pour Cluster Multi-Threading). Chaque module contient les éléments suivants : le fetcher qui doit gérer le flux d’instructions, le décodeur qui transforme les instructions reçues en instructions élémentaires compréhensibles par les unités de traitement, deux unités de calculs sur les entiers (ALU), un cache L1 partagé entre les deux unités ALU, une unité de calcul sur les flottants (FPU) et du cache L2.

Ce module sera vu par le système d’exploitation comme deux cores. L’efficacité sur le calcul des entiers devrait donc être bonne, mais on peut avoir de sérieux doutes sur l’unité de calcul des flottants partagée. En effet, en calculs scientifiques, comme pour Folding@Home, la très large majorité des traitements se fait sur des nombres flottants. AMD indique que sa FPU est capable de traiter une donnée 256 bits par cycle ou deux données 128 bits par cycles. Cependant, la possibilité de travailler en 256 bits n’est disponible que pour des instructions AVX, mais le mystère plane sur les autres types d’instructions comme le SSE/SEE2 qui travaille principalement en 128 bits. Cette approche peut s’avérer particulièrement risquée en terme de performances.

La puce et ses caractéristiques

Pour ce qui est des autres caractéristiques de la puce, celle-ci est gravée en 32 nm et dispose de 2 milliards de transistors pour les modèles FX-8000. Chaque module dispose de 64ko de cache L1 et de 1Mo de cache L2. L’ensemble se partage 8Mo de cache L3. Les unités de calcul supportent l’ensemble des instructions SSE (jusqu’au 4.2), l’AVX et le AES-NI. AMD a intégré une nouvelle version de sa version du Turbo pour les cores qui permet d’augmenter la fréquence de certains lorsque les autres ne sont pas utilisés, dans la limite du TDP de la puce qui sera de 95 ou 125W suivant les modèles.

Le modèle le plus haut de gamme proposé actuellement est le FX-8150 que l’on retrouve pour 245 €. Celui-ci dispose donc de 8 cores (4 modules) qui fonctionnent à 3.9 GHz et pouvant monter à 4.2 GHz avec le Turbo. Ces processeurs nécessitent une carte mère AM3+, mais peuvent aussi prendre place sur un socket AM3 sous réserve de mise à jour du BIOS de la carte.

Et du coté des performances ?

Du coté des performances, on peut dire que les nouveaux bébés d’AMD sont loin de convaincre.

Tout d’abord, certains sites ont rapportés des problèmes de compatibilité et de performances sous Windows 7 qui semble connu par AMD et Microsoft. Ceux ci promettent une amélioration pouvant aller jusqu’à 10% sous Windows … 8. Il se pourrait que Linux soit la seule solution pour exploiter ces puces efficacement pour l’instant.

En ce qui concernent Folding@Home, les premiers chiffres qui nous sont parvenus sur un FX-8150 sous Windows 7 sont décevant : le processeur peine à obtenir 14 000 PPD en SMP. A coté de ces chiffres, gardons à l’esprit que le potentiel d’amélioration est là : nos cores n’exploitent pas encore les instructions AVX, et l’optimisation actuelle ne convient peut être pas pleinement au FPU partagées des Bulldozer … De plus, si les problèmes de performances liés à Windows (probablement à son ordonnanceur) sont avéré, il se pourrait que les résultats sous Linux soient complètement différents …


Actuellement, nous aurions tendance à déconseiller ce processeur dont les performances peinent à lutter avec un i7 2600K (certes vendu un peu plus cher) et qui ne justifient pas le remplacement d’une plateforme actuelle …

N’hésitez pas à nous faire parvenir des performances sous Linux, nous aurons peut être une bonne surprise. Nous espérons aussi pouvoir réaliser les tests par nous-mêmes, ce qui nous permettra peut être de réviser notre jugement.

Troisième version bêta publique pour le client v7 : v7.1.33

Par , le dans Projet Folding@Home - 3 Commentaires
Changelog depuis la deuxième version publique :

Note : les numéros en fin de ligne correspondent aux numéros de ticket que vous pouvez consulter à cette adresse.

v7.1.25:
  • Hide 'Quit on window close' option in OSX.
  • Fixed some problems with WU assign time and time offset calculations.
  • Detect and ignore invalid assign time from older WS.
  • Log computed WS time offset.
  • Removed warning from Slot configuration about changing threads mid-run.
  • Catch and log error accessing battery info in /sys on Linux
  • Fix grayed out name and IP in client add after viewing local client. #640.
  • Remove 'RS480 PCI-X Root Port' from GPU whitelist. #635
  • Added a few new Radeon HD 6xxx cards.
  • Added Nvidia GTX 590 device ID 0x1088 to whitelist.
  • Increase Radeon HD 5xxxx and 6xxxx GPU type level by one. #653.
  • Don't fail WS connections if all data was recieved even on net error.
  • Print IP Address with 'Uploading' message.
  • Fixes for OSX minimize and quit bugs. #649 & #659.
  • Limit max CPUs per slot to system count. #652.
  • Attempt to fix #654.
  • Release system resources when querying OSX battery status. #650.
  • Don't send 'auth' command from FAHControl if empty. #658.
  • Fixed 'slot-add' NULL pointer exception. #666.
  • Fixed 'log-updates start' error. #671.
  • Fixed FAHClient script parsing bug. #676.
  • Show 'Remote Access' tab in advanced mode. #648.
  • Don't allow minimizing to sys-tray if it is not there. #670.
  • Also print core return code numbers in hex. #677.
  • Print times in ISO 8601 format. #664.
  • Expire WUs in sending status.


v7.1.26:
  • Correctly report client version to WS with WU return.
  • Failed upload attempt could cause WU to dump before it was expired. #679.
  • Added AMD Radeon HD 6600 Series to GPU white-list.
  • Fix failure to restart FAHControl in OSX when 'start minimized'. #649.
  • Fixed a socket bug that could cause the loss of the end of a message.
  • Build OSX client in 32-bit mode with Intel compiler.
  • Reduced socket send buffer size to 32KiB to try to solve #682.
  • Attempt to fix PCI detect crash in Windows. #695.
  • Whitelisted more GPUs.


v7.1.27:
  • Check shared info modification time in an attempt to fix #688.
  • More GPU whitelisting.
  • Fixed Windows PCI/GPU detection, broke in v7.1.26. #701.
  • Use WS UTC WU assign time in client wo/ computing offset #697, #681.
  • If running WU is dumped shutdown the core. #700.


v7.1.28:
  • Hopefully finally fixed the OSX on battery detection code.
  • More GPU whitelist changes.


v7.1.29:
  • Print UNSUPPORTED in front of unsupported GPUs in info.
  • Removed unsupported gpu-vendor-id and gpu-device-id options.
  • Allow auto-configuring both GPU and SMP. #629
  • Configure GPU & SMP by default in Windows.
  • Repaired OS description printing in info.
  • Use OS bits to determine 32 vs 64 rather than build bits. #703
  • Enabled GPU detection in OSX.
  • Removed 'gpu-id' and added 'cuda-index' and 'opencl-index' options.
  • GTX465 -> Fermi. #661
  • Automatically install themes in Windows installer.


v7.1.30:
  • Attempt to fix OSX PCI scan crash.


v7.1.31:
  • Another attempt to fix OSX PCI scan crash.


v7.1.32:
  • Added 'gpu-usage' option with default of 80%.
  • Added percent GPU usage slider in FAHControl.
  • Added 'opencl-index' and 'cuda-index' options to FAHControl.
  • 'gpu-id' -> 'gpu-index' in FAHControl.


v7.1.33:
  • Set default 'gpu-usage' to 100%, until GPU cores implement better throttle.
  • Fixed client connection rate limiting.
  • Fixed error reporting for bad slot configuration. #582.
  • Attempt to fix EUE reporting for WSv4. #615.
  • Fixed "Wrong architecture" bug on 32-bit Ubunut. #599.
  • Dropped "64-bit" Windows release. Use 32-bit on all systems.