nVidia GeForce GT 240

Présentation générale



Pour ce test, nous allons étudier une carte qui pourrait avoir une carrière honorable chez de nombreux plieurs, de part son positionnement tarifaire : la GeForce GT240 de nVidia. Pour ce test, la carte utilisée provient du constructeur MSI.


Cliquez sur l'image pour l'agrandir.


La boîte est plutôt petite comparée à celles qui sont fournies avec de cartes plus haut de gamme, ce qui laisse présager une carte à l’encombrement réduit. Parmi les nombreux logos présentés sur la boîte, celui qui m’a le plus interpelé est l’appellation « Military Class ». Rassurez-vous, cette carte n’est pas une arme secrète de l’armée … cette appellation est utilisée par MSI sur ses cartes destinées aux overclockeurs qui sont équipées de composants de haute qualité pour les étages d’alimentation et de PCBs revisités pour l’occasion. Les composants qui entrent dans cette catégorie sont les condensateurs et les inductances (aussi appelées self). Ces composants répondent à la norme MIL-PRF-39003L du département de la défense des Etats-Unis. Concrètement, ces composants permettent une plus grande stabilité et d’une plus grande longévité de la carte tout en étant capable de fournir plus de courant dans les situations extrêmes comme l’overclocking. MSI annonce également que ces composants permettent d’éviter le sifflement caractéristique de la plupart des cartes. Nous aurons l’occasion de vérifier si ces promesses sont tenues.


Cliquez sur l'image pour l'agrandir.


Le bundle quant à lui est réduit au strict nécessaire (comme le paquetage du soldat ?) :


Aucune connectique n’est fournie, mais ce choix peut se justifier par le fait que la carte dispose déjà des connecteurs principaux (1 VGA, 1 DVI et 1 HDMI) … mais certains les trouveront de manque s’ils souhaitent connecter plusieurs écrans disposant de connectique identique (deux VGA ou deux HDMI par exemple).

Le CD de drivers est plutôt complet. Il contient :



Le GPU qui équipe cette carte est intéressant à plus d’un titre. Tout d’abord, il s’agit d’une déclinaison d’entrée de gamme du GT200 équipant les cartes GTX 2xx haut de gamme. nVidia se décide enfin à abandonner progressivement son bon vieux G92 et ses déclinaisons. Le GPU de la GT 240 porte le nom de code de GT215. Cette carte fait partie de la même vague que les G 210 et GT 220, et constitue donc le début du milieu de gamme. Cette GT 240 est positionnée comme la remplaçante des 9600GT et 9600GSO.


Cliquez sur l'image pour l'agrandir.


Le GT215 inaugure la finesse de gravure en 40 nm chez nVidia qui sera également utilisée pour la future génération de puces GT300 (aussi connues sous le nom de GF100). Nous verrons au cours de ce test si le procédé tient ses promesses. nVidia n’ayant pas jugé bon d’imposer des normes sur la mémoire utilisée sur les cartes GT 240, vous trouverez donc des versions disposant de GDDR3 et d’autres de GDDR5, aussi bien en versions 512 Mo qu’en 1 Go. Les fréquences mémoires ne sont également pas fixées et laissées au choix du constructeur de la carte. Ce GPU supporte les Compute Capabilities 1.2, tout comme les G 210 et GT 220. Les Compute Capabilities 1.2 sont très proches des Compute Capabilities 1.3 des GTX 2xx à la seule différence que les calculs en double précision de ne sont pas supportés ici. Le GT215 de la GT 240 est cadencé à 550 MHz et il dispose de 96 unités de calcul CUDA cadencées à 1340 MHz capables de délivrer 255 GFLOPs en simple précision.


Cliquez sur l'image pour l'agrandir.


La carte de MSI s’architecture autour d’un GT215 aux fréquences standards. MSI a ici fait le choix d’équiper sa carte de mémoire GDDR5 128 bits cadencée à 1800 MHz. Le système de refroidissement occupe deux slots, mais il n’expulse pas l’air en dehors du boitier même si une grille d’aération est pratiquée au-dessus des sorties vidéos. A ce propos, MSI a équipe sa carte de trois connecteurs : VGA, DVI et HDMI (HDMI, HDCP et DVI Dual Link).


Cliquez sur l'image pour l'agrandir.


Notez que les GT 240 font partie des premières cartes nVidia supportant la sortie audio sur le port HDMI. Combiné à sa taille plutôt réduite, cette carte devrait s’installer dans la plupart de boîtiers sans trop de difficultés à condition de disposer d’un port PCIe acceptant les cartes double slots. Enfin, cette carte s’alimente entièrement via le port PCIe et ne nécessite pas de connecteur d’alimentation additionnel, ce qui signifie qu’elle est conçue pour consommer au maximum 75W.

Installation



L’installation physique de la carte dans la machine ne pose aucun problème. La carte est courte et s’installera dans tous les boitiers sans trop de problèmes, du moment qu’on dispose d’un slot PCIe capable d’accueillir des cartes disposant d’un refroidissement sur deux slots.

La machine démarre sans problèmes, mais la carte n’est pas supportée par les pilotes 190.38 actuellement distribués dans la CUDA Zone. Vous devrez donc utiliser les drivers fournis sur le CD de la carte (191.07 non WHQL), ou récupérer la dernière version dans l’espace de téléchargement du site de nVidia (195.62 WHQL utilisés dans ce test, dernière version disponible 196.21 WHQL). Les drivers 191.07 supportent CUDA 2.3, alors que les 195.62 introduisent le support de CUDA 3.0 et d’OpenCL 1.0 en version bêta.

La carte et/ou les drivers 195.62 n’étaient pas reconnus par la version en cours de Riva Tuner 2.24, j’ai donc utilisé le programme fournit par MSI sur le CD pour overclocker la carte lors des tests. Ce programme s’appelle MSI Afterburner et fonctionne sur la plupart des cartes MSI de dernière génération. Il est basé sur Riva Tuner, vous retrouverez donc certains éléments de ce programme, avec un habillage maison. Ce programme présente l’avantage de pouvoir modifier la tension d’alimentation du GPU de -0.1V (si vous souhaitez underclocker ou limiter la consommation) à +0.1V. Nous verrons si cette fonctionnalité s’avère utile.

Benchmarks



Les benchmarks ont été réalisés sur la machine suivante :


Dans la mesure du possible, je ne donnerai qu’une seule valeur pour un même type de WUs (actuellement regroupées par valeur de points sur les projets GPU actuels). Les mesures sont effectuées sur des projets en cours au moment de la rédaction de l’article. Pour plus de facilité lors de la comparaison entre cartes ou clients, les résultats seront donnés en points par jour (PPD). La valeur relevée dans tous les cas est la valeur effective sur l’ensemble de l’unité (Eff. Temps / Frame sous Fahmon), afin de ne pas prendre en compte les variations de temps par frame des projets utilisant le core 14.

Commençons par étudier l’influence des drivers sur les performances :


Cliquez sur l'image pour l'agrandir.


Les derniers drivers semblent légèrement plus lents que ceux fournis avec la carte, mais la différence de performance n’est pas suffisante pour être significative. Elle pourrait être considérée comme faisant partie des erreurs de mesure.

Pour la suite des tests, les drivers 195.62 seront utilisés.

Consommation



Pour ces mesures, j’utilise un Wattmètre Watt & Co. Les valeurs mesurées sont à la prise et incluent donc la consommation et les pertes des autres composants. Pour ces relevés, seul le client GPU est lancé.

Attention : pour les WUs utilisant le Core 14 (p59xx), n’ayant pas un wattmètre capable de calculer la moyenne de consommation sur une durée donnée, j’utilise une formule du type (valeur min + valeurs max) / 2 … cette formule est probablement inexacte, mais elle reflète tout de même la consommation réduite de ces unités (la machine passe plus de temps en consommation minimale qu’en consommation maximale).


Cliquez sur l'image pour l'agrandir.


La consommation au repos de la carte est très faible, comme sur la plupart des cartes de dernière génération. Ceci s’explique par le fait que la carte est capable de fortement réduire ses fréquences au repos (GPU : 135 MHz / Shaders : 270 MHz / Mémoire : 135 MHz). Cela complique les comparaisons avec la génération de cartes précédente (G9x) et pourra induire des résultats bizarres lors de la mesure du delta repos / charge. La carte dispose aussi d’un palier de fréquence à 405 MHz pour le Core, 810 MHz pour les Shaders et 324 MHz pour la mémoire. Ce palier est utilisé en mode PureVideo, qui sert à accélérer le décodage des vidéos en mettant le GPU à contribution au lieu du CPU.

Lors du pliage, les fréquences maximales sont bien sur engagées, mais j’ai eu des cas où elles ne se réactivaient pas correctement après certains types d’erreurs. Si votre carte est anormalement lente, vérifiez ce point. Un simple redémarrage de la machine suffit alors à ce que tout rentre dans l’ordre.

Pour terminer ces tests aux fréquences d'origine, les graphiques suivants montrent l'efficacité de la carte, exprimée en PPD par Watt, et calculée à partir de la consommation de la carte.


Cliquez sur l'image pour l'agrandir.



Overclocking



J’ai ici cherché le maximum de fréquence atteignable sous Folding@Home pour le core, les shaders et la mémoire. J’ai ensuite vérifié les performances et la consommation pour chaque unité disponible pour le test, dans chacun des cas : overclocking indépendant de chaque élément, puis de tous les éléments en même temps.

Les fréquences utilisées pour les tests seront les suivantes :



La plupart de ces fréquences seront instables pour une utilisation H24 mais elles ont été suffisantes pour effectuer les mesures. Par précaution pour une utilisation intensive, je vous conseille des prendre des marges raisonnables (d’après mes observations, 100 à 150 MHz pour les shaders, 20 à 50 MHz pour le core et 50 à 100 MHz pour la mémoire).

Au cours de la recherche des fréquences maximales, le programme de MSI limitait la montée de la fréquence du core à 667 MHz lorsque la fréquence des shaders était fixée à celle d’origine. En overclockant les shaders, la limite sur la fréquence du core disparaissait.

p5765-5772 / 353 points


Cliquez sur l'image pour l'agrandir.



Cliquez sur l'image pour l'agrandir.



Cliquez sur l'image pour l'agrandir.


p5787-5798 / 787 points


Cliquez sur l'image pour l'agrandir.



Cliquez sur l'image pour l'agrandir.



Cliquez sur l'image pour l'agrandir.


p5912-5915 / 1888 points


Cliquez sur l'image pour l'agrandir.



Cliquez sur l'image pour l'agrandir.



Cliquez sur l'image pour l'agrandir.


Première constatation : le 40nm fait des merveilles et la carte monte très bien en fréquence. Les shaders se permettent même d’atteindre les fréquences du haut de gamme de la génération précédente (la 9800 GTX+). Espérons que des puces plus complexes comme le GT300/GF100 seront capable des mêmes prouesses.

Deuxième constatation : au cours des mes recherches des fréquences maximales, j’ai remarqué un phénomène particulier sur les performances liées à l’overclocking du core et de la mémoire. Passé un premier gain réduit, l’augmentation de la fréquence n’apporte plus aucune augmentation de performance, tout en continuant à augmenter légèrement la consommation. Nous en revenons à la conclusion communément admise pour l’overclocking destiné au pliage : seul les shaders ont une influence significative dans les performances, et l’augmentation des autres fréquences peut être considérée comme négligeable.

Dernier point : j’ai été déçu par la GDDR5. J’espérais pouvoir mettre en avant les avantages de l’ECC, je me suis retrouvé au final avec des résultats typiques d’overclocking de mémoire graphique.

Renseignements pris (je remercie Imran Haque pour ses explications détaillées), l’ECC équipant les cartes grand public est des plus basique. Il se contente d’autoriser des retards dans la livraison des données entre la mémoire et le GPU. Si une donnée doit arriver après X ticks d’horloge, la GDDR5 se contente d’accepter qu’une donnée arrive après X+Y ticks. Il n’y a donc pas de réelle correction d’erreur, simplement une certaine souplesse qui permet simplement d’obtenir des fréquences effectives supérieures.

La situation sera différente avec l’ECC embarqué dans les cartes Tesla basées sur Fermi : celles-ci devraient intégrer un mécanisme d’ECC complet pour l’intégralité des bus de données présents dans la puces et sur la carte.

Refroidissement et nuisances sonores



Malgré son système de refroidissement réduit, celui-ci est efficace et la carte ne chauffe pas. Le 40nm n’est probablement pas étranger à cette bonne performance. Aux fréquences d’origine, le ventilateur ne dépasse pas les 35% de sa vitesse maximale, vitesse qui est également maintenue au repos. Dans ces conditions, le GPU ne dépasse pas les 56°C.

Lors des séances d’overclocking, le ventilateur a légèrement accéléré pour atteindre les 40%, maintenant le GPU à 60°C maximum. Même lors des tests extrêmes avec augmentation de tension du GPU, la puce ne dépasse pas les 74°C pour une ventilation automatiquement augmentée à 65%.

Coté nuisances sonores, le système de refroidissement est discret, et je ne l’ai jamais distingué du brouhaha du reste de la configuration, même à 65% de sa vitesse maximale. Malheureusement, le curseur de contrôle de la vitesse du ventilateur ne semble pas fonctionnelle sous MSI Afterburner … je n’ai donc pas pu me rendre compte des nuisances sonores avec la ventilation au maximum.

Bien que le système de refroidissement soit discret, ce n’est pas le cas du reste de la carte. En effet, malgré l’utilisation de composants « Military Class » qui laissait présager de bonnes choses de ce coté là, la carte siffle lorsque qu’elle plie. Si ce sifflement reste discret, voire inaudible aux fréquences d’origine, il s’intensifie avec l’augmentation de fréquences. Lors des tests avec augmentation de tension, celui-ci s’avère même gênant au bout de quelques minutes à coté de la machine.

Je n’ai pas pu déterminer l’origine exacte de ce sifflement, mais l’alimentation et la carte mère de la machine semblent avoir une influence sur celui-ci. J’ai en effet placé la carte dans une autre machine équipée d’une alimentation Corsair TX650W et d’une carte mère Asus P3E3-Deluxe et ce sifflement a été réduit à néant aux fréquences d’origines, et il reste présent, mais plutôt discret (et supportable) en overclocking.

Lorsqu’on voit le delta de consommation de la carte oveclockée avec augmentation de tension qui atteint les 86W, on dépasse ici la limite théorique de ce qu’un port PCI Express peut fournir (75W dans sa version 1.1). Le passage sur la carte mère Asus qui dispose de ports PCI Express à la norme 2.0 dispose d’une puissance supérieure (150W). Ceci influence probablement la qualité des signaux électriques et donc des bruits parasites en résultant.

Conclusion



Cette GT 240 sera la carte parfaite pour les plieurs souhaitant disposer de matériel au meilleur tarif et économe en énergie, sans sacrifier les performances. Cette carte remplace les 9600 GT et 9600 GSO dans la grille tarifaire de nVidia, soit aux environs de 85€, et ses performances sont légèrement supérieures à ses prédécesseurs. Sans oublier qu’avec un overclocking aussi facile, la carte rattrape assez facilement les cartes de gamme supérieure de la génération précédente, pouvant atteindre plus de 5000 PPD dans les meilleures conditions.

Les plus :

Les moins :


Pour terminer ce test, j’ai utilisé la carte dans ma machine principale, afin de voir ce qu’elle donne en utilisation quotidienne, son tarif ne la réservant pas à une élite ou aux machines dédiées au pliage.

Comme dans la plupart des cas de pliage sur GPU, je vous conseille fortement de mettre votre client en pause lorsque vous lancez une application lourde. Cela réduit non seulement le risque de perte de WU, mais dans le cas de notre GT240, un lag de l’interface est présent sous Windows (XP SP3 utilisé ici). Si ce lag ne sera pas gênant dans la plupart des cas, il vous posera probablement problème lors de la lecture de vidéos, de flash, ou dans les jeux 3D.