Rasterization Operation Units (ROPs). Näytönohjain, kuinka valita. UKK ominaisuuksista videokorttia valittaessa. Tekniikat, valmistajien ja arkkitehtuurien ominaisuudet, jäähdytysjärjestelmät Kortin tekstuurilohkot

GPU-arkkitehtuuri: Ominaisuudet

3D-grafiikan realistisuus riippuu suuresti näytönohjaimen suorituskyvystä. Mitä enemmän pikselivarjostuslohkoja prosessori sisältää ja mitä korkeampi taajuus, sitä enemmän tehosteita voidaan soveltaa 3D-kohtaukseen sen visuaalisen havainnoinnin parantamiseksi.

GPU sisältää monia erilaisia ​​toiminnallisia lohkoja. Joidenkin komponenttien lukumäärän perusteella voit arvioida, kuinka tehokas GPU on. Ennen kuin siirrymme pidemmälle, käydään läpi tärkeimmät toiminnalliset lohkot.

Vertex-prosessorit (vertex-varjostinyksiköt)

Kuten pikselivarjostinyksiköt, vertex-prosessorit suorittavat varjostuskoodin, joka koskettaa huippuja. Koska suurempi kärkibudjetti mahdollistaa monimutkaisempien 3D-objektien luomisen, vertex-prosessorien suorituskyky on erittäin tärkeä 3D-kohtauksissa, joissa on monimutkaisia ​​tai suuria kohteita. Vertex-varjostinyksiköillä ei kuitenkaan vielä ole niin selvää vaikutusta suorituskykyyn kuin pikseliprosessoreilla.

Pikseliprosessorit (pikselin varjostusyksiköt)

Pikseliprosessori on osa grafiikkasirua, joka on tarkoitettu pikselien varjostusohjelmien käsittelyyn. Nämä prosessorit suorittavat laskelmia, jotka koskevat vain pikseleitä. Koska pikselit sisältävät väritietoja, pikselivarjostimien avulla voit saavuttaa vaikuttavia graafisia tehosteita. Esimerkiksi suurin osa peleissä näkemistäsi vesitehosteista on luotu pikselivarjostimilla. Tyypillisesti pikseliprosessorien määrää käytetään vertaamaan näytönohjainten pikselien suorituskykyä. Jos yhdellä kortilla on kahdeksan pikselin varjostusyksikköä ja toisella 16 yksikköä, on loogista olettaa, että 16 yksikön näytönohjain on nopeampi käsittelemään monimutkaisia ​​pikselien varjostusohjelmia. Myös kellonopeus tulee ottaa huomioon, mutta nykyään pikseliprosessorien määrän kaksinkertaistaminen on energiatehokkaampaa kuin grafiikkasirun taajuuden kaksinkertaistaminen.

Yhdistetyt varjostimet

Unified shaderit eivät ole vielä saapuneet PC-maailmaan, mutta tuleva DirectX 10 -standardi perustuu samanlaiseen arkkitehtuuriin. Toisin sanoen vertex-, geometria- ja pikseliohjelmien koodirakenne on sama, vaikka varjostimet suorittavatkin erilaista työtä. Uusi spesifikaatio näkyy Xbox 360:ssa, jossa ATi on erityisesti suunnitellut GPU:n Microsoftille. On erittäin mielenkiintoista nähdä, mitä potentiaalia uusi DirectX 10 tuo.

Tekstuurikartoitusyksiköt (TMU)

Tekstuurit tulee valita ja suodattaa. Tämän työn tekevät pintakuviokartoitusyksiköt, jotka toimivat yhdessä pikseli- ja vertex-varjostinyksiköiden kanssa. TMU:n tehtävänä on soveltaa tekstuurioperaatioita pikseleihin. Grafiikkasuorittimen pintakuvioyksiköiden määrää käytetään usein vertailtaessa näytönohjainten tekstuurien suorituskykyä. Ei ole kohtuutonta olettaa, että näytönohjain, jossa on enemmän TMU:ita, tarjoaa paremman tekstuurin suorituskyvyn.

Raster Operator Units (ROP)

Rasteriprosessorit vastaavat pikselitietojen kirjoittamisesta muistiin. Nopeus, jolla tämä toiminto suoritetaan, on täyttöaste. 3D-kiihdyttimien alkuaikoina ROP ja täyttöaste olivat erittäin tärkeitä näytönohjainten ominaisuuksia. Nykyään ROP-työ on edelleen tärkeää, mutta näytönohjainten suorituskykyä eivät enää rajoita nämä lohkot kuten ennen. Siksi ROP:iden suorituskykyä (ja määrää) käytetään harvoin näytönohjaimen nopeuden arvioimiseen.

Kuljettimet

Putkilinjoja käytetään kuvaamaan näytönohjainten arkkitehtuuria ja antavat erittäin selkeän kuvan GPU:n suorituskyvystä.

Kuljetinta ei voida pitää tiukana teknisenä terminä. GPU käyttää erilaisia ​​putkia, jotka suorittavat erilaisia ​​toimintoja. Historiallisesti liukuhihna tarkoitti pikseliprosessoria, joka oli kytketty sen tekstuurikartoitusyksikköön (TMU). Esimerkiksi Radeon 9700 -näytönohjain käyttää kahdeksaa pikseliprosessoria, joista jokainen on kytketty omaan TMU:han, joten kortissa katsotaan olevan kahdeksan liukuhihnaa.

Mutta nykyaikaisia ​​prosessoreita on erittäin vaikea kuvata putkien lukumäärällä. Aiempiin malleihin verrattuna uudet prosessorit käyttävät modulaarista, pirstoutunutta rakennetta. Ati:ta voidaan pitää tämän alueen uudistajana, joka X1000-näytönohjainsarjan myötä siirtyi modulaariseen rakenteeseen, mikä mahdollisti suorituskyvyn parantamisen sisäisen optimoinnin avulla. Joitakin prosessorilohkoja käytetään enemmän kuin toisia, ja GPU-suorituskyvyn parantamiseksi ATi on yrittänyt löytää kompromissin tarvittavien lohkojen lukumäärän ja muottialueen (jota ei voi juurikaan lisätä) välillä. Tässä arkkitehtuurissa termi "pikseliputki" on jo menettänyt merkityksensä, koska pikseliprosessorit eivät ole enää yhteydessä omiin TMU:ihinsa. Esimerkiksi ATi Radeon X1600 GPU:ssa on 12 pikselin varjostinyksikköä ja vain neljä TMU-tekstuurikartoitusyksikköä. Siksi on mahdotonta sanoa, että tämän prosessorin arkkitehtuurissa on 12 pikselin liukuhihnaa, samoin kuin on mahdotonta sanoa, että niitä on vain neljä. Perinteisesti pikseliputket mainitaan kuitenkin edelleen.

Yllä olevat oletukset huomioon ottaen GPU:n pikseliputkien määrää käytetään usein videokorttien vertailuun (lukuun ottamatta ATi X1x00 -linjaa). Esimerkiksi, jos otat näytönohjaimet, joissa on 24 ja 16 liukuhihnaa, on melko järkevää olettaa, että kortti, jossa on 24 liukuhihnaa, on nopeampi.


SISÄLTÖ
Foorumillamme joka päivä kymmenet ihmiset kysyvät neuvoja koneidensa modernisointiin, jossa autamme heitä mielellään. Joka päivä "arvioimalla kokoonpanoa" ja tarkistamalla asiakkaidemme valitsemien komponenttien yhteensopivuutta, aloimme huomata, että käyttäjät kiinnittävät huomiota pääasiassa muihin, epäilemättä tärkeisiin komponentteihin. Ja harvoin kukaan muistaa, että tietokonetta päivitettäessä on tarpeen päivittää yhtä tärkeä osa -. Ja tänään kerromme ja näytämme, miksi sinun ei pitäisi unohtaa tätä.

”...Haluan päivittää tietokoneeni niin, että kaikki sujuu, ostin i7-3970X ja ASRock X79 Extreme6 emolevyn sekä RADEON HD 7990 6GB näytönohjaimen. Mikä muu on nan????777"
- noin puolet kaikista pöytätietokoneen päivitystä koskevista viesteistä alkaa. Käyttäjät yrittävät valita nopeimman, nopeimman ja kauneimman muistimoduulin oman tai perheen budjettinsa perusteella. Samalla naiivisti uskoen, että heidän vanha 450W selviää yhtä aikaa sekä virtaa kuluttavasta näytönohjaimesta että "kuumasta" prosessorista ylikellotuksen aikana.

Olemme omalta osaltamme kirjoittaneet jo useammin kuin kerran virtalähteen tärkeydestä - mutta myönnämme, että se ei todennäköisesti ollut tarpeeksi selkeä. Siksi olemme tänään korjanneet itsemme ja valmistaneet sinulle muistutuksen siitä, mitä tapahtuu, jos unohdat sen päivittäessäsi tietokonettasi - kuvien ja yksityiskohtaisten kuvausten kera.

Joten päätimme päivittää kokoonpanon...


Kokeiluamme varten päätimme ottaa täysin uuden keskimääräisen tietokoneen ja päivittää sen "pelikone"-tasolle. Kokoonpanoa ei tarvitse muuttaa paljon - muistin ja näytönohjaimen vaihtaminen riittää, jotta meillä on mahdollisuus pelata enemmän tai vähemmän nykyaikaisia ​​​​pelejä kunnollisilla yksityiskohdilla. Tietokoneemme alkukokoonpano on seuraava:

Virtalähde: ATX 12V 400W

On selvää, että peleille tämä kokoonpano on lievästi sanottuna melko heikko. Joten on aika muuttaa jotain! Aloitamme samasta asiasta, josta useimmat "päivityksen" nälkäiset aloittavat - mistä. Emme vaihda emolevyä - niin kauan kuin se sopii meille.

Koska päätimme olla koskematta emolevyyn, valitsemme sellaisen, joka on yhteensopiva FM2-liitännän kanssa (onneksi NICS-sivustolla on erityinen painike emolevyn kuvaussivulla). Älkäämme olko ahneita - otetaan edullinen, mutta nopea ja tehokas prosessori, jonka taajuus on 4,1 GHz (jopa 4,4 GHz Turbo CORE -tilassa) ja lukitsematon kerroin - rakastamme myös ylikellotusta, mikään inhimillinen ei ole meille vieras. Tässä ovat valitsemamme prosessorin ominaisuudet:

Ominaisuudet
CPU-väylän taajuus 5000 MHz Tehon hajaantuminen 100 W Prosessorin taajuus 4,1 GHz tai jopa 4,4 GHz Turbo CORE -tilassa Ydin Richland L1 välimuisti 96 kt x2 L2 välimuisti 2048 kt x2, toimii prosessorin nopeudella 64 bitin tuki Joo Ydinten lukumäärä 4 Kertominen 41, lukitsematon kerroin Prosessorin videoydin AMD Radeon HD 8670D taajuudella 844 MHz; Shader Model 5 -tuki Maksimi RAM-kapasiteetti 64 Gt Max. kytkettyjen näyttöjen määrä 3 suoraan kytkettyä tai jopa 4 näyttöä DisplayPort-jakajilla

Yksi 4 Gt:n muistitikku ei ole meidän valintamme. Ensinnäkin haluamme 16 Gt, ja toiseksi meidän on käytettävä kaksikanavaista toimintatilaa, jota varten asennamme tietokoneeseen kaksi 8 Gt:n muistimoduulia. Suuri suorituskyky, patterien puute ja kohtuullinen hinta tekevät näistä "herkullisimman" valinnan meille. Lisäksi AMD:n verkkosivustolta voit ladata Radeon RAMDisk -ohjelman, jonka avulla voimme luoda erittäin nopean virtuaalisen aseman jopa 6 Gt: iin täysin ilmaiseksi - ja kaikki rakastavat ilmaisia ​​hyödyllisiä asioita.


Ominaisuudet
Muisti 8 Gt
Moduulien lukumäärä 2
Muistin standardi PC3-10600 (DDR3 1333 MHz)
Toimintataajuus 1333 MHz asti
Ajoitukset 9-9-9-24
Syöttöjännite 1,5 V
Kaistanleveys 10667 Mb/s

Voit pelata mukavasti sisäänrakennetulla videolla vain "miinanraivaajassa". Siksi, jotta voimme päivittää tietokoneesi pelitasolle, valitsimme modernin ja tehokkaan, mutta ei kalleimman, .


Sen mukana tuli 2 Gt videomuistia, DirectX 11- ja OpenGL 4.x -tuki. ja erinomainen Twin Frozr IV -jäähdytysjärjestelmä. Sen suorituskyvyn pitäisi olla enemmän kuin tarpeeksi, jotta voimme nauttia suosituimpien pelien uusimmista osista, kuten Tomb Raider, Crysis, Hitman ja Far Cry. Valitsemamme ominaisuudet ovat seuraavat:


Ominaisuudet
GPU GeForce GTX 770
GPU-taajuus 1098 MHz tai jopa 1150 MHz GPU Boost -tilassa
Shader-prosessorien määrä 1536
Videomuisti 2 Gt
Videomuistin tyyppi GDDR5
Videomuistiväylän leveys 256 bittiä
Videomuistin taajuus 1753 MHz (7,010 GHz QDR)
Pikseliputkien määrä 128, 32 tekstuurin näytteenottoyksikköä
Käyttöliittymä PCI Express 3.0 16x (yhteensopiva PCI Express 2.x/1.x:n kanssa), jossa on mahdollisuus yhdistää kortteja SLI:n avulla.
Portit Mukana DisplayPort, DVI-D, DVI-I, HDMI, D-Sub adapteri
Näytönohjaimen jäähdytys Aktiivinen (jäähdytyselementti + 2 Twin Frozr IV -tuuletinta laudan etupuolella)
Virtaliitin 8 pin + 8 pin
API-tuki DirectX 11 ja OpenGL 4.x
Näytönohjaimen pituus (mitattuna NICS:ssä) 263 mm
Tuki yleiskäyttöiseen GPU-laskentaan DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Suurin virrankulutus FurMark+WinRar 255 W
Suorituskykyluokitus 61.5

Odottamattomia vaikeuksia

Nyt meillä on kaikki, mitä tarvitsemme tietokoneemme päivittämiseen. Asennamme uusia komponentteja olemassa olevaan koteloomme.


Käynnistämme sen ja se ei toimi. Ja miksi? Mutta koska budjettivirtalähteet eivät fyysisesti pysty käyttämään tietokonetta millään teholla. Tosiasia on, että meidän tapauksessamme virtalähde vaatii kaksi 8-nastaista liitintä, ja virtalähteen pohjassa on vain yksi 6-nastainen näytönohjain. Ottaen huomioon, että monet tarvitsevat vielä enemmän liittimiä kuin meidän tapauksessamme, käy selväksi, että virtalähde on vaihdettava.

Mutta se ei ole niin paha. Ajattele vain, virtaliitintä ei ole! Testilaboratoriostamme löytyi melko harvinaisia ​​sovittimia 6-nastaisesta 8-pintaan ja molexista 6-pintaan. Kuten nämä:


On syytä huomata, että jopa edullisilla moderneilla virtalähteillä, jokaisella uudella Molex-liittimien julkaisulla Molex-liittimiä on yhä vähemmän - joten voimme sanoa, että olemme onnekkaita.

Ensi silmäyksellä kaikki on kunnossa, ja joidenkin temppujen avulla pystyimme päivittämään järjestelmäyksikön "peli"-kokoonpanoon. Nyt simuloidaan kuormitusta ajamalla Furmark-testi ja 7Zip-arkistointi Xtreme Burning -tilassa samanaikaisesti uudella pelitietokoneellamme. Voisimme käynnistää tietokoneen - jo hyvä. Järjestelmä selvisi myös Furmarkin lanseerauksesta. Käynnistämme arkistoinnin - ja mikä se on?! Tietokone sammui ja ilahdutti meitä tuulettimen pauhinalla. "Vakio" 400 W ei pystynyt syöttämään näytönohjainta ja tehokasta prosessoria vaikka kuinka kovasti hän yritti. Ja keskinkertaisesta jäähdytysjärjestelmästä johtuen meidän omamme lämpeni hyvin, eikä edes suurin tuulettimen nopeus sallinut sen tuottaa vähintään ilmoitettua 400 W.

Siellä on uloskäynti!

Olemme saapuneet. Ostimme kalliita komponentteja pelitietokoneen kokoamista varten, mutta kävi ilmi, että emme voi pelata sillä. Harmi. Johtopäätös on kaikille selvä: vanha ei sovellu pelitietokoneeseemme, ja se on pikaisesti vaihdettava uuteen. Mutta kumpi tarkalleen?

Päivitetylle tietokoneellemme valitsimme neljän pääkriteerin mukaan:

Ensimmäinen on tietysti valta. Valitsimme mieluummin varauksella - halusimme ylikellottaa prosessorin ja saada pisteitä synteettisissä testeissä. Ottaen huomioon kaiken, mitä voimme tulevaisuudessa tarvita, päätimme valita tehoksi vähintään 800 W.

Toinen kriteeri on luotettavuus. Haluamme todella, että "varauksella" otettu selviää seuraavan sukupolven näytönohjaimista ja prosessoreista, ei pala itsekseen eikä samalla polta kalliita komponentteja (yhdessä testialustan kanssa). Siksi valintamme on vain japanilaiset kondensaattorit, vain oikosulkusuojaus ja luotettava ylikuormitussuoja jokaiselle ulostulolle.

Kolmas kohta vaatimuksissamme on mukavuus ja toimivuus.. Aluksi tarvitsemme - tietokone toimii usein, ja erityisen meluisat virtalähteet yhdistettynä näytönohjaimeen ja prosessorin jäähdyttimeen saavat jokaisen käyttäjän hulluksi. Lisäksi kauneudentaju ei ole meille vieras, joten pelitietokoneemme uuden virtalähteen tulee olla modulaarinen ja siinä on irrotettavat kaapelit ja liittimet. Jotta ei ole mitään ylimääräistä.

Ja viimeisenä listalla, mutta ei vähäisimpänä, kriteeri on energiatehokkuus. Kyllä, välitämme sekä ympäristöstä että sähkölaskuista. Siksi valitsemamme virtalähteen on täytettävä vähintään 80+ Bronze -energiatehokkuusstandardi.

Vertaillut ja analysoinut kaikkia vaatimuksia, valitsimme harvojen hakijoiden joukosta sen, joka täytti kaikki vaatimukset. Siitä tuli 850W teho. Huomaa, että useissa parametreissa se jopa ylitti vaatimuksemme. Katsotaanpa sen spesifikaatiota:

Virtalähteen ominaisuudet
Laitteen tyyppi Virtalähde aktiivisella PFC (Power Factor Correction) -moduulilla.
Ominaisuudet Silmukkapunokset, japanilaiset kondensaattorit, oikosulkusuojaus (SCP), ylijännitesuoja (OVP), ylikuormitussuoja jokaiselle yksikön ulostulolle erikseen (OCP)
+3,3 V - 24 A, + 5 V - 24 A, +12 V - 70 A, +5 VSB - 3,0 A, -12 V - 0,5 A
Irrotettavat virtajohdot Joo
Tehokkuus 90%, 80 PLUS Gold -sertifioitu
Virtalähde virta 850 W
Emolevyn virtaliitin 24+8+8 pin, 24+8+4 pin, 24+8 pin, 24+4 pin, 20+4 pin (irrotettava 24-nastainen liitin. 4-nastainen voidaan irrottaa tarvittaessa, irrotettava 8-nastainen liitin)
Näytönohjaimen virtaliitin 6x 6/8-nastainen liitin (irrotettava 8-nastainen liitin - 2 nastaa irrotettava)
MTBF 100 tuhatta tuntia
Virtalähteen jäähdytys 1 tuuletin: 140 x 140 mm (alaseinässä). Passiivinen jäähdytysjärjestelmä kuormituksella jopa 50 %.
Tuulettimen nopeuden säätö Lämpötila-anturista. Tuulettimen nopeuden muuttaminen virtalähteen sisällä olevan lämpötilan mukaan. Puhaltimen käyttötilan manuaalinen valinta. Normaalitilassa puhallin pyörii jatkuvasti ja hiljaisessa tilassa se pysähtyy kokonaan alhaisella kuormituksella.


, yksi parhaista rahalle. Asennataan se meidän tapauksessamme:


Sitten tapahtui jotain, mikä hämmensi meitä hieman. Vaikuttaa siltä, ​​​​että kaikki oli koottu oikein, kaikki oli kytketty, kaikki toimi - mutta virtalähde on hiljainen! Eli yleisesti: puhallin on seisonut paikallaan ja seisoo edelleen, ja järjestelmä on käynnistynyt kunnolla ja toimii. Tosiasia on, että jopa 50 %:n kuormituksella virtalähde toimii niin kutsutussa hiljaisessa tilassa - ilman jäähdytysjärjestelmän tuulettimen pyörittämistä. Tuuletin humisee vain raskaalla kuormituksella - arkistointilaitteiden ja Furmarkin samanaikainen käynnistys sai jäähdyttimen silti pyörimään.


Virtalähteessä on jopa kuusi 8-nastaista 6-nastaista näytönohjainta, joista jokainen on kokoontaitettava 8-nastainen liitin, josta 2 nastaa voidaan tarvittaessa irrottaa. Siten se pystyy syöttämään mitä tahansa näytönohjainta ilman vaivaa tai vaikeuksia. Eikä edes yksi.


Modulaarinen virtalähdejärjestelmä mahdollistaa ylimääräisten ja tarpeettomien virtakaapeleiden irrottamisen, mikä parantaa kotelon ilmanvaihtoa, järjestelmän vakautta ja tietysti parantaa esteettisesti sisätilan ulkonäköä, jota voi turvallisesti suositella modereille ja ikkunoilla varustettujen koteloiden fanit.
osta luotettava ja tehokas virtalähde. Arvostelussamme siitä tuli. - ja kuten näet, se ei ole sattumaa. Ostamalla sellaisen NICS:ltä voit olla varma, että kaikki korkean suorituskyvyn järjestelmäsi komponentit saavat riittävän ja keskeytymättömän tehon jopa äärimmäisessä ylikellotuksessa.


Lisäksi virtalähteessä riittää tehoa useiksi vuosiksi - parempi varauksella siltä varalta, että aiot päivittää järjestelmää jatkossa korkeatasoisilla komponenteilla.

Näytönohjaimen peruskomponentit:

  • uloskäynnit;
  • rajapinnat;
  • jäähdytysjärjestelmä;
  • GPU;
  • videomuisti.

Grafiikkatekniikat:

  • sanakirja;
  • GPU-arkkitehtuuri: ominaisuudet
    kärki/pikseliyksiköt, varjostimet, täyttösuhde, pintakuvio/rasteriyksiköt, liukuhihnat;
  • GPU-arkkitehtuuri: tekniikka
    tekninen prosessi, GPU-taajuus, paikallinen videomuisti (äänenvoimakkuus, väylä, tyyppi, taajuus), ratkaisut useilla näytönohjaimilla;
  • visuaaliset toiminnot
    DirectX, korkea dynaaminen alue (HDR), koko näytön anti-aliasing, pintakuvioiden suodatus, korkearesoluutioiset pintakuviot.

Graafisten perustermien sanasto

Virkistystaajuus

Aivan kuten elokuvateatterissa tai televisiossa, tietokoneesi simuloi liikettä näytössä näyttämällä kehyssarjan. Näytön virkistystaajuus ilmaisee, kuinka monta kertaa sekunnissa näytöllä oleva kuva päivitetään. Esimerkiksi 75 Hz:n taajuus vastaa 75 päivitystä sekunnissa.

Jos tietokone käsittelee kehyksiä nopeammin kuin näyttö pystyy tulostamaan, peleissä voi ilmetä ongelmia. Esimerkiksi jos tietokone renderöi 100 kuvaa sekunnissa ja näytön virkistystaajuus on 75 Hz, päällekkäisyyksien vuoksi näyttö voi näyttää vain osan kuvasta päivitysjaksonsa aikana. Tämän seurauksena visuaalisia esineitä ilmestyy.

Ratkaisuna voit ottaa käyttöön V-Syncin (pystysynkronoinnin). Se rajoittaa tietokoneen tuottamien kehysten määrää näytön virkistystaajuudella, mikä estää artefakteja. Jos otat V-Syncin käyttöön, pelissä laskettu kehysten määrä ei koskaan ylitä virkistystaajuutta. Toisin sanoen 75 Hz:llä tietokone lähettää enintään 75 kuvaa sekunnissa.

Pikseli

Sana "Pixel" tarkoittaa " kuva ture el ement" - kuvaelementti. Se on pieni piste näytössä, joka voi hehkua tietyllä värillä (useimmissa tapauksissa sävy näkyy kolmen perusvärin yhdistelmänä: punainen, vihreä ja sininen). Jos näytön resoluutio on 1024x768, näet matriisin, jonka leveys on 1024 pikseliä ja korkeus 768 pikseliä. Kaikki pikselit yhdessä muodostavat kuvan. Näytön kuva päivittyy 60 - 120 kertaa sekunnissa riippuen näytön tyypistä ja näytönohjaimen datasta. CRT-näytöt päivittävät näytön rivi riviltä, ​​kun taas litteät LCD-näytöt voivat päivittää jokaisen pikselin yksitellen.

Vertex

Kaikki 3D-näkymän objektit koostuvat pisteistä. Huippupiste on kolmiulotteisen avaruuden piste, jonka koordinaatit ovat X, Y ja Z. Monikulmioon voidaan ryhmitellä useita pisteitä: useimmiten se on kolmio, mutta monimutkaisemmat muodot ovat mahdollisia. Sen jälkeen monikulmioon lisätään pintakuvio, joka saa objektin näyttämään realistiselta. Yllä olevassa kuvassa näkyvä 3D-kuutio koostuu kahdeksasta kärjestä. Monimutkaisemmilla kohteilla on kaarevia pintoja, jotka koostuvat itse asiassa erittäin suuresta määrästä huippuja.

Rakenne

Tekstuuri on yksinkertaisesti mielivaltaisen kokoinen 2D-kuva, joka on kartoitettu 3D-objektiin sen pinnan simuloimiseksi. Esimerkiksi 3D-kuutiomme koostuu kahdeksasta kärjestä. Ennen tekstuurin levittämistä se näyttää yksinkertaiselta laatikolta. Mutta kun levitämme tekstuuria, laatikko muuttuu värilliseksi.

Shader

Pixel Shader -ohjelmien avulla näytönohjain voi tuottaa vaikuttavia tehosteita, kuten esimerkiksi tämä vesi Elder Scrolls: Oblivionissa.

Nykyään on olemassa kahdenlaisia ​​varjostimia: vertex ja pixel. Vertex-varjostinohjelmat voivat muokata tai muuntaa 3D-objekteja. Pikselivarjostusohjelmien avulla voit muuttaa pikselien värejä joidenkin tietojen perusteella. Kuvittele valonlähde 3D-näkymässä, joka saa valaistut kohteet hohtamaan kirkkaammin ja samalla aiheuttaa varjoja muille kohteille. Kaikki tämä saavutetaan muuttamalla pikselien väritietoja.

Pikselivarjostimia käytetään monimutkaisten tehosteiden luomiseen suosikkipeleissäsi. Esimerkiksi Shader-koodi voi saada 3D-miekan ympärillä olevat pikselit hehkumaan kirkkaammin. Toinen varjostaja voi käsitellä monimutkaisen 3D-objektin kaikki kärjet ja simuloida räjähdystä. Pelien kehittäjät käyttävät yhä enemmän kehittyneitä shader-ohjelmia luodakseen realistisia grafiikoita. Melkein jokainen moderni peli, jossa on rikas grafiikka, käyttää varjostimia.

Seuraavan Application Programming Interfacen (API), Microsoft DirectX 10:n, julkaisun myötä julkaistaan ​​kolmannen tyyppinen varjostin, nimeltään geometriavarjostimet. Niiden avulla on mahdollista rikkoa esineitä, muokata ja jopa tuhota ne halutusta tuloksesta riippuen. Kolmas varjostintyyppi voidaan ohjelmoida täsmälleen samalla tavalla kuin kaksi ensimmäistä, mutta sen rooli on erilainen.

Täyttöaste

Hyvin usein näytönohjaimen laatikosta löydät täyttösuhteen arvon. Pohjimmiltaan täyttöaste ilmaisee, kuinka nopeasti GPU voi tuottaa pikseleitä. Vanhemmissa näytönohjaimissa oli kolmion täyttöaste. Mutta nykyään on olemassa kahdenlaisia ​​täyttösuhteita: pikselien täyttösuhde ja tekstuurin täyttösuhde. Kuten jo mainittiin, pikselien täyttösuhde vastaa pikselien lähtönopeutta. Se lasketaan rasterioperaatioiden (ROP) lukumääränä kerrottuna kellotaajuudella.

ATi ja nVidia laskevat tekstuurin täyttösuhteen eri tavalla. Nvidia uskoo, että nopeus saadaan kertomalla pikseliputkien määrä kellotaajuudella. Ja ATi kertoo tekstuuriyksiköiden määrän kellotaajuudella. Periaatteessa molemmat menetelmät ovat oikeita, koska nVidia käyttää yhtä pintakuvioyksikköä pikselin varjostusyksikköä kohden (eli yhtä pikselin liukuhihnaa kohti).

Nämä määritelmät mielessä, siirrytään eteenpäin ja keskustellaan GPU:n tärkeimmistä toiminnoista, mitä ne tekevät ja miksi ne ovat niin tärkeitä.

GPU-arkkitehtuuri: Ominaisuudet

3D-grafiikan realistisuus riippuu suuresti näytönohjaimen suorituskyvystä. Mitä enemmän pikselivarjostuslohkoja prosessori sisältää ja mitä korkeampi taajuus, sitä enemmän tehosteita voidaan soveltaa 3D-kohtaukseen sen visuaalisen havainnoinnin parantamiseksi.

GPU sisältää monia erilaisia ​​toiminnallisia lohkoja. Joidenkin komponenttien lukumäärän perusteella voit arvioida, kuinka tehokas GPU on. Ennen kuin siirrymme pidemmälle, käydään läpi tärkeimmät toiminnalliset lohkot.

Vertex-prosessorit (vertex-varjostinyksiköt)

Kuten pikselivarjostinyksiköt, vertex-prosessorit suorittavat varjostuskoodin, joka koskettaa huippuja. Koska suurempi kärkibudjetti mahdollistaa monimutkaisempien 3D-objektien luomisen, vertex-prosessorien suorituskyky on erittäin tärkeä 3D-kohtauksissa, joissa on monimutkaisia ​​tai suuria kohteita. Vertex-varjostinyksiköillä ei kuitenkaan vielä ole niin selvää vaikutusta suorituskykyyn kuin pikseliprosessoreilla.

Pikseliprosessorit (pikselin varjostusyksiköt)

Pikseliprosessori on osa grafiikkasirua, joka on tarkoitettu pikselien varjostusohjelmien käsittelyyn. Nämä prosessorit suorittavat laskelmia, jotka koskevat vain pikseleitä. Koska pikselit sisältävät väritietoja, pikselivarjostimien avulla voit saavuttaa vaikuttavia graafisia tehosteita. Esimerkiksi suurin osa peleissä näkemistäsi vesitehosteista on luotu pikselivarjostimilla. Tyypillisesti pikseliprosessorien määrää käytetään vertaamaan näytönohjainten pikselien suorituskykyä. Jos yhdellä kortilla on kahdeksan pikselin varjostusyksikköä ja toisella 16 yksikköä, on loogista olettaa, että 16 yksikön näytönohjain on nopeampi käsittelemään monimutkaisia ​​pikselien varjostusohjelmia. Myös kellonopeus tulee ottaa huomioon, mutta nykyään pikseliprosessorien määrän kaksinkertaistaminen on energiatehokkaampaa kuin grafiikkasirun taajuuden kaksinkertaistaminen.

Yhdistetyt varjostimet

Unified shaderit eivät ole vielä saapuneet PC-maailmaan, mutta tuleva DirectX 10 -standardi perustuu samanlaiseen arkkitehtuuriin. Toisin sanoen vertex-, geometria- ja pikseliohjelmien koodirakenne on sama, vaikka varjostimet suorittavatkin erilaista työtä. Uusi spesifikaatio näkyy Xbox 360:ssa, jossa ATi on erityisesti suunnitellut GPU:n Microsoftille. On erittäin mielenkiintoista nähdä, mitä potentiaalia uusi DirectX 10 tuo.

Tekstuurikartoitusyksiköt (TMU)

Tekstuurit tulee valita ja suodattaa. Tämän työn tekevät pintakuviokartoitusyksiköt, jotka toimivat yhdessä pikseli- ja vertex-varjostinyksiköiden kanssa. TMU:n tehtävänä on soveltaa tekstuurioperaatioita pikseleihin. Grafiikkasuorittimen pintakuvioyksiköiden määrää käytetään usein vertailtaessa näytönohjainten tekstuurien suorituskykyä. Ei ole kohtuutonta olettaa, että näytönohjain, jossa on enemmän TMU:ita, tarjoaa paremman tekstuurin suorituskyvyn.

Raster Operator Units (ROP)

Rasteriprosessorit vastaavat pikselitietojen kirjoittamisesta muistiin. Nopeus, jolla tämä toiminto suoritetaan, on täyttöaste. 3D-kiihdyttimien alkuaikoina ROP ja täyttöaste olivat erittäin tärkeitä näytönohjainten ominaisuuksia. Nykyään ROP-työ on edelleen tärkeää, mutta näytönohjainten suorituskykyä eivät enää rajoita nämä lohkot kuten ennen. Siksi ROP:iden suorituskykyä (ja määrää) käytetään harvoin näytönohjaimen nopeuden arvioimiseen.

Kuljettimet

Putkilinjoja käytetään kuvaamaan näytönohjainten arkkitehtuuria ja antavat erittäin selkeän kuvan GPU:n suorituskyvystä.

Kuljetinta ei voida pitää tiukana teknisenä terminä. GPU käyttää erilaisia ​​putkia, jotka suorittavat erilaisia ​​toimintoja. Historiallisesti liukuhihna tarkoitti pikseliprosessoria, joka oli kytketty sen tekstuurikartoitusyksikköön (TMU). Esimerkiksi Radeon 9700 -näytönohjain käyttää kahdeksaa pikseliprosessoria, joista jokainen on kytketty omaan TMU:han, joten kortissa katsotaan olevan kahdeksan liukuhihnaa.

Mutta nykyaikaisia ​​prosessoreita on erittäin vaikea kuvata putkien lukumäärällä. Aiempiin malleihin verrattuna uudet prosessorit käyttävät modulaarista, pirstoutunutta rakennetta. Ati:ta voidaan pitää tämän alueen uudistajana, joka X1000-näytönohjainsarjan myötä siirtyi modulaariseen rakenteeseen, mikä mahdollisti suorituskyvyn parantamisen sisäisen optimoinnin avulla. Joitakin prosessorilohkoja käytetään enemmän kuin toisia, ja GPU-suorituskyvyn parantamiseksi ATi on yrittänyt löytää kompromissin tarvittavien lohkojen lukumäärän ja muottialueen (jota ei voi juurikaan lisätä) välillä. Tässä arkkitehtuurissa termi "pikseliputki" on jo menettänyt merkityksensä, koska pikseliprosessorit eivät ole enää yhteydessä omiin TMU:ihinsa. Esimerkiksi ATi Radeon X1600 GPU:ssa on 12 pikselin varjostinyksikköä ja vain neljä TMU-tekstuurikartoitusyksikköä. Siksi on mahdotonta sanoa, että tämän prosessorin arkkitehtuurissa on 12 pikselin liukuhihnaa, samoin kuin on mahdotonta sanoa, että niitä on vain neljä. Perinteisesti pikseliputket mainitaan kuitenkin edelleen.

Yllä olevat oletukset huomioon ottaen GPU:n pikseliputkien määrää käytetään usein videokorttien vertailuun (lukuun ottamatta ATi X1x00 -linjaa). Esimerkiksi, jos otat näytönohjaimet, joissa on 24 ja 16 liukuhihnaa, on melko järkevää olettaa, että kortti, jossa on 24 liukuhihnaa, on nopeampi.

GPU-arkkitehtuuri: Tekniikka

Tekninen prosessi

Tämä termi viittaa sirun yhden elementin (transistorin) kokoon ja valmistusprosessin tarkkuuteen. Teknisten prosessien parannukset mahdollistavat pienempikokoisten elementtien saamisen. Esimerkiksi 0,18 mikronin prosessi tuottaa suurempia ominaisuuksia kuin 0,13 mikronin prosessi, joten se ei ole yhtä tehokas. Pienemmät transistorit toimivat pienemmällä jännitteellä. Jännitteen lasku puolestaan ​​johtaa lämpövastuksen laskuun, mikä johtaa syntyvän lämmön määrän vähenemiseen. Teknisen prosessin parannukset mahdollistavat sirun toimintalohkojen välisen etäisyyden pienentämisen ja tiedonsiirto vie vähemmän aikaa. Lyhyemmät etäisyydet, pienemmät jännitteet ja muut parannukset mahdollistavat suurempien kellotaajuuksien saavuttamisen.

Ymmärtämistä vaikeuttaa jonkin verran se, että nykyään sekä mikrometrejä (μm) että nanometrejä (nm) käytetään kuvaamaan teknistä prosessia. Itse asiassa kaikki on hyvin yksinkertaista: 1 nanometri on 0,001 mikrometriä, joten 0,09 μm ja 90 nm prosessit ovat sama asia. Kuten edellä mainittiin, pienempi prosessitekniikka mahdollistaa suuremmat kellotaajuudet. Jos esimerkiksi vertaamme näytönohjainkortteja, joissa on 0,18 mikronin ja 0,09 mikronin (90 nm) sirut, on melko järkevää odottaa korkeampaa taajuutta 90 nm:n kortilta.

GPU:n kellonopeus

GPU:n kellonopeus mitataan megahertseinä (MHz), mikä tarkoittaa miljoonia kellojaksoja sekunnissa.

Kellonopeus vaikuttaa suoraan GPU:n suorituskykyyn. Mitä korkeampi se on, sitä enemmän työtä voidaan tehdä sekunnissa. Otetaan ensimmäisenä esimerkkinä nVidia GeForce 6600- ja 6600 GT -näytönohjaimet: 6600 GT GPU toimii 500 MHz:llä, kun taas tavallinen 6600-kortti toimii 400 MHz:llä. Koska prosessorit ovat teknisesti identtisiä, 6600 GT:n 20 %:n lisäys kellotaajuudessa parantaa suorituskykyä.

Mutta kellonopeus ei ole kaikki kaikessa. Muista, että arkkitehtuuri vaikuttaa suuresti suorituskykyyn. Toisessa esimerkissä otetaan GeForce 6600 GT ja GeForce 6800 GT -näytönohjain. 6600 GT GPU kellotaajuudella on 500 MHz, mutta 6800 GT toimii vain 350 MHz:llä. Otetaan nyt huomioon, että 6800 GT käyttää 16 pikselin liukuhihnaa, kun taas 6600 GT käyttää vain kahdeksaa. Siksi 6800 GT, jossa on 16 liukuhihnaa 350 MHz:llä, antaa suunnilleen saman suorituskyvyn kuin prosessori, jossa on kahdeksan liukuhihnaa ja kaksinkertainen kellonopeus (700 MHz). Tämän ansiosta kellotaajuutta voidaan helposti käyttää suorituskyvyn vertailuun.

Paikallinen videomuisti

Näytönohjaimen muisti vaikuttaa suuresti suorituskykyyn. Mutta eri muistiparametreilla on erilaisia ​​vaikutuksia.

Videomuistin koko

Videomuistin määrää voidaan luultavasti kutsua näytönohjaimen yliarvioituimmaksi parametriksi. Kokemattomat kuluttajat käyttävät usein videomuistin kapasiteettia vertaillakseen eri kortteja keskenään, mutta todellisuudessa kapasiteetilla on vain vähän vaikutusta suorituskykyyn verrattuna sellaisiin parametreihin kuin muistiväylän taajuus ja liitäntä (väylän leveys).

Useimmissa tapauksissa kortti, jossa on 128 Mt videomuistia, toimii lähes samalla tavalla kuin kortti, jossa on 256 Mt. Tietysti on tilanteita, joissa enemmän muistia parantaa suorituskykyä, mutta muista, että enemmän muistia ei automaattisesti johda nopeampiin pelinopeuksiin.

Äänenvoimakkuudesta voi olla hyötyä peleissä, joissa on korkearesoluutioisia tekstuureja. Pelin kehittäjät tarjoavat pelille useita tekstuurisarjoja. Ja mitä enemmän muistia näytönohjaimessa on, sitä korkeampi resoluutio ladatuilla tekstuureilla voi olla. Korkearesoluutioiset tekstuurit lisäävät pelin selkeyttä ja yksityiskohtia. Siksi on varsin järkevää ottaa kortti, jossa on paljon muistia, jos kaikki muut kriteerit vastaavat. Muistutetaan vielä kerran, että muistiväylän leveydellä ja sen taajuudella on paljon voimakkaampi vaikutus suorituskykyyn kuin kortin fyysisen muistin määrällä.

Muistiväylän leveys

Muistiväylän leveys on yksi muistin suorituskyvyn tärkeimmistä näkökohdista. Nykyaikaiset väylät ovat 64 - 256 bittiä leveitä ja joissain tapauksissa jopa 512 bittiä. Mitä leveämpi muistiväylä, sitä enemmän tietoa se voi siirtää kellojaksoa kohden. Ja tämä vaikuttaa suoraan tuottavuuteen. Jos esimerkiksi otat kaksi väylää, joilla on samat taajuudet, teoriassa 128-bittinen väylä siirtää kaksi kertaa enemmän dataa kellojaksoa kohden kuin 64-bittinen väylä. Ja 256-bittinen väylä on kaksi kertaa isompi.

Suurempi väylän kaistanleveys (ilmaistuna bitteinä tai tavuina sekunnissa, 1 tavu = 8 bittiä) antaa paremman muistin suorituskyvyn. Tästä syystä muistiväylä on paljon tärkeämpi kuin sen koko. Samoilla taajuuksilla 64-bittinen muistiväylä toimii vain 25 % nopeudella 256-bittisestä!

Otetaan seuraava esimerkki. Näytönohjain, jossa on 128 Mt videomuistia, mutta jossa on 256-bittinen väylä, tarjoaa paljon paremman muistin suorituskyvyn kuin 512 Mt:n malli, jossa on 64-bittinen väylä. On tärkeää huomata, että joissakin ATi X1x00 -linjan korteissa valmistajat ilmoittavat sisäisen muistiväylän tekniset tiedot, mutta olemme kiinnostuneita ulkoisen väylän parametreista. Esimerkiksi X1600:ssa on sisäinen rengasväylä, joka on 256 bittiä leveä, mutta ulkoinen vain 128 bittiä leveä. Ja todellisuudessa muistiväylä toimii 128-bittisellä suorituskyvyllä.

Muistityypit

Muisti voidaan jakaa kahteen pääluokkaan: SDR (single data transfer) ja DDR (double data transfer), joissa dataa siirretään kaksi kertaa nopeammin kellojaksoa kohden. Nykyään yhden lähetyksen SDR-tekniikka on vanhentunut. Koska DDR-muisti siirtää tietoja kaksi kertaa nopeammin kuin SDR, on tärkeää muistaa, että DDR-muistilla varustetut näytönohjaimet osoittavat usein kaksinkertaista taajuutta, eivät fyysistä taajuutta. Jos esimerkiksi DDR-muisti on määritetty taajuudelle 1000 MHz, tämä on tehollinen taajuus, jolla tavallisen SDR-muistin on toimittava saman suorituskyvyn saavuttamiseksi. Mutta itse asiassa fyysinen taajuus on 500 MHz.

Tästä syystä monet ovat yllättyneitä, kun näytönohjaimen muistiksi ilmoitetaan 1200 MHz DDR:n taajuus, ja apuohjelmat raportoivat 600 MHz. Joten sinun täytyy tottua siihen. DDR2- ja GDDR3/GDDR4-muistit toimivat samalla periaatteella eli kaksinkertaisella tiedonsiirrolla. Ero DDR-, DDR2-, GDDR3- ja GDDR4-muistin välillä on tuotantoteknologiassa ja joissakin yksityiskohdissa. DDR2 voi toimia korkeammilla taajuuksilla kuin DDR-muisti, ja DDR3 voi toimia jopa korkeammilla taajuuksilla kuin DDR2.

Muistiväylän taajuus

Kuten prosessori, muisti (tai tarkemmin sanottuna muistiväylä) toimii tietyillä kellotaajuuksilla, jotka mitataan megahertseinä. Tässä kellotaajuuden lisääminen vaikuttaa suoraan muistin suorituskykyyn. Ja muistiväylän taajuus on yksi parametreista, joita käytetään näytönohjainten suorituskyvyn vertailuun. Esimerkiksi, jos kaikki muut ominaisuudet (muistiväylän leveys jne.) ovat samat, on varsin loogista sanoa, että 700 MHz:n muistilla varustettu näytönohjain on nopeampi kuin 500 MHz:n muisti.

Jälleen, kellonopeus ei ole kaikki kaikessa. 700 MHz muisti 64-bittisellä väylällä on hitaampi kuin 400 MHz muisti 128-bittisellä väylällä. 400 MHz:n muistin suorituskyky 128-bittisellä väylällä vastaa suunnilleen 800 MHz:n muistia 64-bittisellä väylällä. Muista myös, että grafiikkasuorittimen ja muistin taajuudet ovat täysin eri parametreja, ja ne yleensä eroavat toisistaan.

Näytönohjaimen käyttöliittymä

Kaikki näytönohjaimen ja prosessorin välillä siirretyt tiedot kulkevat näytönohjaimen liitännän kautta. Nykyään näytönohjainkorteissa käytetään kolmenlaisia ​​liitäntöjä: PCI, AGP ja PCI Express. Ne eroavat kaistanleveydeltä ja muilta ominaisuuksiltaan. On selvää, että mitä suurempi läpijuoksu, sitä suurempi vaihtonopeus. Kuitenkin vain nykyaikaisimmat kortit voivat käyttää suurta kaistanleveyttä, ja silloinkin vain osittain. Jossain vaiheessa käyttöliittymän nopeus lakkasi olemasta pullonkaula, nykyään se on yksinkertaisesti riittävä.

Hitain väylä, jolle näytönohjaimet on valmistettu, on PCI (Peripheral Components Interconnect). Menemättä historiaan tietysti. PCI todella huononsi näytönohjainten suorituskykyä, joten ne siirtyivät AGP (Accelerated Graphics Port) -liitäntään. Mutta jopa AGP 1.0 ja 2x tekniset tiedot rajoittivat suorituskykyä. Kun standardi nosti nopeudet AGP 4x -tasolle, aloimme lähestyä näytönohjaimen kaistanleveyden käytännön rajaa. AGP 8x -spesifikaatio kaksinkertaisti suorituskyvyn AGP 4x:ään verrattuna (2,16 Gt/s), mutta emme enää saaneet havaittavaa lisäystä grafiikkasuorituskykyyn.

Uusin ja nopein väylä on PCI Express. Uudet näytönohjaimet käyttävät tyypillisesti PCI Express x16 -liitäntää, joka yhdistää 16 PCI Express -kaistaa 4 Gt/s (yhteen suuntaan) kokonaisnopeudella. Tämä on kaksi kertaa AGP 8x:n suoritusteho. PCI Express -väylä tarjoaa mainitun kaistanleveyden molempiin suuntiin (tiedonsiirto näytönohjaimelle ja näytönohjaimelta). Mutta AGP 8x -standardin nopeus oli jo riittävä, joten emme ole vielä kohdanneet tilannetta, jossa PCI Expressiin siirtyminen lisäisi suorituskykyä AGP 8x:ään verrattuna (jos muut laitteistoparametrit ovat samat). Esimerkiksi GeForce 6800 Ultran AGP-versio toimii identtisesti 6800 Ultra for PCI Expressin kanssa.

Nykyään on parasta ostaa kortti, jossa on PCI Express -liitäntä, ja se pysyy markkinoilla vielä useita vuosia. Tehokkaimpia kortteja ei enää valmisteta AGP 8x -liitännällä, ja PCI Express -ratkaisut ovat pääsääntöisesti helpompia löytää kuin AGP-analogeja ja ne ovat halvempia.

Ratkaisut useille näytönohjaimille

Useiden näytönohjainkorttien käyttö grafiikan suorituskyvyn parantamiseksi ei ole uusi idea. 3D-grafiikan alkuaikoina 3dfx tuli markkinoille kahdella rinnakkain toimivalla näytönohjaimella. Mutta 3dfx:n katoamisen myötä useiden kuluttajanäytönohjainten yhteiskäyttötekniikka unohdettiin, vaikka ATi olikin tuottanut vastaavia järjestelmiä ammattikäyttöön tarkoitettuihin simulaattoreihin Radeon 9700:n julkaisusta lähtien. Pari vuotta sitten tekniikka palasi markkinoille: nVidia SLI -ratkaisujen ja vähän myöhemmin ATi Crossfiren ilmaantuessa.

Useiden näytönohjainkorttien käyttäminen yhdessä tarjoaa riittävän suorituskyvyn pelin suorittamiseen korkealaatuisilla asetuksilla korkealla resoluutiolla. Mutta yhden tai toisen ratkaisun valitseminen ei ole niin yksinkertaista.

Aloitetaan siitä, että useaan näytönohjaimeen perustuvat ratkaisut vaativat paljon energiaa, joten virtalähteen tulee olla riittävän tehokas. Kaikki tämä lämpö on poistettava näytönohjaimesta, joten sinun on kiinnitettävä huomiota PC-koteloon ja jäähdytykseen, jotta järjestelmä ei ylikuumene.

Muista myös, että SLI/CrossFire vaatii sopivan emolevyn (joko jollekin tekniikalle), joka yleensä maksaa enemmän kuin tavalliset mallit. nVidia SLI -kokoonpano toimii vain tietyillä nForce4-korteilla, ja ATi CrossFire -kortit toimivat vain emolevyillä, joissa on CrossFire-piirisarja, tai tietyissä Intel-malleissa. Asioiden mutkistamiseksi jotkin CrossFire-kokoonpanot edellyttävät, että yksi korteista on erityinen: CrossFire Edition. CrossFiren julkaisun jälkeen joissakin näytönohjainmalleissa ATi salli yhteistyöteknologian sisällyttämisen PCI Express -väylän kautta, ja uusien ajuriversioiden julkaisun myötä mahdollisten yhdistelmien määrä lisääntyy. Silti laitteisto CrossFire ja vastaava CrossFire Edition -kortti tarjoavat paremman suorituskyvyn. Mutta CrossFire Edition -kortit ovat myös kalliimpia kuin tavalliset mallit. Tällä hetkellä voit ottaa ohjelmiston CrossFire-tilan käyttöön (ilman CrossFire Edition -korttia) Radeon X1300-, X1600- ja X1800 GTO -näytönohjainkorteissa.

On myös muita tekijöitä, jotka on otettava huomioon. Vaikka kaksi yhdessä toimivaa näytönohjainta lisää suorituskykyä, se ei ole läheskään kaksinkertainen. Mutta maksat kaksi kertaa enemmän rahaa. Useimmiten tuottavuuden kasvu on 20-60 %. Ja joissakin tapauksissa vastaavuuden laskennallisten lisäkustannusten vuoksi kasvua ei tapahdu ollenkaan. Tästä syystä usean kortin kokoonpanot eivät todennäköisesti ole kannattavia halvemmilla malleilla, koska kalliimpi näytönohjain on yleensä aina parempi kuin pari halvempaa korttia. Yleensä useimmille kuluttajille SLI/CrossFire-ratkaisun ostaminen ei ole järkevää. Mutta jos haluat ottaa käyttöön kaikki laadunparannusvaihtoehdot tai pelata äärimmäisillä resoluutioilla, esimerkiksi 2560x1600, kun sinun on laskettava yli 4 miljoonaa pikseliä kehystä kohti, et tule toimeen ilman kahta tai neljää parillista näytönohjainta.

Visuaaliset ominaisuudet

Puhtaasti laitteistospesifikaatioiden lisäksi GPU:iden eri sukupolvet ja mallit voivat vaihdella toimintojen osalta. Usein esimerkiksi sanotaan, että ATi Radeon X800 XT -sukupolven kortit ovat yhteensopivia Shader Model 2.0b (SM) kanssa, kun taas nVidia GeForce 6800 Ultra on yhteensopiva SM 3.0:n kanssa, vaikka niiden laitteistospesifikaatiot ovatkin lähellä toisiaan (16 putkia). ). Siksi monet kuluttajat tekevät valinnan yhden tai toisen ratkaisun puolesta tietämättäkään, mitä ero tarkoittaa.

Microsoft DirectX- ja Shader-malliversiot

Näitä nimiä käytetään useimmiten riita-asioissa, mutta harvat tietävät, mitä ne todella tarkoittavat. Ymmärtääksemme aloitetaan grafiikkasovellusliittymien historiasta. DirectX ja OpenGL ovat grafiikkasovellusliittymiä, eli sovellusohjelmointirajapintoja – avoimen koodin standardeja, jotka ovat kaikkien saatavilla.

Ennen grafiikkasovellusliittymien tuloa jokainen GPU-valmistaja käytti omaa mekanismiaan kommunikoidakseen pelien kanssa. Kehittäjien oli kirjoitettava erillinen koodi jokaiselle GPU:lle, jota he halusivat tukea. Erittäin kallis ja tehoton lähestymistapa. Tämän ongelman ratkaisemiseksi kehitettiin 3D-grafiikan sovellusliittymiä, jotta kehittäjät kirjoittavat koodin tietylle API:lle eivätkä tietylle näytönohjaimelle. Tämän jälkeen yhteensopivuusongelmat lankesivat näytönohjainten valmistajien harteille, joiden oli varmistettava, että ajurit ovat yhteensopivia API:n kanssa.

Ainoa vaikeus on se, että nykyään käytetään kahta erilaista API:a, nimittäin Microsoft DirectX ja OpenGL, jossa GL tarkoittaa Graphics Libraryä. Koska DirectX API on nykyään suositumpi peleissä, keskitymme siihen. Ja tällä standardilla oli vahvempi vaikutus pelien kehitykseen.

DirectX on Microsoftin luomus. Itse asiassa DirectX sisältää useita sovellusliittymiä, joista vain yhtä käytetään 3D-grafiikkaan. DirectX sisältää API:t äänelle, musiikille, syöttölaitteille jne. Direct3D API vastaa 3D-grafiikasta DirectX:ssä. Kun he puhuvat näytönohjaimista, he tarkoittavat tätä, joten tässä suhteessa käsitteet DirectX ja Direct3D ovat keskenään vaihdettavissa.

DirectX päivitetään säännöllisesti, kun grafiikkatekniikka kehittyy ja pelien kehittäjät ottavat käyttöön uusia peliohjelmointitekniikoita. Kun DirectX:n suosio kasvoi nopeasti, GPU-valmistajat alkoivat räätälöidä uusia tuotejulkaisuja DirectX-ominaisuuksien mukaisiksi. Tästä syystä näytönohjaimet on usein sidottu laitteistotukeen jollekin toiselle DirectX-sukupolvelle (DirectX 8, 9.0 tai 9.0c).

Asiaa mutkistaa, että Direct3D-sovellusliittymän osat voivat muuttua ajan myötä muuttamatta DirectX-sukupolvia. Esimerkiksi DirectX 9.0 -spesifikaatio määrittää tuen Pixel Shader 2.0:lle. Mutta DirectX 9.0c -päivitys sisältää Pixel Shader 3.0:n. Joten vaikka kortit ovat DirectX 9 -luokkaa, ne voivat tukea erilaisia ​​ominaisuuksia. Esimerkiksi Radeon 9700 tukee Shader Model 2.0:aa ja Radeon X1800 Shader Model 3.0:aa, vaikka molemmat kortit voidaan luokitella DirectX 9 -sukupolviksi.

Muista, että uusia pelejä luodessaan kehittäjät ottavat huomioon vanhojen koneiden ja näytönohjainten omistajat, koska jos jätät tämän käyttäjäsegmentin huomiotta, myyntitaso on alhaisempi. Tästä syystä peleihin on rakennettu useita koodipolkuja. DirectX 9 -luokan pelissä on todennäköisesti DirectX 8 -polku ja jopa DirectX 7 -polku yhteensopivuuden vuoksi. Mutta ainakin voit pelata jopa vanhoilla laitteistoilla.

Monet uudet pelit vaativat uusimman DirectX-version asentamisen, vaikka näytönohjain olisikin aiemmasta sukupolvesta. Toisin sanoen uusi peli, joka käyttää DirectX 8 -polkua, vaatii edelleen DirectX 9:n uusimman version asentamisen DirectX 8 -luokan näytönohjaimelle.

Mitä eroja on Direct3D-sovellusliittymän eri versioiden välillä DirectX:ssä? DirectX:n varhaiset versiot - 3, 5, 6 ja 7 - olivat suhteellisen yksinkertaisia ​​Direct3D API:n ominaisuuksien suhteen. Kehittäjät voivat valita visuaalisia tehosteita luettelosta ja sitten testata, kuinka ne toimivat pelissä. Seuraava suuri askel grafiikkaohjelmoinnissa oli DirectX 8. Se esitteli mahdollisuuden ohjelmoida näytönohjain varjostimien avulla, joten kehittäjät saivat ensimmäistä kertaa vapauden ohjelmoida tehosteita haluamallaan tavalla. DirectX 8 -tuetut versiot Pixel Shader 1.0 - 1.3 ja Vertex Shader 1.0. DirectX 8.1, päivitetty versio DirectX 8:sta, sai Pixel Shader 1.4:n ja Vertex Shader 1.1:n.

DirectX 9:ssä voit luoda vieläkin monimutkaisempia varjostusohjelmia. DirectX 9 tukee Pixel Shader 2.0:aa ja Vertex Shader 2.0:aa. DirectX 9c, päivitetty versio DirectX 9:stä, sisälsi Pixel Shader 3.0 -määrityksen.

DirectX 10, API:n tuleva versio, tulee Windows Vistan uuden version mukana. Et voi asentaa DirectX 10:tä Windows XP:hen.

HDR-valaistus ja OpenEXR HDR

HDR tulee sanoista "High Dynamic Range". Peli HDR-valolla voi tuottaa paljon realistisemman kuvan kuin peli ilman sitä, eivätkä kaikki näytönohjaimet tue HDR-valoa.

Ennen DirectX 9 -näytönohjainkorttien tuloa valaistuslaskelmien tarkkuus rajoitti GPU:ita voimakkaasti. Tähän asti valaistus on voitu laskea vain 256 (8 bitin) sisäisellä tasolla.

Kun DirectX 9 -näytönohjaimet ilmestyivät, ne pystyivät tuottamaan valaistusta erittäin tarkasti - täydet 24 bittiä tai 16,7 miljoonaa tasoa.

16,7 miljoonalla tasolla ja DirectX 9/Shader Model 2.0 -näytönohjainkorttien suorituskyvyn seuraava askel, HDR-valaistus tuli mahdolliseksi tietokoneissa. Tämä on melko monimutkainen tekniikka, ja sinun on katsottava sitä dynamiikassa. Yksinkertaisesti sanottuna HDR-valaistus lisää kontrastia (tummat sävyt näyttävät tummemmilta, vaaleat vaaleammat) ja lisää valaistuksen yksityiskohtia tummilla ja vaaleilla alueilla. Peli HDR-valolla näyttää elävämmältä ja realistisemmalta kuin ilman sitä.

Uusimman Pixel Shader 3.0 -spesifikaation mukaiset GPU:t mahdollistavat suuremman 32-bittisen tarkkuuden valaistuslaskelmien ja liukulukusekoituksen. Näin ollen SM 3.0 -luokan näytönohjaimet voivat tukea erityistä OpenEXR HDR -valomenetelmää, joka on suunniteltu erityisesti elokuvateollisuudelle.

Jotkut pelit, jotka tukevat vain OpenEXR HDR -valoa, eivät toimi HDR-valaistuksen kanssa Shader Model 2.0 -näytönohjainkorteissa. Kuitenkin pelit, jotka eivät ole riippuvaisia ​​OpenEXR-menetelmästä, toimivat missä tahansa DirectX 9 -näytönohjaimessa. Esimerkiksi Oblivion käyttää OpenEXR HDR -menetelmää ja sallii HDR-valaistuksen vain uusimmissa näytönohjaimissa, jotka tukevat Shader Model 3.0 -spesifikaatiota. Esimerkiksi nVidia GeForce 6800 tai ATi Radeon X1800. Pelit, jotka käyttävät Half-Life 2:n 3D-moottoria, mukaan lukien Counter-Strike: Source ja tuleva Half-Life 2: Aftermath, sallivat HDR-renderöinnin käyttöön vanhemmilla DirectX 9 -näytönohjainkorteilla, jotka tukevat vain Pixel Shader 2.0:aa. Esimerkkejä ovat GeForce 5- tai ATi Radeon 9500 -sarja.

Muista lopuksi, että kaikki HDR-renderöinnin muodot vaativat vakavaa prosessointitehoa ja voivat saada jopa tehokkaimmat GPU:t polvilleen. Jos haluat pelata uusimpia pelejä HDR-valaistuksella, tehokas grafiikka on pakollinen.

Koko näytön anti-aliasing

Koko näytön anti-aliasing (lyhennettynä AA) mahdollistaa tyypillisten "tikkaita" poistamisen polygonien rajoilla. Mutta on otettava huomioon, että koko näytön anti-aliasing kuluttaa paljon laskentaresursseja, mikä johtaa kehysnopeuksien laskuun.

Anti-aliasing on hyvin riippuvainen videomuistin suorituskyvystä, joten nopealla muistilla varustettu nopea näytönohjain pystyy laskemaan koko näytön anti-aliasoinnin vähemmällä tehokkuudella kuin halpa näytönohjain. Antialiasointi voidaan ottaa käyttöön eri tiloissa. Esimerkiksi 4x antialiasing tuottaa paremman kuvan kuin 2x antialiasing, mutta se on suuri hitti suorituskyvylle. 2x antialiasing kaksinkertaistaa vaaka- ja pystyresoluution, kun taas 4x-tila nelinkertaistaa sen.

Tekstuurien suodatus

Pintakuvioita käytetään pelin kaikkiin 3D-objekteihin, ja mitä suurempi on näytettävän pinnan kulma, sitä vääristyneemmältä pintakuvio näyttää. Tämän vaikutuksen poistamiseksi GPU:t käyttävät tekstuurisuodatusta.

Ensimmäistä suodatusmenetelmää kutsuttiin bilineaariksi ja se tuotti tunnusomaisia ​​raitoja, jotka eivät olleet kovin miellyttäviä silmälle. Tilanne parani trilineaarisen suodatuksen käyttöönoton myötä. Molemmat vaihtoehdot toimivat nykyaikaisissa näytönohjaimissa käytännössä ilman suorituskykyä.

Nykyään paras tapa suodattaa tekstuureja on anisotrooppinen suodatus (AF). Kuten koko näytön antialiasing, anisotrooppinen suodatus voidaan ottaa käyttöön eri tasoilla. Esimerkiksi 8x AF tarjoaa paremman suodatuslaadun kuin 4x AF. Kuten koko näytön antialiasing, anisotrooppinen suodatus vaatii tietyn määrän prosessointitehoa, joka kasvaa AF-tason noustessa.

Korkean resoluution tekstuurit

Kaikki 3D-pelit on luotu erityisiä vaatimuksia silmällä pitäen, ja yksi näistä vaatimuksista määrittää pelin tarvitseman tekstuurimuistin. Kaikkien tarvittavien tekstuurien tulee mahtua näytönohjaimen muistiin pelin aikana, muuten suorituskyky heikkenee merkittävästi, koska tekstuurin saaminen RAM-muistiin aiheuttaa huomattavan viiveen, puhumattakaan kiintolevyn sivutustiedostosta. Siksi, jos pelinkehittäjä laskee 128 Mt videomuistin vähimmäisvaatimuksena, aktiivisten tekstuurien sarja ei saa ylittää 128 Mt missään vaiheessa.

Nykyaikaisissa peleissä on useita tekstuurisarjoja, joten peli toimii ongelmitta vanhemmilla näytönohjaimilla, joissa on vähemmän videomuistia, sekä uusilla korteilla, joissa on enemmän videomuistia. Pelissä voi esimerkiksi olla kolme pintakuviosarjaa: 128 Mt, 256 Mt ja 512 Mt. Nykyään on hyvin vähän pelejä, jotka tukevat 512 Mt videomuistia, mutta ne ovat silti objektiivisin syy ostaa näytönohjain, jolla on näin paljon muistia. Vaikka muistin lisäyksellä on vain vähän tai ei ollenkaan vaikutusta suorituskykyyn, hyödyt parantuneesta visuaalisesta laadusta, jos peli tukee asianmukaista pintakuviosarjaa.

Mitä sinun tulee tietää videokorteista?

Yhteydessä

Nykyaikaiset grafiikkaprosessorit sisältävät monia toiminnallisia lohkoja, joiden lukumäärä ja ominaisuudet määräävät lopullisen renderöintinopeuden, mikä vaikuttaa pelin mukavuuteen. Näiden lohkojen vertailun perusteella eri videosiruissa voit karkeasti arvioida, kuinka nopea tietty GPU on. Videosiruilla on melko paljon ominaisuuksia. Tässä osiossa tarkastellaan vain tärkeimpiä niistä.

Videosirun kellonopeus

GPU:n toimintataajuutta mitataan yleensä megahertseinä eli miljoonina sykleinä sekunnissa. Tämä ominaisuus vaikuttaa suoraan videosirun suorituskykyyn - mitä korkeampi se on, sitä enemmän työtä GPU voi suorittaa aikayksikköä kohden, käsitellä suuremman määrän pisteitä ja pikseleitä. Esimerkki tosielämästä: Radeon HD 6670 -kortille asennetun videosirun taajuus on 840 MHz, ja täsmälleen sama siru Radeon HD 6570 -mallissa toimii 650 MHz:n taajuudella. Näin ollen kaikki tärkeimmät suorituskykyominaisuudet vaihtelevat. Mutta se ei ole vain sirun toimintataajuus, joka määrää sen suorituskyvyn, sillä itse grafiikkaarkkitehtuuri vaikuttaa suuresti: suoritusyksiköiden suunnittelu ja lukumäärä, niiden ominaisuudet jne.

Joissakin tapauksissa yksittäisten GPU-lohkojen kellonopeus eroaa muun sirun nopeudesta. Toisin sanoen GPU:n eri osat toimivat eri taajuuksilla, ja tämä tehtiin tehokkuuden lisäämiseksi, koska jotkut lohkot pystyvät toimimaan korkeammilla taajuuksilla, kun taas toiset eivät. Useimmat NVIDIAn GeForce-näytönohjaimet on varustettu näillä GPU:illa. Tuore esimerkki on GTX 580 -mallin videosiru, josta suurin osa toimii 772 MHz:n taajuudella, ja sirun yleisten laskentayksiköiden taajuus on kaksinkertaistettu - 1544 MHz.

Täyttöaste

Täyttöaste osoittaa, kuinka nopeasti videosiru pystyy piirtämään pikseleitä. Täyttösuhdetta on kahta tyyppiä: pikselien täyttösuhde ja tekstuurin täyttösuhde. Pikselien täyttöaste näyttää pikseleiden piirtämisnopeuden näytölle ja riippuu toimintataajuudesta ja ROP-yksiköiden (rasterointi- ja sekoitustoimintoyksiköiden) lukumäärästä, ja tekstuurin täyttöaste on pintakuviotietojen näytteistysnopeus, joka riippuu toimintataajuudesta. ja tekstuuriyksiköiden lukumäärä.

Esimerkiksi GeForce GTX 560 Ti:n pikselien huipputäyttönopeus on 822 (sirun taajuus) × 32 (ROP-yksiköiden määrä) = 26304 megapikseliä sekunnissa ja tekstuurin täyttönopeus on 822 × 64 (tekstuuriyksiköiden määrä) = 52608 megapikseliä /s. Yksinkertaistettuna tilanne on tällainen - mitä suurempi ensimmäinen numero, sitä nopeammin näytönohjain pystyy piirtämään valmiita pikseleitä, ja mitä suurempi toinen, sitä nopeammin pintakuviointitiedot näytteistetään.

Vaikka "puhtaan" täyttöasteen merkitys on viime aikoina laskenut huomattavasti ja väistänyt laskentanopeuden, nämä parametrit ovat edelleen erittäin tärkeitä, erityisesti peleissä, joissa on yksinkertainen geometria ja suhteellisen yksinkertaiset pikseli- ja kärkilaskemat. Joten molemmat parametrit ovat edelleen tärkeitä nykyaikaisissa peleissä, mutta niiden on oltava tasapainossa. Siksi ROP-yksiköiden määrä nykyaikaisissa videosiruissa on yleensä pienempi kuin tekstuuriyksiköiden lukumäärä.

Laskennallisten (shader) yksiköiden tai prosessorien lukumäärä

Ehkä nyt nämä lohkot ovat videosirun pääosat. He ajavat erityisiä ohjelmia, jotka tunnetaan nimellä Shader. Lisäksi, jos aikaisemmat pikselivarjostimet suorittivat pikselivarjostuslohkoja ja vertex-varjostimet suorittivat vertex-lohkoja, graafiset arkkitehtuurit yhtenäistettiin jonkin aikaa, ja nämä yleiset laskentayksiköt alkoivat käsitellä erilaisia ​​​​laskelmia: huippupiste-, pikseli-, geometrisia ja jopa universaaleja laskelmia.

Ensimmäistä kertaa yhtenäistä arkkitehtuuria käytettiin Microsoft Xbox 360 -pelikonsolin videosirussa. Tämän grafiikkaprosessorin on kehittänyt ATI (myöhemmin AMD osti sen). Ja henkilökohtaisten tietokoneiden videosiruissa NVIDIA GeForce 8800 -kortille ilmestyi yhtenäisiä varjostusyksiköitä. Ja siitä lähtien kaikki uudet videosirut perustuvat yhtenäiseen arkkitehtuuriin, jolla on universaali koodi eri varjostusohjelmille (vertex, pixel, geometric). jne.), ja vastaavat Unified-prosessorit voivat suorittaa mitä tahansa ohjelmaa.

Laskentayksiköiden lukumäärän ja niiden taajuuden perusteella voit verrata eri näytönohjainkorttien matemaattista suorituskykyä. Useimpia pelejä rajoittaa nyt pikselivarjostimien suorituskyky, joten näiden lohkojen määrä on erittäin tärkeä. Jos esimerkiksi yksi näytönohjainmalli perustuu grafiikkasuorittimeen, jonka kokoonpanossa on 384 laskentaprosessoria, ja toisessa saman linjan GPU:ssa on 192 laskentayksikköä, niin toinen on samalla taajuudella kaksi kertaa hitaampi prosessoida mitä tahansa tyyppisiä varjostimia, ja yleensä ne ovat samat tuottavampia.

Vaikka suorituskyvystä on mahdotonta tehdä yksiselitteisiä johtopäätöksiä pelkästään laskentayksiköiden lukumäärän perusteella, on kuitenkin otettava huomioon kellotaajuudet sekä eri sukupolvien ja siruvalmistajien yksiköiden erilainen arkkitehtuuri. Vain näiden lukujen perusteella voit vertailla siruja vain yhden valmistajan saman sarjan sisällä: AMD tai NVIDIA. Muissa tapauksissa sinun on kiinnitettävä huomiota suorituskykytesteihin sinua kiinnostavissa peleissä tai sovelluksissa.

Tekstuuriyksiköt (TMU)

Nämä GPU-yksiköt toimivat yhdessä laskentaprosessorien kanssa, ne valitsevat ja suodattavat pintakuvioita ja muita tietoja, joita tarvitaan kohtauksen rakentamiseen ja yleiskäyttöisiin laskelmiin. Tekstuuriyksiköiden määrä videosirussa määrittää tekstuurin suorituskyvyn – eli nopeuden, jolla teksteleitä haetaan tekstuurista.

Vaikka viime aikoina on panostettu enemmän matemaattisiin laskelmiin ja joitain tekstuureja on korvattu proseduurilla, on TMU-lohkojen kuormitus edelleen melko suuri, koska päätekstuurien lisäksi valinnat on tehtävä myös normaali- ja siirtymäkartoista, sekä näytön ulkopuoliset renderöinnin kohteen renderöintipuskurit.

Ottaen huomioon monien pelien painopisteet, mukaan lukien teksturointiyksiköiden suorituskyvyn, voidaan sanoa, että TMU-yksiköiden lukumäärä ja vastaava korkea tekstuurin suorituskyky ovat myös yksi videosirujen tärkeimmistä parametreista. Tällä parametrilla on erityinen vaikutus kuvan renderöinnin nopeuteen käytettäessä anisotrooppista suodatusta, joka vaatii lisää pintakuvionäytteitä, sekä monimutkaisissa pehmeän varjon algoritmeissa ja uusissa algoritmeissa, kuten Screen Space Ambient Occlusion.

Rasterointioperaatioyksiköt (ROP)

Rasterointiyksiköt suorittavat näytönohjaimen laskemien pikselien puskureihin kirjoittamisen ja niiden sekoittamisen (sekoitus) toiminnot. Kuten yllä totesimme, ROP-lohkojen suorituskyky vaikuttaa täyttöasteeseen ja tämä on yksi kaikkien aikojen näytönohjainten pääominaisuuksista. Ja vaikka sen merkitys on myös hieman laskenut viime aikoina, on edelleen tapauksia, joissa sovelluksen suorituskyky riippuu ROP-lohkojen nopeudesta ja lukumäärästä. Useimmiten tämä johtuu aktiivisesta jälkikäsittelysuodattimien käytöstä ja antialiasingista, joka on käytössä korkeissa peliasetuksissa.

Todettakoon vielä kerran, että nykyaikaisia ​​videosiruja ei voida arvioida pelkästään eri lohkojen lukumäärällä ja niiden taajuudella. Jokainen GPU-sarja käyttää uutta arkkitehtuuria, jossa suoritusyksiköt poikkeavat suuresti vanhoista ja eri yksiköiden lukumäärän suhde voi vaihdella. Siten joissakin ratkaisuissa AMD ROP -yksiköt voivat suorittaa enemmän työtä kellojaksoa kohti kuin NVIDIA-ratkaisujen yksiköt ja päinvastoin. Sama pätee TMU-tekstuuriyksiköiden ominaisuuksiin - ne ovat erilaisia ​​​​eri valmistajien GPU-sukupolvissa, ja tämä on otettava huomioon vertailussa.

Geometriset lohkot

Viime aikoihin asti geometrian käsittelyyksiköiden lukumäärä ei ollut erityisen tärkeä. Yksi lohko GPU:ssa riitti useimpiin tehtäviin, koska pelien geometria oli melko yksinkertainen ja suorituskyvyn pääpaino oli matemaattisissa laskelmissa. Rinnakkaisen geometrian käsittelyn merkitys ja vastaavien lohkojen määrä kasvoi dramaattisesti geometrian tessellaatiotuen käyttöönoton myötä DirectX 11:ssä. NVIDIA oli ensimmäinen, joka rinnasti geometristen tietojen käsittelyn, kun useita vastaavia lohkoja ilmestyi sen GF1xx-perheen siruihin. Sitten AMD julkaisi samanlaisen ratkaisun (vain Cayman-siruihin perustuvissa Radeon HD 6700 -sarjan huippuratkaisuissa).

Tässä materiaalissa emme mene yksityiskohtiin, ne voidaan lukea DirectX 11 -yhteensopiville näytönohjainprosessoreillemme omistetuista perusmateriaaleista. Meille on tärkeää, että geometrian prosessointiyksiköiden määrällä on valtava vaikutus yleiseen suorituskykyyn uusimmissa tessellaatiota käyttävissä peleissä, kuten Metro 2033, HAWX 2 ja Crysis 2 (uusimmilla korjauspäivityksillä). Ja kun valitset modernin pelinäytönohjaimen, on erittäin tärkeää kiinnittää huomiota geometriseen suorituskykyyn.

Videomuistin koko

Videosirut käyttävät omaa muistia tarvittavan datan tallentamiseen: pintakuvioita, huippuja, puskuridataa jne. Vaikuttaa siltä, ​​että mitä enemmän sitä on, sen parempi. Mutta se ei ole niin yksinkertaista; näytönohjaimen tehon arvioiminen videomuistin määrän perusteella on yleisin virhe! Kokemattomat käyttäjät yliarvioivat useimmiten videomuistin arvon ja käyttävät sitä silti eri näytönohjainmallien vertailuun. Tämä on ymmärrettävää - tämä parametri on yksi ensimmäisistä, jotka ilmoitetaan valmiiden järjestelmien ominaisuusluetteloissa, ja se on kirjoitettu suurella fontilla näytönohjainlaatikoihin. Siksi kokemattomalle ostajalle näyttää siltä, ​​​​että koska muistia on kaksi kertaa enemmän, tällaisen ratkaisun nopeuden tulisi olla kaksi kertaa suurempi. Todellisuus eroaa tästä myytistä siinä, että muistia on eri tyyppejä ja ominaisuuksia, ja tuottavuuden kasvu kasvaa vain tiettyyn volyymiin asti ja saavutettuaan se yksinkertaisesti pysähtyy.

Joten jokaisessa pelissä ja tietyillä asetuksilla ja pelikohtauksilla on tietty määrä videomuistia, joka riittää kaikille tiedoille. Ja vaikka laittaisit sinne 4 Gt videomuistia, sillä ei ole mitään syytä nopeuttaa renderöintiä, nopeutta rajoittavat yllä mainitut suoritusyksiköt ja muistia yksinkertaisesti riittää. Tästä syystä monissa tapauksissa 1,5 Gt:n videomuistilla varustettu näytönohjain toimii samalla nopeudella kuin 3 Gt:n kortti (kaikki muut asiat ovat samat).

On tilanteita, joissa enemmän muistia johtaa näkyvään suorituskyvyn kasvuun - nämä ovat erittäin vaativia pelejä, etenkin erittäin korkealla resoluutiolla ja maksimilaatuasetuksella. Mutta tällaisia ​​tapauksia ei aina tapahdu, ja muistin määrä on otettava huomioon unohtamatta, että suorituskyky ei yksinkertaisesti nouse tietyn määrän yläpuolelle. Muistisiruilla on myös tärkeämpiä parametreja, kuten muistiväylän leveys ja sen toimintataajuus. Tämä aihe on niin laaja, että käsittelemme yksityiskohtaisemmin videomuistin määrän valintaa materiaalimme kuudennessa osassa.

Muistiväylän leveys

Muistiväylän leveys on tärkein muistin kaistanleveyteen (MBB) vaikuttava ominaisuus. Suurempi leveys mahdollistaa enemmän tiedon siirtämisen videomuistista GPU:lle ja takaisin aikayksikköä kohti, millä on positiivinen vaikutus suorituskykyyn useimmissa tapauksissa. Teoriassa 256-bittinen väylä voi siirtää kaksi kertaa enemmän dataa kellojaksoa kohden kuin 128-bittinen väylä. Käytännössä ero renderöintinopeudessa, vaikka se ei saavutakaan kaksinkertaista, on monissa tapauksissa hyvin lähellä tätä, kun korostetaan videomuistin kaistanleveyttä.

Nykyaikaiset pelinäytönohjaimet käyttävät erilaisia ​​väyläleveyksiä: 64 - 384 bittiä (aiemmin oli siruja 512-bittisellä väylällä), riippuen tietyn GPU-mallin hintaluokasta ja julkaisuajasta. Halvimmissa low-end näytönohjaimissa käytetään useimmiten 64 ja harvemmin 128 bittiä, keskitasolla 128 - 256 bittiä ja ylemmän hintaluokan näytönohjaimissa käytetään 256 - 384 bitin levyisiä väyliä. Väylän leveys ei voi enää kasvaa pelkästään fyysisten rajoitusten vuoksi - GPU-suulakkeen koko ei riitä yli 512-bittiseen väylään, ja tämä on liian kallista. Siksi muistin kaistanleveyttä lisätään nyt käyttämällä uudentyyppisiä muistia (katso alla).

Videomuistin taajuus

Toinen muistin kaistanleveyteen vaikuttava parametri on sen kellotaajuus. Ja kaistanleveyden lisääminen vaikuttaa usein suoraan näytönohjaimen suorituskykyyn 3D-sovelluksissa. Nykyaikaisten näytönohjainkorttien muistiväylätaajuus vaihtelee välillä 533 (1066, kun otetaan huomioon kaksinkertaistuminen) MHz - 1375 (5500, kun otetaan huomioon nelinkertaistuminen) MHz, eli se voi vaihdella yli viisi kertaa! Ja koska kaistanleveys riippuu sekä muistin taajuudesta että sen väylän leveydestä, 800 (3200) MHz:n taajuudella toimivan 256-bittisen väylän muistilla on suurempi kaistanleveys verrattuna muistiin, joka toimii 1000 (4000) MHz:n taajuudella 128:lla. -bittinen bussi.

Erityistä huomiota muistiväylän leveyden parametreihin, sen tyyppiin ja toimintataajuuteen tulee kiinnittää ostettaessa suhteellisen edullisia näytönohjaimia, joista monissa on vain 128- tai jopa 64-bittisiä liitäntöjä, mikä vaikuttaa erittäin negatiivisesti niiden suorituskykyyn. . Yleensä emme suosittele 64-bittistä videomuistiväylää käyttävän näytönohjaimen ostamista pelitietokoneeseen. On suositeltavaa suosia vähintään keskitasoa vähintään 128- tai 192-bittisellä väylällä.

Muistityypit

Nykyaikaiset näytönohjaimet on varustettu useilla erilaisilla muistityypeillä. Vanhaa yhden nopeuden SDR-muistia ei enää löydy mistään, mutta nykyaikaisilla DDR- ja GDDR-muistityypeillä on huomattavasti erilaiset ominaisuudet. Erilaiset DDR- ja GDDR-tyypit mahdollistavat kaksi tai neljä kertaa enemmän datan siirtämisen samalla kellotaajuudella aikayksikköä kohden, ja siksi toimintataajuuden luku usein kaksin- tai nelinkertaistuu, kerrottuna kahdella tai neljällä. Joten jos taajuus on määritetty DDR-muistille 1400 MHz, tämä muisti toimii 700 MHz:n fyysisellä taajuudella, mutta ne osoittavat niin sanotun "tehollisen" taajuuden, eli sen, jolla SDR-muistin on toimittava tarjotakseen saman kaistanleveyden. Sama asia GDDR5:n kanssa, mutta taajuus on jopa nelinkertaistunut.

Uusien muistityyppien tärkein etu on kyky toimia suuremmilla kellotaajuuksilla ja siten lisätä kaistanleveyttä aiempiin teknologioihin verrattuna. Tämä saavutetaan lisääntyneiden latenssien kustannuksella, jotka eivät kuitenkaan ole niin tärkeitä näytönohjainkorteille. Ensimmäinen DDR2-muistia käyttänyt kortti oli NVIDIA GeForce FX 5800 Ultra. Sittemmin grafiikkamuistitekniikka on kehittynyt merkittävästi, ja kehitettiin GDDR3-standardi, joka on lähellä DDR2-spesifikaatioita, ja joitain muutoksia on tehty erityisesti näytönohjainkortteihin.

GDDR3 on erityisesti näytönohjainkorteille suunniteltu muisti, jossa on samat tekniikat kuin DDR2, mutta paremmilla kulutus- ja lämmönpoisto-ominaisuuksilla, mikä mahdollisti korkeammilla kellotaajuuksilla toimivien sirujen luomisen. Huolimatta siitä, että standardin on kehittänyt ATI, ensimmäinen näytönohjain, joka käytti sitä, oli NVIDIA GeForce FX 5700 Ultran toinen muunnos, ja seuraava oli GeForce 6800 Ultra.

GDDR4 on "grafiikkamuistin" jatkokehitys, joka toimii lähes kaksi kertaa nopeammin kuin GDDR3. Tärkeimmät erot GDDR4:n ja GDDR3:n välillä, jotka ovat merkittäviä käyttäjille, ovat jälleen kerran lisääntyneet toimintataajuudet ja pienempi virrankulutus. Teknisesti GDDR4-muisti ei eroa kovinkaan paljon GDDR3:sta, se on samojen ideoiden jatkokehitys. Ensimmäiset näytönohjaimet, joissa oli GDDR4-siruja, olivat ATI Radeon X1950 XTX, eikä NVIDIA julkaissut tämäntyyppisiin muistiin perustuvia tuotteita. Uusien muistisirujen etuna GDDR3:een verrattuna on, että moduulien virrankulutus voi olla noin kolmanneksen pienempi. Tämä saavutetaan GDDR4:n alhaisemmalla nimellisjännitteellä.

GDDR4:ää ei kuitenkaan käytetä laajalti edes AMD-ratkaisuissa. RV7x0-grafiikkasuorittimien perheestä alkaen näytönohjaimen muistiohjaimet tukevat uudentyyppistä GDDR5-muistia, joka toimii tehokkaalla nelinkertaisella taajuudella jopa 5,5 GHz:iin ja sitä korkeammalla (teoreettisesti jopa 7 GHz:n taajuudet ovat mahdollisia). 176 Gt/s 256-bittisellä rajapinnalla. Jos muistin kaistanleveyden lisäämiseksi GDDR3/GDDR4-muistissa jouduttiin käyttämään 512-bittistä väylää, niin GDDR5:een siirtyminen mahdollisti suorituskyvyn kaksinkertaistamisen pienemmillä kristallikoilla ja pienemmällä virrankulutuksella.

Nykyaikaisimmat videomuistityypit ovat GDDR3 ja GDDR5, ne eroavat DDR:stä joissakin yksityiskohdissa ja toimivat myös kaksois-/neljänkertaisella tiedonsiirrolla. Tämäntyyppiset muistit käyttävät tiettyjä erityistekniikoita toimintataajuuden lisäämiseen. Näin ollen GDDR2-muisti toimii yleensä korkeammilla taajuuksilla verrattuna DDR:ään, GDDR3 vielä korkeammilla taajuuksilla, ja GDDR5 tarjoaa suurimman taajuuden ja kaistanleveyden tällä hetkellä. Mutta edullisissa malleissa on edelleen "ei-graafinen" DDR3-muisti, jonka taajuus on huomattavasti pienempi, joten sinun on valittava näytönohjain huolellisemmin.