Ciri-ciri modernisasi nasional, atau apa yang tidak boleh dihemat. Jumlah unit atau prosesor komputasi (shader) Jumlah prosesor shader dalam kartu

Di bagian pertama panduan kartu video untuk pemula, kami melihat komponen utama: antarmuka, output, sistem pendingin, GPU, dan memori video. Pada bagian kedua kita akan membahas tentang fungsi dan teknologi kartu video.

Komponen dasar kartu video:

  • keluar;
  • antarmuka;
  • sistem pendingin;
  • GPU;
  • memori video.

Bagian 2 (artikel ini): teknologi grafis:

  • kamus;
  • Arsitektur GPU: fitur
    unit vertex/piksel, shader, kecepatan pengisian, unit tekstur/raster, saluran pipa;
  • Arsitektur GPU: teknologi
    proses teknis, frekuensi GPU, memori video lokal (volume, bus, jenis, frekuensi), solusi dengan beberapa kartu video;
  • fungsi visual
    DirectX, rentang dinamis tinggi (HDR), anti-aliasing layar penuh, pemfilteran tekstur, tekstur resolusi tinggi.

Glosarium istilah grafis dasar

Kecepatan Penyegaran

Sama seperti di bioskop atau TV, komputer Anda mensimulasikan gerakan di monitor dengan menampilkan rangkaian bingkai. Kecepatan refresh monitor menunjukkan berapa kali per detik gambar di layar akan diperbarui. Misalnya, frekuensi 75 Hz sama dengan 75 pembaruan per detik.

Jika komputer memproses frame lebih cepat daripada output monitor, maka masalah mungkin terjadi pada game. Misalnya, jika komputer merender 100 frame per detik, dan kecepatan refresh monitor adalah 75 Hz, maka karena tumpang tindih, monitor hanya dapat menampilkan sebagian gambar selama periode penyegarannya. Hasilnya, artefak visual muncul.

Sebagai solusinya, Anda dapat mengaktifkan V-Sync (sinkronisasi vertikal). Ini membatasi jumlah frame yang dapat dihasilkan komputer pada kecepatan refresh monitor, sehingga mencegah artefak. Jika Anda mengaktifkan V-Sync, jumlah frame yang dihitung dalam game tidak akan pernah melebihi kecepatan refresh. Artinya, pada 75 Hz komputer akan mengeluarkan tidak lebih dari 75 frame per detik.

Kata "Pixel" adalah singkatan dari " foto mendatang el ement" adalah elemen gambar. Ini adalah titik kecil pada layar yang dapat bersinar dalam warna tertentu (dalam banyak kasus, bayangan ditampilkan dengan kombinasi tiga warna dasar: merah, hijau dan biru). Jika resolusi layar adalah 1024x768, maka Anda dapat melihat matriks dengan lebar 1024 piksel dan tinggi 768 piksel. Semua piksel bersama-sama membentuk gambar. Gambar di layar diperbarui dari 60 hingga 120 kali per detik, tergantung pada jenis tampilan dan output data dari kartu video. Monitor CRT memperbarui tampilan baris demi baris, dan monitor LCD panel datar dapat menyegarkan setiap piksel satu per satu.

Semua objek dalam adegan 3D terdiri dari simpul. Simpul adalah sebuah titik dalam ruang tiga dimensi dengan koordinat X, Y, dan Z. Beberapa simpul dapat dikelompokkan menjadi sebuah poligon: paling sering berupa segitiga, tetapi bentuk yang lebih kompleks juga dimungkinkan. Tekstur kemudian diterapkan pada poligon, yang membuat objek terlihat realistis. Kubus 3D yang ditunjukkan pada ilustrasi di atas terdiri dari delapan simpul. Objek yang lebih kompleks memiliki permukaan melengkung yang sebenarnya terdiri dari sejumlah besar simpul.

Tekstur hanyalah gambar 2D dengan ukuran sewenang-wenang yang dipetakan ke objek 3D untuk mensimulasikan permukaannya. Misalnya kubus 3D kita terdiri dari delapan simpul. Sebelum diaplikasikan teksturnya terlihat seperti kotak sederhana. Namun saat kita mengaplikasikan teksturnya, kotak tersebut menjadi berwarna.


Program pixel shader memungkinkan kartu video menghasilkan efek yang mengesankan, misalnya seperti air masuk Gulungan Penatua: Terlupakan.

Saat ini ada dua jenis shader: vertex dan pixel. Program Vertex shader dapat memodifikasi atau mengubah objek 3D. Program pixel shader memungkinkan Anda mengubah warna piksel berdasarkan beberapa data. Bayangkan sebuah sumber cahaya dalam pemandangan 3D yang menyebabkan objek yang diterangi bersinar lebih terang, sekaligus menyebabkan bayangan muncul pada objek lain. Semua ini dicapai dengan mengubah informasi warna piksel.

Pixel shader digunakan untuk menciptakan efek kompleks di game favorit Anda. Misalnya, kode shader dapat membuat piksel di sekitar pedang 3D bersinar lebih terang. Shader lain dapat memproses semua simpul objek 3D yang kompleks dan mensimulasikan ledakan. Pengembang game semakin beralih ke program shader yang canggih untuk menciptakan grafik yang realistis. Hampir setiap game modern dengan grafis yang kaya menggunakan shader.

Dengan dirilisnya Application Programming Interface (API) berikutnya, Microsoft DirectX 10, jenis shader ketiga akan dirilis, yang disebut geometri shader. Dengan bantuan mereka, dimungkinkan untuk menghancurkan objek, memodifikasi, dan bahkan menghancurkannya, tergantung pada hasil yang diinginkan. Tipe shader ketiga dapat diprogram dengan cara yang persis sama seperti dua shader pertama, namun perannya akan berbeda.

Tingkat Pengisian

Sangat sering, pada kotak dengan kartu video, Anda dapat menemukan nilai rasio pengisian. Pada dasarnya, rasio pengisian menunjukkan seberapa cepat GPU dapat menghasilkan piksel. Kartu video lama memiliki rasio pengisian segitiga. Namun saat ini ada dua jenis rasio pengisian: rasio pengisian piksel dan rasio pengisian tekstur. Seperti yang telah disebutkan, laju pengisian piksel sesuai dengan laju keluaran piksel. Ini dihitung sebagai jumlah operasi raster (ROP) dikalikan dengan frekuensi clock.

Tingkat pengisian tekstur dihitung secara berbeda oleh ATi dan nVidia. Nvidia percaya bahwa kecepatan diperoleh dengan mengalikan jumlah saluran piksel dengan frekuensi clock. Dan ATi mengalikan jumlah unit tekstur dengan kecepatan clock. Pada prinsipnya, kedua metode ini benar, karena nVidia menggunakan satu unit tekstur per unit shader piksel (yaitu, satu unit per pipa piksel).

Dengan mengingat definisi-definisi ini, mari kita lanjutkan dan diskusikan fungsi-fungsi paling penting dari GPU, apa fungsinya dan mengapa mereka begitu penting.

Arsitektur GPU: Fitur

Realisme grafik 3D sangat bergantung pada kinerja kartu video. Semakin banyak blok shader piksel yang dikandung prosesor dan semakin tinggi frekuensinya, semakin banyak efek yang dapat diterapkan pada pemandangan 3D untuk meningkatkan persepsi visualnya.

GPU berisi banyak blok fungsional yang berbeda. Berdasarkan jumlah beberapa komponen, Anda dapat memperkirakan seberapa kuat GPU tersebut. Sebelum melangkah lebih jauh, mari kita meninjau blok fungsional yang paling penting.

Prosesor vertex (unit shader vertex)

Seperti unit pixel shader, prosesor vertex mengeksekusi kode shader yang menyentuh simpul. Karena anggaran vertex yang lebih besar memungkinkan pembuatan objek 3D yang lebih kompleks, kinerja prosesor vertex sangat penting dalam adegan 3D dengan objek yang kompleks atau dalam jumlah besar. Namun, unit vertex shader masih belum memiliki dampak nyata terhadap kinerja seperti prosesor piksel.

Prosesor piksel (unit shader piksel)

Prosesor piksel adalah komponen chip grafis yang didedikasikan untuk memproses program pixel shader. Prosesor ini melakukan penghitungan yang hanya menyangkut piksel. Karena piksel berisi informasi warna, pixel shader memungkinkan Anda mencapai efek grafis yang mengesankan. Misalnya, sebagian besar efek air yang Anda lihat di game dibuat menggunakan pixel shader. Biasanya, jumlah prosesor piksel digunakan untuk membandingkan kinerja piksel kartu video. Jika satu kartu memiliki delapan unit pixel shader dan kartu lainnya memiliki 16 unit, maka masuk akal untuk mengasumsikan bahwa kartu video dengan 16 unit akan lebih cepat dalam memproses program pixel shader yang kompleks. Kecepatan clock juga harus diperhitungkan, tetapi saat ini menggandakan jumlah prosesor piksel lebih hemat energi dibandingkan menggandakan frekuensi chip grafis.

Shader terpadu

Unified shader belum hadir di dunia PC, tetapi standar DirectX 10 yang akan datang didasarkan pada arsitektur serupa. Artinya, struktur kode program titik, geometri, dan piksel akan sama, meskipun shader akan berfungsi berbagai pekerjaan. Spesifikasi barunya bisa dilihat pada Xbox 360 yang GPU-nya didesain khusus oleh ATi untuk Microsoft. Akan sangat menarik untuk melihat potensi apa yang dibawa oleh DirectX 10 baru.

Unit Pemetaan Tekstur (TMU)

Tekstur harus dipilih dan disaring. Pekerjaan ini dilakukan oleh unit pemetaan tekstur, yang bekerja bersama dengan unit pixel dan vertex shader. Tugas TMU adalah menerapkan operasi tekstur pada piksel. Jumlah unit tekstur dalam GPU sering digunakan untuk membandingkan performa tekstur kartu video. Masuk akal untuk berasumsi bahwa kartu grafis dengan TMU yang lebih banyak akan memberikan performa tekstur yang lebih baik.

Unit Operator Raster (ROP)

Prosesor raster bertanggung jawab untuk menulis data piksel ke dalam memori. Kecepatan di mana operasi ini dilakukan adalah laju pengisian. Pada masa awal akselerator 3D, ROP dan kecepatan pengisian merupakan karakteristik yang sangat penting dari kartu video. Saat ini, pekerjaan ROP masih penting, namun kinerja kartu video tidak lagi dibatasi oleh blok-blok ini seperti dulu. Oleh karena itu, kinerja (dan jumlah) ROP jarang digunakan untuk mengevaluasi kecepatan kartu video.

Konveyor

Pipeline digunakan untuk mendeskripsikan arsitektur kartu video dan memberikan gambaran yang sangat jelas tentang kinerja GPU.

Konveyor tidak dapat dianggap sebagai istilah teknis yang ketat. GPU menggunakan pipeline berbeda yang menjalankan fungsi berbeda. Secara historis, pipeline berarti prosesor piksel yang terhubung ke unit pemetaan tekstur (TMU). Misalnya, kartu video Radeon 9700 menggunakan prosesor delapan piksel, yang masing-masing terhubung ke TMU sendiri, sehingga kartu tersebut dianggap memiliki delapan saluran pipa.

Namun prosesor modern sangat sulit dijelaskan berdasarkan jumlah saluran pipanya. Dibandingkan dengan desain sebelumnya, prosesor baru ini menggunakan struktur modular dan terfragmentasi. ATi dapat dianggap sebagai inovator di bidang ini, yang, dengan jajaran kartu video X1000, beralih ke struktur modular, yang memungkinkan pencapaian peningkatan kinerja melalui optimalisasi internal. Beberapa blok CPU digunakan lebih banyak daripada yang lain, dan untuk meningkatkan kinerja GPU, ATi telah mencoba menemukan kompromi antara jumlah blok yang dibutuhkan dan area cetakan (yang tidak dapat ditingkatkan terlalu banyak). Dalam arsitektur ini, istilah "pixel pipeline" sudah kehilangan maknanya, karena prosesor pixel tidak lagi terhubung ke TMU mereka sendiri. Misalnya, GPU ATi Radeon X1600 memiliki 12 unit shader piksel dan hanya empat unit pemetaan tekstur TMU. Oleh karena itu, tidak mungkin untuk mengatakan bahwa arsitektur prosesor ini memiliki saluran 12 piksel, sama seperti tidak mungkin untuk mengatakan bahwa hanya ada empat saluran. Namun, secara tradisi, saluran pipa piksel masih disebutkan.

Dengan mempertimbangkan asumsi di atas, jumlah pipeline piksel dalam GPU sering digunakan untuk membandingkan kartu video (dengan pengecualian lini ATi X1x00). Misalnya, jika Anda mengambil kartu video dengan 24 dan 16 saluran, maka cukup masuk akal untuk berasumsi bahwa kartu dengan 24 saluran akan lebih cepat.

Arsitektur GPU: Teknologi

Proses teknis

Istilah ini mengacu pada ukuran satu elemen (transistor) chip dan keakuratan proses pembuatannya. Perbaikan dalam proses teknis memungkinkan diperolehnya elemen berukuran lebih kecil. Misalnya, proses 0,18 mikron menghasilkan fitur yang lebih besar dibandingkan proses 0,13 mikron, sehingga tidak seefisien itu. Transistor yang lebih kecil beroperasi pada tegangan yang lebih rendah. Pada gilirannya, penurunan tegangan menyebabkan penurunan resistansi termal, yang mengakibatkan penurunan jumlah panas yang dihasilkan. Perbaikan dalam proses teknis memungkinkan pengurangan jarak antara blok fungsional chip, dan transfer data membutuhkan waktu lebih sedikit. Jarak yang lebih pendek, voltase yang lebih rendah, dan peningkatan lainnya memungkinkan tercapainya kecepatan clock yang lebih tinggi.

Yang agak memperumit pemahaman ini adalah bahwa saat ini mikrometer (μm) dan nanometer (nm) digunakan untuk menunjuk suatu proses teknis. Faktanya, semuanya sangat sederhana: 1 nanometer sama dengan 0,001 mikrometer, jadi proses 0,09 μm dan 90 nm adalah hal yang sama. Seperti disebutkan di atas, teknologi proses yang lebih kecil memungkinkan kecepatan clock yang lebih tinggi. Misalnya, jika kita membandingkan kartu video dengan chip 0,18 mikron dan 0,09 mikron (90 nm), maka cukup masuk akal untuk mengharapkan frekuensi yang lebih tinggi dari kartu 90 nm.

Kecepatan jam GPU

Kecepatan jam GPU diukur dalam megahertz (MHz), yaitu jutaan siklus jam per detik.

Kecepatan jam secara langsung mempengaruhi kinerja GPU. Semakin tinggi, semakin lebih banyak pekerjaan dapat dilakukan dalam hitungan detik. Sebagai contoh pertama, mari kita ambil kartu video nVidia GeForce 6600 dan 6600 GT: GPU 6600 GT berjalan pada 500 MHz, sedangkan kartu 6600 biasa berjalan pada 400 MHz. Karena prosesornya secara teknis identik, peningkatan kecepatan clock 6600 GT sebesar 20% menghasilkan kinerja yang lebih tinggi.

Namun kecepatan jam bukanlah segalanya. Perlu diingat bahwa kinerja sangat dipengaruhi oleh arsitektur. Sebagai contoh kedua, mari kita ambil kartu video GeForce 6600 GT dan GeForce 6800 GT. GPU 6600 GT bekerja pada 500 MHz, tetapi 6800 GT hanya berjalan pada 350 MHz. Sekarang mari kita pertimbangkan bahwa 6800 GT menggunakan saluran pipa 16 piksel, sedangkan 6600 GT hanya menggunakan delapan piksel. Oleh karena itu, 6800 GT dengan 16 saluran pipa pada 350 MHz akan memberikan kinerja yang kurang lebih sama dengan prosesor dengan delapan saluran pipa dan kecepatan clock dua kali lipat (700 MHz). Oleh karena itu, kecepatan clock dapat dengan mudah digunakan untuk membandingkan kinerja.

Memori video lokal

Memori kartu video sangat mempengaruhi kinerja. Namun parameter memori yang berbeda memiliki efek yang berbeda.

Ukuran memori video

Jumlah memori video mungkin bisa disebut sebagai parameter kartu video yang paling dilebih-lebihkan. Konsumen yang tidak berpengalaman sering kali menggunakan kapasitas memori video untuk membandingkan kartu yang berbeda satu sama lain, namun kenyataannya, kapasitas memiliki pengaruh yang kecil terhadap kinerja dibandingkan dengan parameter seperti frekuensi bus memori dan antarmuka (lebar bus).

Dalam kebanyakan kasus, kartu dengan memori video 128 MB akan bekerja hampir sama dengan kartu dengan 256 MB. Tentu saja, ada situasi di mana lebih banyak memori akan meningkatkan kinerja, namun perlu diingat bahwa lebih banyak memori tidak secara otomatis menghasilkan kecepatan bermain game yang lebih cepat.

Volume dapat berguna dalam game dengan tekstur resolusi tinggi. Pengembang game menyediakan beberapa set tekstur untuk game tersebut. Dan semakin banyak memori yang ada pada kartu video, semakin tinggi resolusi tekstur yang dimuat. Tekstur resolusi tinggi memberikan kejelasan dan detail yang lebih baik dalam game. Oleh karena itu, cukup masuk akal untuk mengambil kartu dengan jumlah memori yang besar, jika semua kriteria lainnya cocok. Izinkan kami mengingatkan Anda sekali lagi bahwa lebar bus memori dan frekuensinya memiliki pengaruh yang jauh lebih kuat terhadap kinerja daripada volume ingatan fisik di peta.

Lebar bus memori

Lebar bus memori adalah salah satu aspek terpenting kinerja memori. Lebar bus modern berkisar antara 64 hingga 256 bit, dan dalam beberapa kasus bahkan 512 bit. Semakin lebar bus memori, semakin banyak informasi yang dapat ditransfer per siklus clock. Dan ini secara langsung mempengaruhi produktivitas. Misalnya, jika Anda menggunakan dua bus dengan frekuensi yang sama, maka secara teoritis bus 128-bit akan mentransfer data dua kali lebih banyak per siklus clock dibandingkan bus 64-bit. Dan bus 256-bit dua kali lebih besar.

Bandwidth bus yang lebih tinggi (dinyatakan dalam bit atau byte per detik, 1 byte = 8 bit) memberikan kinerja memori yang lebih tinggi. Inilah sebabnya mengapa bus memori jauh lebih penting daripada ukurannya. Pada frekuensi yang sama, bus memori 64-bit beroperasi pada kecepatan hanya 25% dari kecepatan 256-bit!

Mari kita ambil contoh berikut. Kartu video dengan memori video 128 MB, tetapi dengan bus 256-bit, memberikan kinerja memori yang jauh lebih tinggi dibandingkan model 512 MB dengan bus 64-bit. Penting untuk dicatat bahwa untuk beberapa kartu dari lini ATi X1x00, pabrikan menunjukkan spesifikasi bus memori internal, tetapi kami tertarik pada parameter bus eksternal. Misalnya, X1600 memiliki bus lingkar internal yang lebarnya 256 bit, namun bus lingkar eksternal hanya lebarnya 128 bit. Dan kenyataannya, bus memori beroperasi pada kinerja 128-bit.

Jenis memori

Memori dapat dibagi menjadi dua kategori utama: SDR (transfer data tunggal) dan DDR (transfer data ganda), di mana data ditransfer dua kali lebih cepat per siklus clock. Saat ini, teknologi SDR transmisi tunggal sudah ketinggalan zaman. Karena memori DDR mentransfer data dua kali lebih cepat dari SDR, penting untuk diingat bahwa kartu video dengan memori DDR sering kali menunjukkan frekuensi dua kali lipat, bukan frekuensi fisik. Misalnya, jika memori DDR ditentukan pada 1000 MHz, maka ini adalah frekuensi efektif di mana memori SDR biasa harus beroperasi untuk memberikan frekuensi yang sama. keluaran. Namun nyatanya frekuensi fisiknya adalah 500 MHz.

Karena alasan ini, banyak yang terkejut ketika frekuensi DDR 1200 MHz diindikasikan untuk memori kartu video mereka, dan utilitas melaporkan 600 MHz. Jadi, Anda harus membiasakannya. Memori DDR2 dan GDDR3/GDDR4 bekerja dengan prinsip yang sama, yaitu dengan transfer data ganda. Perbedaan antara memori DDR, DDR2, GDDR3 dan GDDR4 terletak pada teknologi produksi dan beberapa detailnya. DDR2 dapat beroperasi pada frekuensi yang lebih tinggi dibandingkan memori DDR, dan DDR3 dapat beroperasi pada frekuensi yang lebih tinggi lagi dibandingkan DDR2.

Frekuensi bus memori

Seperti prosesor, memori (atau lebih tepatnya, bus memori) beroperasi pada kecepatan clock tertentu, diukur dalam megahertz. Di sini, peningkatan kecepatan clock secara langsung mempengaruhi kinerja memori. Dan frekuensi bus memori merupakan salah satu parameter yang digunakan untuk membandingkan kinerja kartu video. Misalnya, jika semua karakteristik lainnya (lebar bus memori, dll.) adalah sama, maka cukup logis untuk mengatakan bahwa kartu video dengan memori 700 MHz lebih cepat daripada kartu video dengan memori 500 MHz.

Sekali lagi, kecepatan jam bukanlah segalanya. Memori 700 MHz dengan bus 64-bit akan lebih lambat dibandingkan memori 400 MHz dengan bus 128-bit. Performa memori 400 MHz pada bus 128-bit kira-kira setara dengan memori 800 MHz pada bus 64-bit. Anda juga harus ingat bahwa frekuensi GPU dan memori adalah parameter yang sangat berbeda, dan biasanya keduanya berbeda.

Antarmuka kartu video

Semua data yang ditransfer antara kartu video dan prosesor melewati antarmuka kartu video. Saat ini, tiga jenis antarmuka digunakan untuk kartu video: PCI, AGP dan PCI Express. Mereka berbeda dalam bandwidth dan karakteristik lainnya. Jelas bahwa semakin tinggi throughputnya, semakin tinggi pula kecepatan pertukarannya. Namun, hanya kartu paling modern yang dapat menggunakan bandwidth tinggi, itupun hanya sebagian. Pada titik tertentu, kecepatan antarmuka tidak lagi menjadi hambatan; saat ini kecepatan tersebut sudah cukup.

Bus paling lambat yang digunakan untuk memproduksi kartu video adalah PCI (Peripheral Components Interconnect). Tentu saja, tanpa masuk ke dalam sejarah. PCI benar-benar menurunkan kinerja kartu video, sehingga mereka beralih ke antarmuka AGP (Accelerated Graphics Port). Tetapi spesifikasi AGP 1.0 dan 2x pun membatasi kinerja. Ketika standar meningkatkan kecepatan ke level AGP 4x, kami mulai mendekati batas praktis bandwidth yang dapat ditangani oleh kartu video. Spesifikasi AGP 8x sekali lagi menggandakan throughput dibandingkan dengan AGP 4x (2,16 GB/s), namun kami tidak lagi menerima peningkatan kinerja grafis yang nyata.

Bus terbaru dan tercepat adalah PCI Express. Baru kartu grafis Biasanya mereka menggunakan antarmuka PCI Express x16, yang menggabungkan 16 jalur PCI Express, memberikan total throughput 4 GB/s (dalam satu arah). Ini dua kali lipat throughput AGP 8x. Bus PCI Express menyediakan bandwidth yang disebutkan di kedua arah (transfer data ke dan dari kartu video). Namun kecepatan standar AGP 8x sudah mencukupi, sehingga kami belum menemui situasi di mana peralihan ke PCI Express memberikan peningkatan kinerja dibandingkan AGP 8x (jika parameter perangkat keras lainnya sama). Misalnya, GeForce 6800 Ultra versi AGP akan bekerja sama dengan 6800 Ultra untuk PCI Express.

Saat ini yang terbaik adalah membeli kartu dengan antarmuka PCI Express; kartu tersebut akan tetap ada di pasaran selama beberapa tahun lagi. Kartu paling kuat tidak lagi diproduksi dengan antarmuka AGP 8x, dan solusi PCI Express biasanya lebih mudah ditemukan daripada analog AGP, dan harganya lebih murah.

Solusi pada beberapa kartu video

Menggunakan beberapa kartu video untuk meningkatkan kinerja grafis bukanlah ide baru. Pada masa awal grafis 3D, 3dfx memasuki pasar dengan dua kartu grafis yang berjalan secara paralel. Namun dengan hilangnya teknologi 3dfx kolaborasi beberapa kartu video konsumen dilupakan, meskipun ATI telah memproduksi sistem serupa untuk simulator profesional sejak rilis Radeon 9700. Beberapa tahun yang lalu, teknologi ini kembali ke pasar: dengan munculnya solusi nVidia SLI dan, beberapa saat kemudian, Baku Tembak ATI .

Membagikan beberapa kartu video memberikan kinerja yang cukup untuk menjalankan game pada pengaturan kualitas tinggi resolusi tinggi. Namun memilih satu solusi atau lainnya tidaklah mudah.

Mari kita mulai dengan fakta yang memerlukan solusi berdasarkan beberapa kartu video sejumlah besar energi, sehingga pasokan listrik harus cukup kuat. Semua panas ini harus dihilangkan dari kartu video, jadi Anda perlu memperhatikan casing PC dan pendinginannya agar sistem tidak terlalu panas.

Juga, ingat bahwa SLI/CrossFire memerlukan yang sesuai papan utama(baik untuk satu teknologi atau lainnya), yang biasanya harganya lebih mahal dibandingkan model standar. Konfigurasi nVidia SLI hanya akan berfungsi pada papan nForce4 tertentu, dan kartu ATi CrossFire hanya akan berfungsi pada motherboard dengan chipset CrossFire atau pada model Intel tertentu. Untuk memperumit masalah, beberapa konfigurasi CrossFire memerlukan salah satu kartu yang khusus: CrossFire Edition. Setelah rilis CrossFire untuk beberapa model Kartu video ATI diizinkan untuk mengaktifkan teknologi kolaborasi melalui bus PCI Express, dan dengan dirilisnya versi driver baru, jumlah kemungkinan kombinasi meningkat. Namun tetap saja, CrossFire perangkat keras dengan kartu CrossFire Edition yang sesuai memberikan kinerja yang lebih tinggi. Namun kartu CrossFire Edition juga lebih mahal dibandingkan model biasa. Pada saat ini Anda dapat mengaktifkan mode CrossFire perangkat lunak (tanpa kartu CrossFire Edition) pada kartu grafis Radeon X1300, X1600 dan X1800 GTO.

Ada faktor lain yang perlu dipertimbangkan juga. Meskipun dua kartu grafis yang bekerja sama memberikan peningkatan kinerja, namun peningkatan tersebut jauh dari dua kali lipat. Tapi Anda akan membayar uang dua kali lebih banyak. Paling sering, peningkatan produktivitas adalah 20-60%. Dan dalam beberapa kasus, karena adanya tambahan biaya komputasi untuk pencocokan, tidak ada peningkatan sama sekali. Oleh karena itu, konfigurasi multi-kartu sepertinya tidak akan bermanfaat pada model yang lebih murah, karena kartu grafis yang lebih mahal biasanya akan selalu mengungguli beberapa kartu yang lebih murah. Secara umum, bagi sebagian besar konsumen, membeli solusi SLI/CrossFire tidak masuk akal. Tetapi jika Anda ingin mengaktifkan semua opsi peningkatan kualitas atau bermain pada resolusi ekstrem, misalnya 2560x1600, ketika Anda perlu menghitung lebih dari 4 juta piksel per frame, maka Anda tidak dapat melakukannya tanpa dua atau empat kartu video berpasangan.

Fitur visual

Selain spesifikasi perangkat keras semata, generasi dan model GPU yang berbeda mungkin berbeda dalam rangkaian fungsinya. Misalnya, sering dikatakan bahwa kartu generasi ATi Radeon X800 XT kompatibel dengan Shader Model 2.0b (SM), sedangkan nVidia GeForce 6800 Ultra kompatibel dengan SM 3.0, meskipun spesifikasi perangkat kerasnya hampir sama (16 saluran pipa ). Oleh karena itu, banyak konsumen yang memilih solusi tertentu tanpa mengetahui apa arti perbedaannya. Baiklah, mari kita bicara tentang fitur visual dan pentingnya bagi pengguna akhir.

Nama-nama ini paling sering digunakan dalam perselisihan, namun hanya sedikit orang yang tahu apa maksud sebenarnya. Untuk memahaminya, mari kita mulai dengan sejarah API grafis. DirectX dan OpenGL adalah API grafis, yaitu Antarmuka Pemrograman Aplikasi - standar kode terbuka yang tersedia untuk semua orang.

Sebelum munculnya API grafis, setiap produsen GPU menggunakan mekanismenya sendiri untuk berkomunikasi dengan game. Pengembang harus menulis kode terpisah untuk setiap GPU yang ingin mereka dukung. Pendekatan yang sangat mahal dan tidak efektif. Untuk mengatasi masalah ini, API untuk grafik 3D dikembangkan sehingga pengembang menulis kode untuk API tertentu, dan bukan untuk kartu video tertentu. Setelah itu, masalah kompatibilitas menjadi tanggung jawab produsen kartu video, yang harus memastikan bahwa drivernya kompatibel dengan API.

Satu-satunya kesulitan yang tersisa adalah saat ini digunakan dua API berbeda, yaitu Microsoft DirectX dan OpenGL, di mana GL adalah singkatan dari Graphics Library. Karena DirectX API lebih populer di game saat ini, kami akan fokus padanya. Dan standar ini memiliki pengaruh yang lebih kuat terhadap perkembangan game.

DirectX adalah penciptaan Microsoft. Faktanya, DirectX menyertakan beberapa API, hanya satu yang digunakan untuk grafik 3D. DirectX menyertakan API untuk suara, musik, perangkat input, dll. Direct3D API bertanggung jawab atas grafik 3D di DirectX. Ketika mereka berbicara tentang kartu video, inilah maksudnya, jadi dalam hal ini konsep DirectX dan Direct3D dapat dipertukarkan.

DirectX diperbarui secara berkala seiring kemajuan teknologi grafis dan pengembang game menerapkan teknik pemrograman game baru. Seiring dengan meningkatnya popularitas DirectX dengan cepat, produsen GPU mulai menyesuaikan rilis produk baru untuk mengakomodasi kemampuan DirectX. Karena alasan ini, kartu video sering kali dikaitkan dengan dukungan perangkat keras untuk satu atau beberapa generasi DirectX (DirectX 8, 9.0, atau 9.0c).

Yang lebih rumit lagi, bagian dari Direct3D API dapat berubah seiring waktu tanpa mengubah generasi DirectX. Misalnya, spesifikasi DirectX 9.0 menetapkan dukungan untuk Pixel Shader 2.0. Namun pembaruan DirectX 9.0c menyertakan Pixel Shader 3.0. Jadi, meskipun kartunya berkelas DirectX 9, mereka dapat mendukung rangkaian fitur yang berbeda. Misalnya, Radeon 9700 mendukung Shader Model 2.0, dan Radeon X1800 mendukung Shader Model 3.0, meskipun kedua kartu tersebut dapat diklasifikasikan sebagai generasi DirectX 9.

Ingatlah bahwa saat membuat game baru, pengembang memperhitungkan pemilik mesin dan kartu video lama, karena jika segmen pengguna ini diabaikan, tingkat penjualan akan lebih rendah. Karena alasan ini, beberapa jalur kode dibangun ke dalam game. Game DirectX 9 mungkin memiliki jalur DirectX 8 dan bahkan jalur DirectX 7. Biasanya, jika jalur lama dipilih, maka beberapa game akan hilang efek maya, yang ada di kartu video baru. Tapi setidaknya Anda bisa bermain bahkan di perangkat keras lama.

Banyak game baru memerlukan DirectX versi terbaru untuk diinstal, meskipun kartu videonya berasal dari generasi sebelumnya. Artinya, game baru yang akan menggunakan jalur DirectX 8 masih memerlukan instalasi DirectX 9 versi terbaru untuk kartu video sekelas DirectX 8.

Apa perbedaan antara versi yang berbeda API Direct3D di DirectX? Versi awal DirectX - 3, 5, 6 dan 7 - relatif sederhana dalam kemampuan Direct3D API. Pengembang dapat memilih efek visual dari daftar dan kemudian menguji cara kerjanya dalam game. Langkah besar berikutnya dalam pemrograman grafis adalah DirectX 8. Ini memperkenalkan kemampuan untuk memprogram kartu video menggunakan shader, sehingga pengembang untuk pertama kalinya memiliki kebebasan untuk memprogram efek sesuai kebutuhan mereka. DirectX 8 mendukung versi Pixel Shader 1.0 hingga 1.3 dan Vertex Shader 1.0. DirectX 8.1, diperbarui Versi DirectX 8, menerima Pixel Shader 1.4 dan Vertex Shader 1.1.

Di DirectX 9 Anda dapat membuat program shader yang lebih kompleks. DirectX 9 mendukung Pixel Shader 2.0 dan Vertex Shader 2.0. DirectX 9c, versi terbaru dari DirectX 9, menyertakan spesifikasi Pixel Shader 3.0.

DirectX 10, rilis API mendatang, akan menyertai versi baru Windows Vista. Anda tidak dapat menginstal DirectX 10 pada Windows XP.

HDR adalah singkatan dari "Rentang Dinamis Tinggi". Game dengan pencahayaan HDR dapat menghasilkan gambar yang jauh lebih realistis dibandingkan game tanpa pencahayaan HDR, dan tidak semua kartu video mendukung pencahayaan HDR.

Sebelum munculnya kartu grafis DirectX 9, GPU sangat dibatasi oleh keakuratan penghitungan pencahayaannya. Hingga saat ini, pencahayaan hanya dapat dihitung dengan level internal 256 (8 bit).

Ketika kartu video DirectX 9 muncul, mereka mampu menghasilkan pencahayaan dengan presisi tinggi - penuh 24 bit atau level 16,7 juta.

Dengan 16,7 juta level dan langkah selanjutnya dalam kinerja kartu video DirectX 9/Shader Model 2.0, pencahayaan HDR menjadi mungkin dilakukan di komputer. Ini adalah teknologi yang agak rumit, dan Anda perlu memperhatikannya secara dinamis. Sederhananya, pencahayaan HDR meningkatkan kontras (warna gelap tampak lebih gelap, warna terang tampak lebih terang), sekaligus meningkatkan jumlah detail pencahayaan di area gelap dan terang. Game dengan pencahayaan HDR tampak lebih hidup dan realistis dibandingkan tanpa pencahayaan HDR.

GPU yang sesuai dengan spesifikasi Pixel Shader 3.0 terbaru memungkinkan penghitungan pencahayaan presisi 32-bit yang lebih tinggi dan pencampuran floating point. Dengan demikian, kartu video kelas SM 3.0 dapat mendukung metode pencahayaan OpenEXR HDR khusus yang dirancang khusus untuk industri film.

Beberapa game yang hanya mendukung pencahayaan OpenEXR HDR tidak akan berjalan dengan pencahayaan HDR pada kartu grafis Shader Model 2.0. Namun, game yang tidak mengandalkan metode OpenEXR akan berjalan di kartu grafis DirectX 9. Misalnya, Oblivion menggunakan metode OpenEXR HDR dan hanya mengizinkan pencahayaan HDR pada kartu grafis terbaru yang mendukung spesifikasi Shader Model 3.0. Misalnya nVidia GeForce 6800 atau ATi Radeon X1800. Game yang menggunakan mesin 3D Half-Life 2, termasuk Counter-Strike: Source dan Half-Life 2: Aftermath yang akan datang, memungkinkan rendering HDR diaktifkan pada kartu grafis DirectX 9 lama yang hanya mendukung Pixel Shader 2.0. Contohnya termasuk lini GeForce 5 atau ATi Radeon 9500.

Terakhir, perlu diingat bahwa semua bentuk rendering HDR memerlukan kekuatan pemrosesan yang serius dan dapat membuat GPU paling kuat sekalipun bertekuk lutut. Jika Anda ingin bermain permainan terbaru Dengan pencahayaan HDR, Anda tidak dapat melakukannya tanpa grafis berperforma tinggi.

Anti-aliasing layar penuh (disingkat AA) memungkinkan Anda menghilangkan karakteristik “tangga” pada batas poligon. Namun perlu diingat bahwa anti-aliasing layar penuh menghabiskan banyak sumber daya komputasi, yang menyebabkan penurunan kecepatan bingkai.

Anti-aliasing sangat bergantung pada kinerja memori video, sehingga kartu video berkecepatan tinggi dengan memori cepat akan mampu menghitung anti-aliasing layar penuh dengan dampak kinerja yang lebih kecil dibandingkan kartu video murah. Antialiasing dapat diaktifkan di berbagai mode. Misalnya, antialiasing 4x akan menghasilkan gambar yang lebih baik daripada antialiasing 2x, namun akan berdampak besar pada performa. Meskipun antialiasing 2x menggandakan resolusi horizontal dan vertikal, mode 4x melipatgandakannya.

Tekstur diterapkan ke semua objek 3D dalam game, dan semakin besar sudut permukaan yang ditampilkan, teksturnya akan terlihat semakin terdistorsi. Untuk menghilangkan efek ini, GPU menggunakan pemfilteran tekstur.

Metode penyaringan pertama disebut bilinear dan menghasilkan garis-garis khas yang tidak terlalu enak dipandang. Situasi membaik dengan diperkenalkannya pemfilteran trilinear. Kedua opsi ini berfungsi pada kartu video modern tanpa penalti performa.

Saat ini, cara terbaik untuk memfilter tekstur adalah pemfilteran anisotropik (AF). Seperti antialiasing layar penuh, pemfilteran anisotropik dapat diaktifkan pada level yang berbeda. Misalnya, 8x AF memberikan kualitas pemfilteran yang lebih baik dibandingkan 4x AF. Seperti antialiasing layar penuh, pemfilteran anisotropik memerlukan sejumlah daya pemrosesan, yang meningkat seiring dengan peningkatan level AF.

Semua game 3D dibuat dengan mempertimbangkan spesifikasi spesifik, dan salah satu persyaratan tersebut menentukan memori tekstur yang dibutuhkan game tersebut. Semua tekstur yang diperlukan harus masuk ke dalam memori kartu video selama permainan, jika tidak, kinerja akan turun secara signifikan, karena mengakses tekstur ke RAM menyebabkan penundaan yang cukup besar, belum lagi file paging di hard drive. Oleh karena itu, jika pengembang game mengandalkan memori video sebesar 128 MB persyaratan minimum, maka kumpulan tekstur aktif tidak boleh melebihi 128 MB kapan saja.

Permainan modern memiliki beberapa set tekstur, sehingga permainan akan berjalan tanpa masalah pada kartu video lama dengan memori video lebih sedikit, serta pada kartu baru dengan memori video lebih banyak. Misalnya, sebuah game mungkin berisi tiga set tekstur: untuk 128 MB, 256 MB, dan 512 MB. Saat ini, hanya ada sedikit game yang mendukung memori video 512 MB, namun game tersebut tetap menjadi alasan paling obyektif untuk membeli kartu video dengan memori sebesar itu. Meskipun peningkatan memori berdampak kecil atau tidak sama sekali terhadap performa, Anda akan mendapatkan manfaat dari peningkatan kualitas visual jika game mendukung rangkaian tekstur yang sesuai.

Komponen dasar kartu video:

  • keluar;
  • antarmuka;
  • sistem pendingin;
  • GPU;
  • memori video.

Teknologi grafis:

  • kamus;
  • Arsitektur GPU: fitur
    unit vertex/piksel, shader, kecepatan pengisian, unit tekstur/raster, saluran pipa;
  • Arsitektur GPU: teknologi
    proses teknis, frekuensi GPU, memori video lokal (volume, bus, jenis, frekuensi), solusi dengan beberapa kartu video;
  • fungsi visual
    DirectX, rentang dinamis tinggi (HDR), anti-aliasing layar penuh, pemfilteran tekstur, tekstur resolusi tinggi.

Glosarium istilah grafis dasar

Kecepatan Penyegaran

Sama seperti di bioskop atau TV, komputer Anda mensimulasikan gerakan di monitor dengan menampilkan rangkaian bingkai. Kecepatan refresh monitor menunjukkan berapa kali per detik gambar di layar akan diperbarui. Misalnya, frekuensi 75 Hz sama dengan 75 pembaruan per detik.

Jika komputer memproses frame lebih cepat daripada output monitor, maka masalah mungkin terjadi pada game. Misalnya, jika komputer merender 100 frame per detik, dan kecepatan refresh monitor adalah 75 Hz, maka karena tumpang tindih, monitor hanya dapat menampilkan sebagian gambar selama periode penyegarannya. Hasilnya, artefak visual muncul.

Sebagai solusinya, Anda dapat mengaktifkan V-Sync (sinkronisasi vertikal). Ini membatasi jumlah frame yang dapat dihasilkan komputer pada kecepatan refresh monitor, sehingga mencegah artefak. Jika Anda mengaktifkan V-Sync, jumlah frame yang dihitung dalam game tidak akan pernah melebihi kecepatan refresh. Artinya, pada 75 Hz komputer akan mengeluarkan tidak lebih dari 75 frame per detik.

Piksel

Kata "Pixel" adalah singkatan dari " foto mendatang el ement" - elemen gambar. Ini adalah titik kecil pada layar yang dapat bersinar dalam warna tertentu (dalam banyak kasus, rona ditampilkan dengan kombinasi tiga warna dasar: merah, hijau, dan biru). Jika resolusi layarnya 1024x768, maka Anda dapat melihat matriks dengan lebar 1024 piksel dan tinggi 768 piksel. Semua piksel bersama-sama membentuk gambar. Gambar di layar diperbarui 60 hingga 120 kali per detik, tergantung pada jenis tampilan dan keluaran data dari kartu video. Monitor CRT menyegarkan tampilan baris demi baris, sedangkan monitor LCD panel datar dapat menyegarkan setiap piksel satu per satu.

Puncak

Semua objek dalam adegan 3D terdiri dari simpul. Simpul adalah sebuah titik dalam ruang tiga dimensi dengan koordinat X, Y, dan Z. Beberapa simpul dapat dikelompokkan menjadi sebuah poligon: paling sering berupa segitiga, tetapi bentuk yang lebih kompleks juga dimungkinkan. Tekstur kemudian diterapkan pada poligon, yang membuat objek terlihat realistis. Kubus 3D yang ditunjukkan pada ilustrasi di atas terdiri dari delapan simpul. Objek yang lebih kompleks memiliki permukaan melengkung yang sebenarnya terdiri dari sejumlah besar simpul.

Tekstur

Tekstur hanyalah gambar 2D dengan ukuran sewenang-wenang yang dipetakan ke objek 3D untuk mensimulasikan permukaannya. Misalnya kubus 3D kita terdiri dari delapan simpul. Sebelum diaplikasikan teksturnya terlihat seperti kotak sederhana. Namun saat kita mengaplikasikan teksturnya, kotak tersebut menjadi berwarna.

peneduh

Program pixel shader memungkinkan kartu video menghasilkan efek yang mengesankan, misalnya seperti air di Elder Scrolls: Oblivion.

Saat ini ada dua jenis shader: vertex dan pixel. Program Vertex shader dapat memodifikasi atau mengubah objek 3D. Program pixel shader memungkinkan Anda mengubah warna piksel berdasarkan beberapa data. Bayangkan sebuah sumber cahaya dalam pemandangan 3D yang menyebabkan objek yang diterangi bersinar lebih terang, sekaligus menyebabkan bayangan muncul pada objek lain. Semua ini dicapai dengan mengubah informasi warna piksel.

Pixel shader digunakan untuk menciptakan efek kompleks di game favorit Anda. Misalnya, kode shader dapat membuat piksel di sekitar pedang 3D bersinar lebih terang. Shader lain dapat memproses semua simpul objek 3D yang kompleks dan mensimulasikan ledakan. Pengembang game semakin beralih ke program shader yang canggih untuk menciptakan grafik yang realistis. Hampir setiap game modern dengan grafis yang kaya menggunakan shader.

Dengan dirilisnya Application Programming Interface (API) berikutnya, Microsoft DirectX 10, jenis shader ketiga akan dirilis, yang disebut geometri shader. Dengan bantuan mereka, dimungkinkan untuk menghancurkan objek, memodifikasi, dan bahkan menghancurkannya, tergantung pada hasil yang diinginkan. Tipe shader ketiga dapat diprogram dengan cara yang persis sama seperti dua shader pertama, namun perannya akan berbeda.

Tingkat Pengisian

Sangat sering, pada kotak dengan kartu video, Anda dapat menemukan nilai rasio pengisian. Pada dasarnya, rasio pengisian menunjukkan seberapa cepat GPU dapat menghasilkan piksel. Kartu video lama memiliki rasio pengisian segitiga. Namun saat ini ada dua jenis rasio pengisian: rasio pengisian piksel dan rasio pengisian tekstur. Seperti yang telah disebutkan, laju pengisian piksel sesuai dengan laju keluaran piksel. Ini dihitung sebagai jumlah operasi raster (ROP) dikalikan dengan frekuensi clock.

Tingkat pengisian tekstur dihitung secara berbeda oleh ATi dan nVidia. Nvidia percaya bahwa kecepatan diperoleh dengan mengalikan jumlah saluran piksel dengan frekuensi clock. Dan ATi mengalikan jumlah unit tekstur dengan kecepatan clock. Pada prinsipnya, kedua metode ini benar, karena nVidia menggunakan satu unit tekstur per unit shader piksel (yaitu, satu unit per pipa piksel).

Dengan mengingat definisi-definisi ini, mari kita lanjutkan dan diskusikan fungsi-fungsi paling penting dari GPU, apa fungsinya dan mengapa mereka begitu penting.

Arsitektur GPU: Fitur

Realisme grafik 3D sangat bergantung pada kinerja kartu video. Semakin banyak blok shader piksel yang dikandung prosesor dan semakin tinggi frekuensinya, semakin banyak efek yang dapat diterapkan pada pemandangan 3D untuk meningkatkan persepsi visualnya.

GPU berisi banyak blok fungsional yang berbeda. Berdasarkan jumlah beberapa komponen, Anda dapat memperkirakan seberapa kuat GPU tersebut. Sebelum melangkah lebih jauh, mari kita meninjau blok fungsional yang paling penting.

Prosesor vertex (unit shader vertex)

Seperti unit pixel shader, prosesor vertex mengeksekusi kode shader yang menyentuh simpul. Karena anggaran vertex yang lebih besar memungkinkan pembuatan objek 3D yang lebih kompleks, kinerja prosesor vertex sangat penting dalam adegan 3D dengan objek yang kompleks atau dalam jumlah besar. Namun, unit vertex shader masih belum memiliki dampak nyata terhadap kinerja seperti prosesor piksel.

Prosesor piksel (unit shader piksel)

Prosesor piksel adalah komponen chip grafis yang didedikasikan untuk memproses program pixel shader. Prosesor ini melakukan penghitungan yang hanya menyangkut piksel. Karena piksel berisi informasi warna, pixel shader memungkinkan Anda mencapai efek grafis yang mengesankan. Misalnya, sebagian besar efek air yang Anda lihat di game dibuat menggunakan pixel shader. Biasanya, jumlah prosesor piksel digunakan untuk membandingkan kinerja piksel kartu video. Jika satu kartu memiliki delapan unit pixel shader dan kartu lainnya memiliki 16 unit, maka masuk akal untuk mengasumsikan bahwa kartu video dengan 16 unit akan lebih cepat dalam memproses program pixel shader yang kompleks. Kecepatan clock juga harus diperhitungkan, tetapi saat ini menggandakan jumlah prosesor piksel lebih hemat energi dibandingkan menggandakan frekuensi chip grafis.

Shader terpadu

Unified shader belum hadir di dunia PC, tetapi standar DirectX 10 yang akan datang didasarkan pada arsitektur serupa. Artinya, struktur kode program titik, geometri, dan piksel akan sama, meskipun shader akan melakukan pekerjaan yang berbeda. Spesifikasi barunya bisa dilihat pada Xbox 360 yang GPU-nya didesain khusus oleh ATi untuk Microsoft. Akan sangat menarik untuk melihat potensi apa yang dibawa oleh DirectX 10 baru.

Unit Pemetaan Tekstur (TMU)

Tekstur harus dipilih dan disaring. Pekerjaan ini dilakukan oleh unit pemetaan tekstur, yang bekerja bersama dengan unit pixel dan vertex shader. Tugas TMU adalah menerapkan operasi tekstur pada piksel. Jumlah unit tekstur dalam GPU sering digunakan untuk membandingkan performa tekstur kartu video. Masuk akal untuk berasumsi bahwa kartu grafis dengan TMU yang lebih banyak akan memberikan performa tekstur yang lebih baik.

Unit Operator Raster (ROP)

Prosesor raster bertanggung jawab untuk menulis data piksel ke dalam memori. Kecepatan di mana operasi ini dilakukan adalah laju pengisian. Pada masa awal akselerator 3D, ROP dan kecepatan pengisian merupakan karakteristik yang sangat penting dari kartu video. Saat ini, pekerjaan ROP masih penting, namun kinerja kartu video tidak lagi dibatasi oleh blok-blok ini seperti dulu. Oleh karena itu, kinerja (dan jumlah) ROP jarang digunakan untuk mengevaluasi kecepatan kartu video.

Konveyor

Pipeline digunakan untuk mendeskripsikan arsitektur kartu video dan memberikan gambaran yang sangat jelas tentang kinerja GPU.

Konveyor tidak dapat dianggap sebagai istilah teknis yang ketat. GPU menggunakan pipeline berbeda yang menjalankan fungsi berbeda. Secara historis, pipeline berarti prosesor piksel yang terhubung ke unit pemetaan tekstur (TMU). Misalnya, kartu video Radeon 9700 menggunakan prosesor delapan piksel, yang masing-masing terhubung ke TMU sendiri, sehingga kartu tersebut dianggap memiliki delapan saluran pipa.

Namun prosesor modern sangat sulit dijelaskan berdasarkan jumlah saluran pipanya. Dibandingkan dengan desain sebelumnya, prosesor baru ini menggunakan struktur modular dan terfragmentasi. ATi dapat dianggap sebagai inovator di bidang ini, yang, dengan jajaran kartu video X1000, beralih ke struktur modular, yang memungkinkan pencapaian peningkatan kinerja melalui optimalisasi internal. Beberapa blok CPU digunakan lebih banyak daripada yang lain, dan untuk meningkatkan kinerja GPU, ATi telah mencoba menemukan kompromi antara jumlah blok yang dibutuhkan dan area cetakan (yang tidak dapat ditingkatkan terlalu banyak). Dalam arsitektur ini, istilah “pixel pipeline” sudah kehilangan maknanya, karena prosesor pixel tidak lagi terhubung ke TMU mereka sendiri. Misalnya, GPU ATi Radeon X1600 memiliki 12 unit shader piksel dan hanya empat unit pemetaan tekstur TMU. Oleh karena itu, tidak mungkin untuk mengatakan bahwa arsitektur prosesor ini memiliki saluran 12 piksel, sama seperti tidak mungkin untuk mengatakan bahwa hanya ada empat saluran. Namun, secara tradisi, saluran pipa piksel masih disebutkan.

Dengan mempertimbangkan asumsi di atas, jumlah pipeline piksel dalam GPU sering digunakan untuk membandingkan kartu video (dengan pengecualian lini ATi X1x00). Misalnya, jika Anda mengambil kartu video dengan 24 dan 16 saluran, maka cukup masuk akal untuk berasumsi bahwa kartu dengan 24 saluran akan lebih cepat.

Arsitektur GPU: Teknologi

Proses teknis

Istilah ini mengacu pada ukuran satu elemen (transistor) chip dan keakuratan proses pembuatannya. Perbaikan dalam proses teknis memungkinkan diperolehnya elemen berukuran lebih kecil. Misalnya, proses 0,18 mikron menghasilkan fitur yang lebih besar dibandingkan proses 0,13 mikron, sehingga tidak seefisien itu. Transistor yang lebih kecil beroperasi pada tegangan yang lebih rendah. Pada gilirannya, penurunan tegangan menyebabkan penurunan resistansi termal, yang mengakibatkan penurunan jumlah panas yang dihasilkan. Perbaikan dalam proses teknis memungkinkan pengurangan jarak antara blok fungsional chip, dan transfer data membutuhkan waktu lebih sedikit. Jarak yang lebih pendek, voltase yang lebih rendah, dan peningkatan lainnya memungkinkan tercapainya kecepatan clock yang lebih tinggi.

Yang agak memperumit pemahaman ini adalah bahwa saat ini mikrometer (μm) dan nanometer (nm) digunakan untuk menunjuk suatu proses teknis. Faktanya, semuanya sangat sederhana: 1 nanometer sama dengan 0,001 mikrometer, jadi proses 0,09 μm dan 90 nm adalah hal yang sama. Seperti disebutkan di atas, teknologi proses yang lebih kecil memungkinkan kecepatan clock yang lebih tinggi. Misalnya, jika kita membandingkan kartu video dengan chip 0,18 mikron dan 0,09 mikron (90 nm), maka cukup masuk akal untuk mengharapkan frekuensi yang lebih tinggi dari kartu 90 nm.

Kecepatan jam GPU

Kecepatan jam GPU diukur dalam megahertz (MHz), yaitu jutaan siklus jam per detik.

Kecepatan jam secara langsung mempengaruhi kinerja GPU. Semakin tinggi, semakin banyak pekerjaan yang dapat diselesaikan dalam satu detik. Sebagai contoh pertama, mari kita ambil kartu video nVidia GeForce 6600 dan 6600 GT: GPU 6600 GT berjalan pada 500 MHz, sedangkan kartu 6600 biasa berjalan pada 400 MHz. Karena prosesornya secara teknis identik, peningkatan kecepatan clock 6600 GT sebesar 20% menghasilkan kinerja yang lebih tinggi.

Namun kecepatan jam bukanlah segalanya. Perlu diingat bahwa kinerja sangat dipengaruhi oleh arsitektur. Sebagai contoh kedua, mari kita ambil kartu video GeForce 6600 GT dan GeForce 6800 GT. GPU 6600 GT bekerja pada 500 MHz, tetapi 6800 GT hanya berjalan pada 350 MHz. Sekarang mari kita pertimbangkan bahwa 6800 GT menggunakan saluran pipa 16 piksel, sedangkan 6600 GT hanya menggunakan delapan piksel. Oleh karena itu, 6800 GT dengan 16 saluran pipa pada 350 MHz akan memberikan kinerja yang kurang lebih sama dengan prosesor dengan delapan saluran pipa dan kecepatan clock dua kali lipat (700 MHz). Oleh karena itu, kecepatan clock dapat dengan mudah digunakan untuk membandingkan kinerja.

Memori video lokal

Memori kartu video sangat mempengaruhi kinerja. Namun parameter memori yang berbeda memiliki efek yang berbeda.

Ukuran memori video

Jumlah memori video mungkin bisa disebut sebagai parameter kartu video yang paling dilebih-lebihkan. Konsumen yang tidak berpengalaman sering kali menggunakan kapasitas memori video untuk membandingkan kartu yang berbeda satu sama lain, namun kenyataannya, kapasitas memiliki pengaruh yang kecil terhadap kinerja dibandingkan dengan parameter seperti frekuensi bus memori dan antarmuka (lebar bus).

Dalam kebanyakan kasus, kartu dengan memori video 128 MB akan bekerja hampir sama dengan kartu dengan 256 MB. Tentu saja, ada situasi di mana lebih banyak memori akan meningkatkan kinerja, namun perlu diingat bahwa lebih banyak memori tidak secara otomatis menghasilkan kecepatan bermain game yang lebih cepat.

Volume dapat berguna dalam game dengan tekstur resolusi tinggi. Pengembang game menyediakan beberapa set tekstur untuk game tersebut. Dan semakin banyak memori yang ada pada kartu video, semakin tinggi resolusi tekstur yang dimuat. Tekstur resolusi tinggi memberikan kejelasan dan detail yang lebih baik dalam game. Oleh karena itu, cukup masuk akal untuk mengambil kartu dengan jumlah memori yang besar, jika semua kriteria lainnya cocok. Izinkan kami mengingatkan Anda sekali lagi bahwa lebar bus memori dan frekuensinya memiliki pengaruh yang jauh lebih kuat terhadap kinerja dibandingkan jumlah memori fisik pada kartu.

Lebar bus memori

Lebar bus memori adalah salah satu aspek terpenting kinerja memori. Lebar bus modern berkisar antara 64 hingga 256 bit, dan dalam beberapa kasus bahkan 512 bit. Semakin lebar bus memori, semakin banyak informasi yang dapat ditransfer per siklus clock. Dan ini secara langsung mempengaruhi produktivitas. Misalnya, jika Anda menggunakan dua bus dengan frekuensi yang sama, maka secara teoritis bus 128-bit akan mentransfer data dua kali lebih banyak per siklus clock dibandingkan bus 64-bit. Dan bus 256-bit dua kali lebih besar.

Bandwidth bus yang lebih tinggi (dinyatakan dalam bit atau byte per detik, 1 byte = 8 bit) memberikan kinerja memori yang lebih tinggi. Inilah sebabnya mengapa bus memori jauh lebih penting daripada ukurannya. Pada frekuensi yang sama, bus memori 64-bit beroperasi pada kecepatan hanya 25% dari kecepatan 256-bit!

Mari kita ambil contoh berikut. Kartu video dengan memori video 128 MB, tetapi dengan bus 256-bit, memberikan kinerja memori yang jauh lebih tinggi dibandingkan model 512 MB dengan bus 64-bit. Penting untuk dicatat bahwa untuk beberapa kartu dari lini ATi X1x00, pabrikan menunjukkan spesifikasi bus memori internal, tetapi kami tertarik pada parameter bus eksternal. Misalnya, X1600 memiliki bus lingkar internal yang lebarnya 256 bit, namun bus lingkar eksternal hanya lebarnya 128 bit. Dan kenyataannya, bus memori beroperasi pada kinerja 128-bit.

Jenis memori

Memori dapat dibagi menjadi dua kategori utama: SDR (transfer data tunggal) dan DDR (transfer data ganda), di mana data ditransfer dua kali lebih cepat per siklus clock. Saat ini, teknologi SDR transmisi tunggal sudah ketinggalan zaman. Karena memori DDR mentransfer data dua kali lebih cepat dari SDR, penting untuk diingat bahwa kartu video dengan memori DDR sering kali menunjukkan frekuensi dua kali lipat, bukan frekuensi fisik. Misalnya, jika memori DDR ditentukan pada 1000 MHz, maka ini adalah frekuensi efektif di mana memori SDR biasa harus beroperasi untuk memberikan throughput yang sama. Namun nyatanya frekuensi fisiknya adalah 500 MHz.

Karena alasan ini, banyak yang terkejut ketika frekuensi DDR 1200 MHz diindikasikan untuk memori kartu video mereka, dan utilitas melaporkan 600 MHz. Jadi, Anda harus membiasakannya. Memori DDR2 dan GDDR3/GDDR4 bekerja dengan prinsip yang sama, yaitu dengan transfer data ganda. Perbedaan antara memori DDR, DDR2, GDDR3 dan GDDR4 terletak pada teknologi produksi dan beberapa detailnya. DDR2 dapat beroperasi pada frekuensi yang lebih tinggi dibandingkan memori DDR, dan DDR3 dapat beroperasi pada frekuensi yang lebih tinggi lagi dibandingkan DDR2.

Frekuensi bus memori

Seperti prosesor, memori (atau lebih tepatnya, bus memori) beroperasi pada kecepatan clock tertentu, diukur dalam megahertz. Di sini, peningkatan kecepatan clock secara langsung mempengaruhi kinerja memori. Dan frekuensi bus memori merupakan salah satu parameter yang digunakan untuk membandingkan kinerja kartu video. Misalnya, jika semua karakteristik lainnya (lebar bus memori, dll.) adalah sama, maka cukup logis untuk mengatakan bahwa kartu video dengan memori 700 MHz lebih cepat daripada kartu video dengan memori 500 MHz.

Sekali lagi, kecepatan jam bukanlah segalanya. Memori 700 MHz dengan bus 64-bit akan lebih lambat dibandingkan memori 400 MHz dengan bus 128-bit. Performa memori 400 MHz pada bus 128-bit kira-kira setara dengan memori 800 MHz pada bus 64-bit. Anda juga harus ingat bahwa frekuensi GPU dan memori adalah parameter yang sangat berbeda, dan biasanya keduanya berbeda.

Antarmuka kartu video

Semua data yang ditransfer antara kartu video dan prosesor melewati antarmuka kartu video. Saat ini, tiga jenis antarmuka digunakan untuk kartu video: PCI, AGP dan PCI Express. Mereka berbeda dalam bandwidth dan karakteristik lainnya. Jelas bahwa semakin tinggi throughputnya, semakin tinggi pula kecepatan pertukarannya. Namun, hanya kartu paling modern yang dapat menggunakan bandwidth tinggi, itupun hanya sebagian. Pada titik tertentu, kecepatan antarmuka tidak lagi menjadi hambatan; saat ini kecepatan tersebut sudah cukup.

Bus paling lambat yang digunakan untuk memproduksi kartu video adalah PCI (Peripheral Components Interconnect). Tentu saja, tanpa masuk ke dalam sejarah. PCI benar-benar menurunkan kinerja kartu video, sehingga mereka beralih ke antarmuka AGP (Accelerated Graphics Port). Tetapi spesifikasi AGP 1.0 dan 2x pun membatasi kinerja. Ketika standar meningkatkan kecepatan ke level AGP 4x, kami mulai mendekati batas praktis bandwidth yang dapat ditangani oleh kartu video. Spesifikasi AGP 8x sekali lagi menggandakan throughput dibandingkan dengan AGP 4x (2,16 GB/s), namun kami tidak lagi menerima peningkatan kinerja grafis yang nyata.

Bus terbaru dan tercepat adalah PCI Express. Kartu grafis baru biasanya menggunakan antarmuka PCI Express x16, yang menggabungkan 16 jalur PCI Express untuk total throughput 4 GB/s (satu arah). Ini dua kali lipat throughput AGP 8x. Bus PCI Express menyediakan bandwidth yang disebutkan di kedua arah (transfer data ke dan dari kartu video). Namun kecepatan standar AGP 8x sudah mencukupi, sehingga kami belum menemui situasi di mana peralihan ke PCI Express memberikan peningkatan kinerja dibandingkan AGP 8x (jika parameter perangkat keras lainnya sama). Misalnya, GeForce 6800 Ultra versi AGP akan bekerja sama dengan 6800 Ultra untuk PCI Express.

Saat ini yang terbaik adalah membeli kartu dengan antarmuka PCI Express; kartu tersebut akan tetap ada di pasaran selama beberapa tahun lagi. Kartu paling kuat tidak lagi diproduksi dengan antarmuka AGP 8x, dan solusi PCI Express biasanya lebih mudah ditemukan daripada analog AGP, dan harganya lebih murah.

Solusi pada beberapa kartu video

Menggunakan beberapa kartu video untuk meningkatkan kinerja grafis bukanlah ide baru. Pada masa awal grafis 3D, 3dfx memasuki pasar dengan dua kartu grafis yang berjalan secara paralel. Namun dengan hilangnya 3dfx, teknologi operasi gabungan beberapa kartu video konsumen dilupakan, meskipun ATi telah memproduksi sistem serupa untuk simulator profesional sejak rilis Radeon 9700. Beberapa tahun yang lalu, teknologi tersebut kembali ke pasar: dengan munculnya solusi nVidia SLI dan, beberapa saat kemudian, ATi Crossfire.

Menggunakan beberapa kartu grafis secara bersamaan memberikan kinerja yang cukup untuk menjalankan game pada pengaturan kualitas tinggi dalam resolusi tinggi. Namun memilih satu solusi atau lainnya tidaklah mudah.

Pertama-tama, solusi yang didasarkan pada beberapa kartu video memerlukan energi yang besar, sehingga catu daya harus cukup kuat. Semua panas ini harus dihilangkan dari kartu video, jadi Anda perlu memperhatikan casing PC dan pendinginannya agar sistem tidak terlalu panas.

Juga, ingatlah bahwa SLI/CrossFire memerlukan motherboard yang sesuai (baik untuk satu teknologi atau lainnya), yang biasanya harganya lebih mahal daripada model standar. Konfigurasi nVidia SLI hanya akan berfungsi pada papan nForce4 tertentu, dan kartu ATi CrossFire hanya akan berfungsi pada motherboard dengan chipset CrossFire atau pada model Intel tertentu. Untuk memperumit masalah, beberapa konfigurasi CrossFire memerlukan salah satu kartu yang khusus: CrossFire Edition. Setelah CrossFire dirilis, untuk beberapa model kartu video, ATi mengizinkan penyertaan teknologi kolaborasi melalui bus PCI Express, dan dengan dirilisnya versi driver baru, jumlah kemungkinan kombinasi meningkat. Namun tetap saja, CrossFire perangkat keras dengan kartu CrossFire Edition yang sesuai memberikan kinerja yang lebih tinggi. Namun kartu CrossFire Edition juga lebih mahal dibandingkan model biasa. Saat ini, Anda dapat mengaktifkan mode CrossFire perangkat lunak (tanpa kartu CrossFire Edition) pada kartu grafis Radeon X1300, X1600 dan X1800 GTO.

Ada faktor lain yang perlu dipertimbangkan juga. Meskipun dua kartu grafis yang bekerja sama memberikan peningkatan kinerja, namun peningkatan tersebut jauh dari dua kali lipat. Tapi Anda akan membayar uang dua kali lebih banyak. Paling sering, peningkatan produktivitas adalah 20-60%. Dan dalam beberapa kasus, karena adanya tambahan biaya komputasi untuk pencocokan, tidak ada peningkatan sama sekali. Oleh karena itu, konfigurasi multi-kartu sepertinya tidak akan bermanfaat pada model yang lebih murah, karena kartu grafis yang lebih mahal biasanya akan selalu mengungguli beberapa kartu yang lebih murah. Secara umum, bagi sebagian besar konsumen, membeli solusi SLI/CrossFire tidak masuk akal. Namun jika Anda ingin mengaktifkan semua opsi peningkatan kualitas atau bermain pada resolusi ekstrem, misalnya 2560x1600, saat Anda perlu menghitung lebih dari 4 juta piksel per frame, maka Anda tidak dapat melakukannya tanpa dua atau empat kartu video berpasangan.

Fitur visual

Selain spesifikasi perangkat keras semata, generasi dan model GPU yang berbeda mungkin berbeda dalam rangkaian fungsinya. Misalnya, sering dikatakan bahwa kartu generasi ATi Radeon X800 XT kompatibel dengan Shader Model 2.0b (SM), sedangkan nVidia GeForce 6800 Ultra kompatibel dengan SM 3.0, meskipun spesifikasi perangkat kerasnya hampir sama (16 saluran pipa ). Oleh karena itu, banyak konsumen yang memilih solusi tertentu tanpa mengetahui apa arti perbedaannya.

Versi Microsoft DirectX dan Shader Model

Nama-nama ini paling sering digunakan dalam perselisihan, namun hanya sedikit orang yang tahu apa maksud sebenarnya. Untuk memahaminya, mari kita mulai dengan sejarah API grafis. DirectX dan OpenGL adalah API grafis, yaitu Antarmuka Pemrograman Aplikasi - standar kode terbuka yang tersedia untuk semua orang.

Sebelum munculnya API grafis, setiap produsen GPU menggunakan mekanismenya sendiri untuk berkomunikasi dengan game. Pengembang harus menulis kode terpisah untuk setiap GPU yang ingin mereka dukung. Pendekatan yang sangat mahal dan tidak efektif. Untuk mengatasi masalah ini, API untuk grafik 3D dikembangkan sehingga pengembang menulis kode untuk API tertentu, dan bukan untuk kartu video tertentu. Setelah itu, masalah kompatibilitas menjadi tanggung jawab produsen kartu video, yang harus memastikan bahwa drivernya kompatibel dengan API.

Satu-satunya kesulitan yang tersisa adalah saat ini digunakan dua API berbeda, yaitu Microsoft DirectX dan OpenGL, di mana GL adalah singkatan dari Graphics Library. Karena DirectX API lebih populer di game saat ini, kami akan fokus padanya. Dan standar ini memiliki pengaruh yang lebih kuat terhadap perkembangan game.

DirectX adalah ciptaan Microsoft. Faktanya, DirectX menyertakan beberapa API, hanya satu yang digunakan untuk grafik 3D. DirectX menyertakan API untuk suara, musik, perangkat input, dll. Direct3D API bertanggung jawab atas grafik 3D di DirectX. Ketika mereka berbicara tentang kartu video, inilah maksudnya, jadi dalam hal ini konsep DirectX dan Direct3D dapat dipertukarkan.

DirectX diperbarui secara berkala seiring kemajuan teknologi grafis dan pengembang game menerapkan teknik pemrograman game baru. Seiring dengan meningkatnya popularitas DirectX dengan cepat, produsen GPU mulai menyesuaikan rilis produk baru untuk mengakomodasi kemampuan DirectX. Karena alasan ini, kartu video sering kali dikaitkan dengan dukungan perangkat keras untuk satu atau beberapa generasi DirectX (DirectX 8, 9.0, atau 9.0c).

Yang lebih rumit lagi, bagian dari Direct3D API dapat berubah seiring waktu tanpa mengubah generasi DirectX. Misalnya, spesifikasi DirectX 9.0 menetapkan dukungan untuk Pixel Shader 2.0. Namun pembaruan DirectX 9.0c menyertakan Pixel Shader 3.0. Jadi, meskipun kartunya berkelas DirectX 9, mereka dapat mendukung rangkaian fitur yang berbeda. Misalnya, Radeon 9700 mendukung Shader Model 2.0, dan Radeon X1800 mendukung Shader Model 3.0, meskipun kedua kartu tersebut dapat diklasifikasikan sebagai generasi DirectX 9.

Ingatlah bahwa saat membuat game baru, pengembang memperhitungkan pemilik mesin dan kartu video lama, karena jika segmen pengguna ini diabaikan, tingkat penjualan akan lebih rendah. Karena alasan ini, beberapa jalur kode dibangun ke dalam game. Game kelas DirectX 9 mungkin memiliki jalur DirectX 8 dan bahkan jalur DirectX 7. Biasanya, jika jalur lama dipilih, maka beberapa efek virtual yang ada pada kartu video baru akan hilang dari permainan. Tapi setidaknya Anda bisa bermain bahkan di perangkat keras lama.

Banyak game baru memerlukan DirectX versi terbaru untuk diinstal, meskipun kartu videonya berasal dari generasi sebelumnya. Artinya, game baru yang akan menggunakan jalur DirectX 8 masih memerlukan instalasi DirectX 9 versi terbaru untuk kartu video sekelas DirectX 8.

Apa perbedaan antara berbagai versi Direct3D API di DirectX? Versi awal DirectX - 3, 5, 6 dan 7 - relatif sederhana dalam kemampuan Direct3D API. Pengembang dapat memilih efek visual dari daftar dan kemudian menguji cara kerjanya dalam game. Langkah besar berikutnya dalam pemrograman grafis adalah DirectX 8. Ini memperkenalkan kemampuan untuk memprogram kartu video menggunakan shader, sehingga pengembang untuk pertama kalinya memiliki kebebasan untuk memprogram efek sesuai kebutuhan mereka. DirectX 8 mendukung versi Pixel Shader 1.0 hingga 1.3 dan Vertex Shader 1.0. DirectX 8.1, versi terbaru dari DirectX 8, menerima Pixel Shader 1.4 dan Vertex Shader 1.1.

Di DirectX 9 Anda dapat membuat program shader yang lebih kompleks. DirectX 9 mendukung Pixel Shader 2.0 dan Vertex Shader 2.0. DirectX 9c, versi terbaru dari DirectX 9, menyertakan spesifikasi Pixel Shader 3.0.

DirectX 10, versi API mendatang, akan menyertai versi baru versi Windows Pemandangan. Anda tidak dapat menginstal DirectX 10 pada Windows XP.

Pencahayaan HDR dan OpenEXR HDR

HDR adalah singkatan dari “Rentang Dinamis Tinggi”. Game dengan pencahayaan HDR dapat menghasilkan gambar yang jauh lebih realistis dibandingkan game tanpa pencahayaan HDR, dan tidak semua kartu video mendukung pencahayaan HDR.

Sebelum munculnya kartu grafis DirectX 9, GPU sangat dibatasi oleh keakuratan penghitungan pencahayaannya. Hingga saat ini, pencahayaan hanya dapat dihitung dengan level internal 256 (8 bit).

Ketika kartu video DirectX 9 muncul, mereka mampu menghasilkan pencahayaan dengan presisi tinggi - penuh 24 bit atau level 16,7 juta.

Dengan 16,7 juta level dan langkah selanjutnya dalam kinerja kartu video DirectX 9/Shader Model 2.0, pencahayaan HDR menjadi mungkin dilakukan di komputer. Ini adalah teknologi yang agak rumit, dan Anda perlu memperhatikannya secara dinamis. Sederhananya, pencahayaan HDR meningkatkan kontras (warna gelap tampak lebih gelap, warna terang tampak lebih terang), sekaligus meningkatkan jumlah detail pencahayaan di area gelap dan terang. Game dengan pencahayaan HDR tampak lebih hidup dan realistis dibandingkan tanpa pencahayaan HDR.

GPU yang sesuai dengan spesifikasi Pixel Shader 3.0 terbaru memungkinkan penghitungan pencahayaan presisi 32-bit yang lebih tinggi dan pencampuran floating point. Dengan demikian, kartu video kelas SM 3.0 dapat mendukung metode pencahayaan OpenEXR HDR khusus yang dirancang khusus untuk industri film.

Beberapa game yang hanya mendukung pencahayaan OpenEXR HDR tidak akan berjalan dengan pencahayaan HDR pada kartu grafis Shader Model 2.0. Namun, game yang tidak mengandalkan metode OpenEXR akan berjalan di kartu grafis DirectX 9. Misalnya, Oblivion menggunakan metode OpenEXR HDR dan hanya mengizinkan pencahayaan HDR pada kartu grafis terbaru yang mendukung spesifikasi Shader Model 3.0. Misalnya nVidia GeForce 6800 atau ATi Radeon X1800. Game yang menggunakan mesin 3D Half-Life 2, termasuk Counter-Strike: Source dan Half-Life 2: Aftermath yang akan datang, memungkinkan rendering HDR diaktifkan pada kartu grafis DirectX 9 lama yang hanya mendukung Pixel Shader 2.0. Contohnya termasuk lini GeForce 5 atau ATi Radeon 9500.

Terakhir, perlu diingat bahwa semua bentuk rendering HDR memerlukan kekuatan pemrosesan yang serius dan dapat membuat GPU paling kuat sekalipun bertekuk lutut. Jika Anda ingin memainkan game terbaru dengan pencahayaan HDR, grafis berperforma tinggi adalah suatu keharusan.

Anti-aliasing layar penuh

Anti-aliasing layar penuh (disingkat AA) memungkinkan Anda menghilangkan karakteristik “tangga” pada batas poligon. Namun perlu diingat bahwa anti-aliasing layar penuh menghabiskan banyak sumber daya komputasi, yang menyebabkan penurunan kecepatan bingkai.

Anti-aliasing sangat bergantung pada kinerja memori video, sehingga kartu video berkecepatan tinggi dengan memori cepat akan mampu menghitung anti-aliasing layar penuh dengan dampak kinerja yang lebih kecil dibandingkan kartu video murah. Antialiasing dapat diaktifkan dalam berbagai mode. Misalnya, antialiasing 4x akan menghasilkan gambar yang lebih baik daripada antialiasing 2x, namun akan berdampak besar pada performa. Meskipun antialiasing 2x menggandakan resolusi horizontal dan vertikal, mode 4x melipatgandakannya.

Penyaringan tekstur

Tekstur diterapkan ke semua objek 3D dalam game, dan semakin besar sudut permukaan yang ditampilkan, teksturnya akan terlihat semakin terdistorsi. Untuk menghilangkan efek ini, GPU menggunakan pemfilteran tekstur.

Metode penyaringan pertama disebut bilinear dan menghasilkan garis-garis khas yang tidak terlalu enak dipandang. Situasi membaik dengan diperkenalkannya pemfilteran trilinear. Kedua opsi ini berfungsi pada kartu video modern tanpa penalti performa.

Saat ini, cara terbaik untuk memfilter tekstur adalah pemfilteran anisotropik (AF). Seperti antialiasing layar penuh, pemfilteran anisotropik dapat diaktifkan pada level yang berbeda. Misalnya, 8x AF memberikan kualitas pemfilteran yang lebih baik dibandingkan 4x AF. Seperti antialiasing layar penuh, pemfilteran anisotropik memerlukan sejumlah daya pemrosesan, yang meningkat seiring dengan peningkatan level AF.

Tekstur resolusi tinggi

Semua game 3D dibuat dengan mempertimbangkan spesifikasi spesifik, dan salah satu persyaratan tersebut menentukan memori tekstur yang dibutuhkan game tersebut. Semua tekstur yang diperlukan harus masuk ke dalam memori kartu video selama permainan, jika tidak, kinerja akan turun secara signifikan, karena mengakses tekstur ke RAM menyebabkan penundaan yang cukup besar, belum lagi file paging di hard drive. Oleh karena itu, jika pengembang game mengandalkan memori video 128 MB sebagai persyaratan minimum, maka kumpulan tekstur aktif tidak boleh melebihi 128 MB setiap saat.

Permainan modern memiliki beberapa set tekstur, sehingga permainan akan berjalan tanpa masalah pada kartu video lama dengan memori video lebih sedikit, serta pada kartu baru dengan memori video lebih banyak. Misalnya, sebuah game mungkin berisi tiga set tekstur: untuk 128 MB, 256 MB, dan 512 MB. Saat ini, hanya ada sedikit game yang mendukung memori video 512 MB, namun game tersebut tetap menjadi alasan paling obyektif untuk membeli kartu video dengan memori sebesar itu. Meskipun peningkatan memori berdampak kecil atau tidak sama sekali terhadap performa, Anda akan mendapatkan manfaat dari peningkatan kualitas visual jika game mendukung rangkaian tekstur yang sesuai.

Apa yang perlu Anda ketahui tentang kartu video?

Dalam kontak dengan

Arsitektur GPU: Fitur

Realisme grafik 3D sangat bergantung pada kinerja kartu video. Semakin banyak blok shader piksel yang dikandung prosesor dan semakin tinggi frekuensinya, semakin banyak efek yang dapat diterapkan pada pemandangan 3D untuk meningkatkan persepsi visualnya.

GPU berisi banyak blok fungsional yang berbeda. Berdasarkan jumlah beberapa komponen, Anda dapat memperkirakan seberapa kuat GPU tersebut. Sebelum melangkah lebih jauh, mari kita meninjau blok fungsional yang paling penting.

Prosesor vertex (unit shader vertex)

Seperti unit pixel shader, prosesor vertex mengeksekusi kode shader yang menyentuh simpul. Karena anggaran vertex yang lebih besar memungkinkan pembuatan objek 3D yang lebih kompleks, kinerja prosesor vertex sangat penting dalam adegan 3D dengan objek yang kompleks atau dalam jumlah besar. Namun, unit vertex shader masih belum memiliki dampak nyata terhadap kinerja seperti prosesor piksel.

Prosesor piksel (unit shader piksel)

Prosesor piksel adalah komponen chip grafis yang didedikasikan untuk memproses program pixel shader. Prosesor ini melakukan penghitungan yang hanya menyangkut piksel. Karena piksel berisi informasi warna, pixel shader memungkinkan Anda mencapai efek grafis yang mengesankan. Misalnya, sebagian besar efek air yang Anda lihat di game dibuat menggunakan pixel shader. Biasanya, jumlah prosesor piksel digunakan untuk membandingkan kinerja piksel kartu video. Jika satu kartu memiliki delapan unit pixel shader dan kartu lainnya memiliki 16 unit, maka masuk akal untuk mengasumsikan bahwa kartu video dengan 16 unit akan lebih cepat dalam memproses program pixel shader yang kompleks. Kecepatan clock juga harus diperhitungkan, tetapi saat ini menggandakan jumlah prosesor piksel lebih hemat energi dibandingkan menggandakan frekuensi chip grafis.

Shader terpadu

Unified shader belum hadir di dunia PC, tetapi standar DirectX 10 yang akan datang didasarkan pada arsitektur serupa. Artinya, struktur kode program titik, geometri, dan piksel akan sama, meskipun shader akan melakukan pekerjaan yang berbeda. Spesifikasi barunya bisa dilihat pada Xbox 360 yang GPU-nya didesain khusus oleh ATi untuk Microsoft. Akan sangat menarik untuk melihat potensi apa yang dibawa oleh DirectX 10 baru.

Unit Pemetaan Tekstur (TMU)

Tekstur harus dipilih dan disaring. Pekerjaan ini dilakukan oleh unit pemetaan tekstur, yang bekerja bersama dengan unit pixel dan vertex shader. Tugas TMU adalah menerapkan operasi tekstur pada piksel. Jumlah unit tekstur dalam GPU sering digunakan untuk membandingkan performa tekstur kartu video. Masuk akal untuk berasumsi bahwa kartu grafis dengan TMU yang lebih banyak akan memberikan performa tekstur yang lebih baik.

Unit Operator Raster (ROP)

Prosesor raster bertanggung jawab untuk menulis data piksel ke dalam memori. Kecepatan di mana operasi ini dilakukan adalah laju pengisian. Pada masa awal akselerator 3D, ROP dan kecepatan pengisian merupakan karakteristik yang sangat penting dari kartu video. Saat ini, pekerjaan ROP masih penting, namun kinerja kartu video tidak lagi dibatasi oleh blok-blok ini seperti dulu. Oleh karena itu, kinerja (dan jumlah) ROP jarang digunakan untuk mengevaluasi kecepatan kartu video.

Konveyor

Pipeline digunakan untuk mendeskripsikan arsitektur kartu video dan memberikan gambaran yang sangat jelas tentang kinerja GPU.

Konveyor tidak dapat dianggap sebagai istilah teknis yang ketat. GPU menggunakan pipeline berbeda yang menjalankan fungsi berbeda. Secara historis, pipeline berarti prosesor piksel yang terhubung ke unit pemetaan tekstur (TMU). Misalnya, kartu video Radeon 9700 menggunakan prosesor delapan piksel, yang masing-masing terhubung ke TMU sendiri, sehingga kartu tersebut dianggap memiliki delapan saluran pipa.

Namun prosesor modern sangat sulit dijelaskan berdasarkan jumlah saluran pipanya. Dibandingkan dengan desain sebelumnya, prosesor baru ini menggunakan struktur modular dan terfragmentasi. ATi dapat dianggap sebagai inovator di bidang ini, yang, dengan jajaran kartu video X1000, beralih ke struktur modular, yang memungkinkan pencapaian peningkatan kinerja melalui optimalisasi internal. Beberapa blok CPU digunakan lebih banyak daripada yang lain, dan untuk meningkatkan kinerja GPU, ATi telah mencoba menemukan kompromi antara jumlah blok yang dibutuhkan dan area cetakan (yang tidak dapat ditingkatkan terlalu banyak). Dalam arsitektur ini, istilah "pixel pipeline" sudah kehilangan maknanya, karena prosesor pixel tidak lagi terhubung ke TMU mereka sendiri. Misalnya, GPU ATi Radeon X1600 memiliki 12 unit shader piksel dan hanya empat unit pemetaan tekstur TMU. Oleh karena itu, tidak mungkin untuk mengatakan bahwa arsitektur prosesor ini memiliki saluran 12 piksel, sama seperti tidak mungkin untuk mengatakan bahwa hanya ada empat saluran. Namun, secara tradisi, saluran pipa piksel masih disebutkan.

Dengan mempertimbangkan asumsi di atas, jumlah pipeline piksel dalam GPU sering digunakan untuk membandingkan kartu video (dengan pengecualian lini ATi X1x00). Misalnya, jika Anda mengambil kartu video dengan 24 dan 16 saluran, maka cukup masuk akal untuk berasumsi bahwa kartu dengan 24 saluran akan lebih cepat.


ISI
Di forum kami setiap hari, lusinan orang meminta saran untuk memodernisasi mesin mereka, dan kami dengan senang hati membantu mereka. Setiap hari, "mengevaluasi perakitan" dan memeriksa kompatibilitas komponen yang dipilih oleh klien kami, kami mulai memperhatikan bahwa pengguna terutama memperhatikan komponen lain yang tidak diragukan lagi penting. Dan jarang ada orang yang ingat bahwa ketika memutakhirkan komputer, perlu memperbarui bagian yang sama pentingnya -. Dan hari ini kami akan memberi tahu dan menunjukkan mengapa Anda tidak boleh melupakan hal ini.

“...Saya ingin mengupgrade komputer saya agar semuanya bisa terbang, saya membeli motherboard i7-3970X dan ASRock X79 Extreme6, ditambah kartu video RADEON HD 7990 6GB. Apa lagi nan????777"
- ini adalah bagaimana sekitar setengah dari semua pesan mengenai pembaruan dimulai komputer desktop. Berdasarkan anggaran mereka atau keluarga, pengguna mencoba memilih modul memori tercepat, tercepat dan terindah. Pada saat yang sama, secara naif percaya bahwa 450W lama mereka akan mengatasi kartu video yang haus daya dan prosesor "panas" selama overclocking pada saat yang bersamaan.

Kami, pada bagian kami, telah menulis lebih dari satu kali tentang pentingnya pasokan listrik - tetapi, kami akui, hal itu mungkin belum cukup jelas. Oleh karena itu, hari ini kami telah mengoreksi diri sendiri dan menyiapkan pengingat untuk Anda tentang apa yang akan terjadi jika Anda melupakannya saat memutakhirkan PC Anda - dengan gambar dan deskripsi terperinci.

Jadi, kami memutuskan untuk memperbarui konfigurasi...


Untuk percobaan kami, kami memutuskan untuk menggunakan komputer rata-rata yang benar-benar baru dan meningkatkannya ke level “mesin game”. Tidak perlu banyak mengubah konfigurasi - cukup dengan mengganti memori dan kartu video sehingga kita memiliki kesempatan untuk memainkan game yang kurang lebih modern dengan pengaturan detail yang layak. Konfigurasi awal komputer kita adalah sebagai berikut:

Satuan daya: ATX 12V 400W

Jelas bahwa untuk game, konfigurasi ini, secara halus, agak lemah. Jadi inilah waktunya untuk mengubah sesuatu! Kami akan mulai dengan hal yang sama di mana sebagian besar dari mereka yang haus akan "peningkatan" memulai - dengan. Kami tidak akan mengganti motherboard - selama itu cocok untuk kami.

Karena kami memutuskan untuk tidak menyentuh motherboard, kami akan memilih salah satu yang kompatibel dengan soket FM2 (untungnya, ada tombol khusus untuk ini di situs NICS di halaman deskripsi motherboard). Jangan serakah - mari kita ambil yang terjangkau, tapi cepat dan prosesor yang kuat dengan frekuensi 4,1 GHz (hingga 4,4 GHz dalam mode Turbo CORE) dan pengganda yang tidak terkunci - kami juga suka melakukan overclock, tidak ada manusia yang asing bagi kami. Berikut ciri-ciri prosesor yang kami pilih:

Karakteristik
Frekuensi bus CPU 5000MHz Disipasi daya 100 watt Frekuensi prosesor 4,1 GHz atau hingga 4,4 GHz dalam mode Turbo CORE Inti tanah kaya cache L1 96 KBx2 cache L2 2048 KB x2, berjalan pada kecepatan prosesor dukungan 64-bit Ya Jumlah Inti 4 Perkalian 41, pengganda tidak terkunci Inti video prosesor AMD Radeon HD 8670D dengan frekuensi 844 MHz; Dukungan Shader Model 5 Volume maksimal memori akses acak 64 GB Maks. jumlah monitor yang terhubung 3 terhubung langsung atau hingga 4 monitor menggunakan splitter DisplayPort

Satu stick 4GB bukanlah pilihan kami. Pertama, kami ingin 16GB, dan kedua, kami perlu menggunakannya mode saluran ganda berfungsi, untuk itu kami akan memasang dua modul memori masing-masing 8 GB di komputer kami. Throughput yang tinggi, kurangnya radiator, dan harga yang pantas menjadikan ini pilihan paling “lezat” bagi kami. Selain itu, Anda dapat mengunduh program Radeon RAMDisk dari situs web AMD, yang memungkinkan kami membuat file super cepat penggerak virtual hingga 6GB benar-benar gratis – dan semua orang menyukai hal-hal bermanfaat yang gratis.


Karakteristik
Penyimpanan 8 GB
Jumlah modul 2
Standar memori PC3-10600 (DDR3 1333MHz)
Frekuensi operasi hingga 1333MHz
Pengaturan waktu 9-9-9-24
Tegangan suplai 1,5V
Bandwidth 10667 Mb/dtk

Anda dapat memutar dengan nyaman video bawaan hanya di “minesweeper”. Oleh karena itu, untuk meningkatkan komputer Anda ke level game, kami memilih yang modern dan kuat, namun bukan yang paling mahal.


Muncul dengan memori video 2GB, dukungan untuk DirectX 11 dan OpenGL 4.x. dan sistem pendingin Twin Frozr IV yang luar biasa. Performanya seharusnya lebih dari cukup bagi kita untuk menikmati angsuran terbaru dari franchise game terpopuler, seperti Tomb Raider, Crysis, Hitman, dan Far Cry. Ciri-ciri yang kami pilih adalah sebagai berikut:


Karakteristik
GPU Geforce GTX 770
frekuensi GPU 1098 MHz atau hingga 1150 MHz dalam mode GPU Boost
Jumlah prosesor shader 1536
Memori video 2 GB
Jenis memori video GDDR5
Lebar bus memori video 256 sedikit
Frekuensi memori video 1753 MHz (7,010 GHz QDR)
Jumlah saluran piksel 128, 32 unit pengambilan sampel tekstur
Antarmuka PCI Express 3.0 16x (kompatibel dengan PCI Express 2.x/1.x) dengan kemampuan menggabungkan kartu menggunakan SLI.
Pelabuhan DisplayPort, DVI-D, DVI-I, HDMI, adaptor D-Sub disertakan
Mendinginkan kartu video Aktif (heatsink + 2 kipas Twin Frozr IV di sisi depan board)
Konektor daya 8 pin + 8 pin
dukungan API DirectX 11 dan OpenGL 4.x
Panjang kartu video (diukur dalam NICS) 263mm
Dukungan untuk komputasi GPU tujuan umum DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Konsumsi daya maksimum FurMark+WinRar 255 watt
Peringkat Kinerja 61.5

Kesulitan yang tidak terduga

Sekarang kami memiliki semua yang kami butuhkan untuk mengupgrade komputer kami. Kami akan memasang komponen baru ke dalam casing yang sudah ada.


Kami meluncurkannya dan tidak berhasil. Dan mengapa? Namun karena catu daya murah secara fisik tidak mampu menjalankan komputer dengan daya apapun. Faktanya adalah bahwa dalam kasus kami, catu daya memerlukan dua konektor 8-pin, dan catu daya hanya memiliki satu konektor daya kartu video 6-pin di dasarnya. Mengingat banyak orang membutuhkan lebih banyak konektor daripada kasus kami, menjadi jelas bahwa catu daya perlu diubah.

Tapi itu tidak terlalu buruk. Bayangkan saja, tidak ada konektor daya! Di laboratorium pengujian kami, kami menemukan adaptor yang cukup langka dari 6-pin ke 8-pin dan dari Molex ke 6-pin. Seperti yang ini:


Perlu dicatat bahwa bahkan dengan catu daya modern beranggaran rendah, dengan setiap rilis baru konektor Molex, jumlah konektor Molex semakin sedikit - jadi kita dapat mengatakan bahwa kita beruntung.

Sekilas semuanya baik-baik saja, dan dengan beberapa trik kami dapat memperbaruinya Unit sistem ke konfigurasi "gamer". Sekarang mari kita simulasikan beban dengan menjalankan tes Furmark dan pengarsip 7Zip dalam mode Xtreme Burning secara bersamaan di komputer gaming baru kita. Kita bisa menyalakan komputer - sudah bagus. Sistem ini juga selamat dari peluncuran Furmark. Kami meluncurkan pengarsip - dan apa itu?! Komputer dimatikan, memanjakan kami dengan deru kipas angin yang maksimal. Standar "sederhana" 400W tidak mampu, tidak peduli seberapa keras dia berusaha, memberi makan kartu video dan prosesor yang kuat. Dan karena sistem pendingin yang biasa-biasa saja, sistem kami menjadi sangat panas, dan bahkan kecepatan kipas maksimum tidak memungkinkannya menghasilkan setidaknya 400W yang dinyatakan.

Ada jalan keluar!

Kami telah tiba. Kami membeli komponen mahal untuk merakit komputer gaming, tapi ternyata kami tidak bisa memainkannya. Memalukan. Kesimpulannya jelas bagi semua orang: yang lama tidak cocok untuk kita komputer permainan, dan perlu segera diganti dengan yang baru. Tapi yang mana sebenarnya?

Untuk komputer kami yang ditingkatkan, kami memilih berdasarkan empat kriteria utama:

Yang pertama, tentu saja, adalah kekuatan. Kami lebih suka memilih dengan cadangan - kami ingin melakukan overclock prosesor dan mendapatkan poin dalam pengujian sintetis. Mempertimbangkan semua yang mungkin kami perlukan di masa depan, kami memutuskan untuk memilih daya minimal 800W.

Kriteria kedua adalah keandalan. Kami benar-benar ingin yang diambil “dengan cadangan” dapat bertahan dari kartu video dan prosesor generasi berikutnya, tidak kehabisan tenaga dengan sendirinya, dan pada saat yang sama tidak membakar komponen yang mahal (bersama dengan platform pengujian). Oleh karena itu, pilihan kami hanya kapasitor Jepang, hanya perlindungan terhadapnya sirkuit pendek dan perlindungan yang andal terhadap kelebihan beban pada output mana pun.

Poin ketiga dari persyaratan kami adalah kenyamanan dan fungsionalitas.. Pertama-tama, kita perlu - komputer akan sering bekerja, dan terutama catu daya yang berisik, ditambah dengan kartu video dan pendingin prosesor, akan membuat pengguna mana pun menjadi gila. Selain itu, kita tidak asing dengan keindahan, jadi catu daya baru untuk komputer gaming kita harus bersifat modular dan memiliki kabel dan konektor yang dapat dilepas. Agar tidak ada yang berlebihan.

Dan yang terakhir dalam daftar, namun tidak kalah pentingnya, adalah kriterianya efisiensi energi. Ya, kami peduli terhadap lingkungan dan tagihan listrik. Oleh karena itu, catu daya yang kami pilih harus memenuhi setidaknya standar efisiensi energi 80+ Perunggu.

Setelah membandingkan dan menganalisis semua persyaratan, kami memilih, di antara sedikit pelamar, salah satu yang paling memenuhi semua persyaratan kami. Itu menjadi kekuatan 850W. Perhatikan bahwa dalam beberapa hal bahkan melebihi persyaratan kami. Mari kita lihat spesifikasinya:

Karakteristik catu daya
Jenis peralatan Catu daya dengan modul PFC (Power Factor Correction) aktif.
Properti Jalinan loop, kapasitor Jepang, Proteksi hubung singkat (SCP), Proteksi tegangan lebih (OVP), Proteksi kelebihan beban pada setiap output unit secara individual (OCP)
+3,3V - 24A, +5V - 24A, +12V - 70A, +5VSB - 3,0A, -12V - 0,5 A
Kabel daya yang dapat dilepas Ya
Efisiensi 90%, bersertifikat 80 PLUS Emas
Sumber daya listrik 850 watt
Konektor daya motherboard 24+8+8 pin, 24+8+4 pin, 24+8 pin, 24+4 pin, 20+4 pin (konektor 24-pin dapat dilepas. 4-pin dapat dilepas jika perlu, konektor 8-pin dapat dilepas)
Konektor daya kartu video Konektor 6x 6/8-pin (konektor 8-pin yang dapat diturunkan - 2 pin dapat dilepas)
MTBF 100 ribu jam
Mendinginkan catu daya 1 kipas: 140 x 140 mm (di dinding bawah). Sistem pendingin pasif pada beban hingga 50%.
Kontrol kecepatan kipas Dari sensor suhu. Mengubah kecepatan kipas tergantung pada suhu di dalam catu daya. Pemilihan mode pengoperasian kipas secara manual. Dalam mode Normal, kipas berputar terus-menerus, dan dalam mode Senyap, kipas berhenti sepenuhnya pada beban rendah.


, salah satu yang terbaik dalam hal uang. Mari kita instal dalam kasus kita:


Kemudian terjadi sesuatu yang sedikit membingungkan kami. Tampaknya semuanya telah dirakit dengan benar, semuanya terhubung, semuanya berfungsi - tetapi catu daya tidak bersuara! Artinya, secara umum: kipas angin telah diam dan masih berdiri, dan sistem telah menyala dengan baik dan berfungsi. Faktanya adalah bahwa pada beban hingga 50%, catu daya beroperasi dalam apa yang disebut mode senyap - tanpa memutar kipas sistem pendingin. Kipas hanya akan berdengung di bawah beban berat - peluncuran pengarsip dan Furmark secara bersamaan masih menyebabkan pendingin berputar.


Catu daya memiliki sebanyak enam konektor daya kartu video 8-pin6-pin, yang masing-masing merupakan konektor 8-pin yang dapat dilipat, yang 2 pinnya dapat dilepas jika perlu. Dengan demikian, ia dapat memberi makan kartu video apa pun tanpa kerumitan atau kesulitan apa pun. Dan tidak satu pun.


Sistem catu daya modular memungkinkan Anda melepaskan kabel daya berlebih dan tidak perlu, sehingga meningkatkan aliran udara casing, stabilitas sistem, dan, tentu saja, meningkatkan estetika penampilan ruang internal, yang memungkinkan kami merekomendasikannya dengan aman kepada modder dan penggemar casing dengan windows.
beli catu daya yang andal dan kuat. Dalam ulasan kami, itu menjadi. - dan seperti yang Anda lihat, ini bukan suatu kebetulan. Dengan membelinya dari NICS, Anda dapat yakin bahwa semua komponen sistem berkinerja tinggi Anda akan mendapatkan daya yang cukup dan tidak terputus, bahkan dalam overclocking ekstrem.


Selain itu, catu daya akan memiliki daya yang cukup untuk beberapa tahun mendatang - lebih baik dengan cadangan jika Anda akan memperbarui sistem dengan komponen tingkat tinggi di masa mendatang.

Prosesor grafis modern mengandung banyak blok fungsional, jumlah dan karakteristiknya menentukan kecepatan rendering akhir, yang memengaruhi kenyamanan permainan. Berdasarkan jumlah komparatif blok-blok ini di chip video yang berbeda, Anda dapat memperkirakan secara kasar seberapa cepat GPU tertentu. Chip video memiliki karakteristik yang cukup banyak, pada bagian ini kita hanya akan membahas karakteristik yang paling penting saja.

Kecepatan jam chip video

Frekuensi pengoperasian GPU biasanya diukur dalam megahertz, yaitu jutaan siklus per detik. Karakteristik ini secara langsung mempengaruhi kinerja chip video - semakin tinggi, semakin banyak pekerjaan yang dapat dilakukan GPU per unit waktu, memproses lebih banyak simpul dan piksel. Contoh dari kehidupan nyata: frekuensi chip video yang dipasang pada papan Radeon HD 6670 adalah 840 MHz, dan chip yang sama persis pada model Radeon HD 6570 beroperasi pada frekuensi 650 MHz. Oleh karena itu, semua karakteristik kinerja utama akan berbeda. Namun bukan hanya frekuensi pengoperasian chip yang menentukan kinerja; kecepatannya juga sangat dipengaruhi oleh arsitektur grafis itu sendiri: desain dan jumlah unit eksekusi, karakteristiknya, dll.

Dalam beberapa kasus, kecepatan clock masing-masing blok GPU berbeda dari kecepatan chip lainnya. Artinya, bagian GPU yang berbeda beroperasi pada frekuensi yang berbeda, dan hal ini dilakukan untuk meningkatkan efisiensi, karena beberapa blok mampu beroperasi pada frekuensi yang lebih tinggi, sementara blok lainnya tidak. Sebagian besar kartu video GeForce dari NVIDIA dilengkapi dengan GPU ini. Sebagai contoh terbaru, mari kita lihat chip video pada model GTX 580, yang sebagian besar beroperasi pada frekuensi 772 MHz, dan unit komputasi universal dari chip tersebut memiliki frekuensi dua kali lipat - 1544 MHz.

Tingkat pengisian

Kecepatan pengisian menunjukkan seberapa cepat chip video mampu menggambar piksel. Ada dua jenis laju pengisian: laju pengisian piksel dan laju pengisian tekstur. Kecepatan pengisian piksel menunjukkan kecepatan menggambar piksel di layar dan bergantung pada frekuensi pengoperasian dan jumlah unit ROP (unit operasi rasterisasi dan pencampuran), dan kecepatan pengisian tekstur adalah kecepatan pengambilan sampel data tekstur, yang bergantung pada frekuensi pengoperasian. dan jumlah unit tekstur.

Misalnya, laju pengisian piksel puncak GeForce GTX 560 Ti adalah 822 (frekuensi chip) × 32 (jumlah unit ROP) = 26304 megapiksel per detik, dan laju pengisian tekstur adalah 822 × 64 (jumlah unit tekstur) = 52608 megateksel /S. Secara sederhana, situasinya seperti ini - semakin besar angka pertama, semakin cepat kartu video dapat menggambar piksel jadi, dan semakin besar angka kedua, semakin cepat pengambilan sampel data tekstur.

Meskipun pentingnya fillrate "murni" di dalamnya Akhir-akhir ini telah menurun secara nyata, sehingga memberikan kecepatan komputasi, parameter ini masih tetap sangat penting, terutama untuk game dengan geometri sederhana dan perhitungan piksel dan titik yang relatif sederhana. Jadi kedua parameter tersebut tetap penting untuk permainan modern, namun harus seimbang. Oleh karena itu, jumlah unit ROP pada chip video modern biasanya lebih sedikit dibandingkan jumlah unit tekstur.

Jumlah unit atau prosesor komputasi (shader).

Mungkin sekarang blok-blok ini adalah bagian utama dari chip video. Mereka tampil program khusus, dikenal sebagai shader. Selain itu, jika pixel shader sebelumnya melakukan blok pixel shader, dan vertex shader melakukan blok vertex, maka untuk beberapa waktu arsitektur grafis disatukan, dan unit komputasi universal ini mulai menangani berbagai perhitungan: perhitungan titik, piksel, geometris, dan bahkan universal.

Untuk pertama kalinya, arsitektur terpadu digunakan dalam chip video game. Konsol Microsoft Xbox 360, GPU ini dikembangkan oleh ATI (kemudian dibeli oleh AMD). Dan dalam chip video untuk komputer pribadi, unit shader terpadu muncul di papan NVIDIA GeForce 8800. Dan sejak itu, semua chip video baru didasarkan pada arsitektur terpadu, yang memiliki kode universal untuk program shader yang berbeda (vertex, pixel, geometri, dll.), dan prosesor terpadu yang sesuai dapat menjalankan program apa pun.

Berdasarkan jumlah unit komputasi dan frekuensinya, Anda dapat membandingkan kinerja matematis berbagai kartu video. Sebagian besar game sekarang dibatasi oleh kinerja pixel shader, jadi jumlah blok ini sangat penting. Misalnya, jika satu model kartu video didasarkan pada GPU dengan 384 prosesor komputasi dalam komposisinya, dan model lain dari lini yang sama memiliki GPU dengan 192 unit komputasi, maka pada frekuensi yang sama model kedua akan dua kali lebih lambat dalam memproses apa pun. jenis shader, dan secara umum akan sama lebih produktif.

Meskipun tidak mungkin untuk menarik kesimpulan yang jelas tentang kinerja hanya berdasarkan jumlah unit komputasi saja, frekuensi clock dan arsitektur unit yang berbeda dari generasi dan produsen chip yang berbeda perlu diperhitungkan. Hanya berdasarkan angka-angka ini, Anda hanya dapat membandingkan chip dalam lini yang sama dari pabrikan yang sama: AMD atau NVIDIA. Dalam kasus lain, Anda perlu memperhatikan tes kinerja pada game atau aplikasi yang Anda minati.

Unit Tekstur (TMU)

Unit GPU ini bekerja bersama dengan prosesor komputasi; mereka memilih dan memfilter tekstur dan data lain yang diperlukan untuk konstruksi pemandangan dan penghitungan tujuan umum. Jumlah unit tekstur dalam chip video menentukan kinerja tekstur—yaitu, kecepatan mengambil texel dari tekstur.

Meskipun akhir-akhir ini lebih banyak penekanan diberikan pada perhitungan matematis, dan beberapa tekstur digantikan oleh tekstur prosedural, beban pada blok TMU masih cukup tinggi, karena selain tekstur utama, pemilihan juga harus dilakukan dari peta normal dan peta perpindahan, serta buffer rendering target render di luar layar.

Mempertimbangkan penekanan pada banyak permainan, termasuk kinerja unit tekstur, kita dapat mengatakan bahwa jumlah unit TMU dan kinerja tekstur tinggi yang sesuai juga merupakan salah satu parameter terpenting untuk chip video. Parameter ini memiliki dampak khusus pada kecepatan rendering gambar saat menggunakan pemfilteran anisotropik, yang memerlukan sampel tekstur tambahan, serta dengan algoritme bayangan lembut yang kompleks dan algoritme bermodel baru seperti Screen Space Ambient Occlusion.

Unit Operasi Rasterisasi (ROP)

Unit rasterisasi melakukan operasi penulisan piksel yang dihitung oleh kartu video ke dalam buffer dan operasi pencampurannya (blending). Seperti yang kami sebutkan di atas, kinerja blok ROP memengaruhi kecepatan pengisian dan ini adalah salah satu karakteristik utama kartu video sepanjang masa. Dan meskipun kepentingannya juga agak menurun akhir-akhir ini, masih ada kasus di mana kinerja aplikasi bergantung pada kecepatan dan jumlah blok ROP. Paling sering hal ini disebabkan oleh penggunaan aktif filter pasca-pemrosesan dan anti-aliasing yang diaktifkan pada pengaturan game tinggi.

Mari kita perhatikan sekali lagi bahwa chip video modern tidak dapat dinilai hanya berdasarkan jumlah blok yang berbeda dan frekuensinya. Setiap seri GPU menggunakan arsitektur baru, yang unit eksekusinya sangat berbeda dari yang lama, dan rasio jumlah unit yang berbeda mungkin berbeda. Dengan demikian, unit AMD ROP di beberapa solusi dapat melakukan lebih banyak pekerjaan per siklus jam dibandingkan unit di solusi NVIDIA, dan sebaliknya. Hal yang sama berlaku untuk kemampuan unit tekstur TMU - mereka berbeda pada generasi GPU yang berbeda dari produsen yang berbeda, dan ini harus diperhitungkan saat membandingkan.

Blok geometris

Sampai saat ini, jumlah unit pemrosesan geometri tidak terlalu penting. Satu blok pada GPU sudah cukup untuk sebagian besar tugas, karena geometri dalam game cukup sederhana dan fokus utama kinerjanya adalah perhitungan matematis. Pentingnya pemrosesan geometri paralel dan jumlah blok terkait meningkat secara dramatis dengan munculnya dukungan tesselasi geometri di DirectX 11. NVIDIA adalah yang pertama memparalelkan pemrosesan data geometris ketika beberapa blok terkait muncul di chip keluarga GF1xx-nya. Kemudian, AMD merilis solusi serupa (hanya pada solusi teratas di jajaran Radeon HD 6700 berdasarkan chip Cayman).

Dalam materi ini kami tidak akan membahas detailnya; materi tersebut dapat dibaca di materi dasar di situs web kami yang didedikasikan untuk kompatibel dengan DirectX 11 GPU. Yang penting bagi kami di sini adalah jumlah unit pemrosesan geometri berdampak besar pada performa keseluruhan di game terbaru yang menggunakan tessellation, seperti Metro 2033, HAWX 2, dan Crysis 2 (dengan patch terbaru). Dan ketika memilih kartu video gaming modern, sangat penting untuk memperhatikan kinerja geometris.

Ukuran memori video

Memori sendiri digunakan oleh chip video untuk menyimpan data yang diperlukan: tekstur, simpul, data buffer, dll. Tampaknya semakin banyak, semakin baik. Tapi itu tidak sesederhana itu; memperkirakan kekuatan kartu video berdasarkan jumlah memori video adalah kesalahan paling umum! Pengguna yang tidak berpengalaman sering kali melebih-lebihkan nilai memori video, dan masih menggunakannya untuk membandingkan berbagai model kartu video. Hal ini dapat dimengerti - parameter ini adalah salah satu yang pertama ditunjukkan dalam daftar karakteristik sistem yang sudah jadi, dan juga ditulis dalam huruf besar pada kotak kartu video. Oleh karena itu, bagi pembeli yang tidak berpengalaman, karena memorinya dua kali lebih besar, maka kecepatan solusi semacam itu harusnya dua kali lebih tinggi. Kenyataannya berbeda dengan mitos ini karena memori hadir dalam tipe dan karakteristik yang berbeda, dan pertumbuhan produktivitas hanya tumbuh hingga volume tertentu, dan setelah mencapainya, pertumbuhan tersebut berhenti begitu saja.

Jadi, di setiap game dan dengan pengaturan serta adegan game tertentu, terdapat sejumlah memori video yang cukup untuk semua data. Dan bahkan jika Anda menempatkan memori video 4 GB di sana, tidak ada alasan untuk mempercepat rendering, kecepatannya akan dibatasi oleh unit eksekusi yang dibahas di atas, dan memori hanya akan cukup. Inilah sebabnya, dalam banyak kasus, kartu video dengan memori video 1,5 GB berjalan pada kecepatan yang sama dengan kartu dengan 3 GB (ceteris paribus).

Ada situasi di mana lebih banyak memori menyebabkan peningkatan kinerja yang nyata - ini adalah game yang sangat menuntut, terutama pada resolusi sangat tinggi dan pengaturan kualitas maksimum. Namun kasus seperti itu tidak selalu terjadi dan jumlah memori harus diperhitungkan, jangan lupa bahwa kinerja tidak akan meningkat di atas jumlah tertentu. Chip memori juga memiliki parameter yang lebih penting, seperti lebar bus memori dan frekuensi pengoperasiannya. Topik ini sangat luas sehingga kami akan membahas lebih detail tentang pilihan jumlah memori video di bagian keenam materi kami.

Lebar bus memori

Lebar bus memori adalah karakteristik yang paling penting, mempengaruhi bandwidth memori (MBB). Lebar yang lebih besar memungkinkan lebih banyak informasi ditransfer dari memori video ke GPU dan sebaliknya per unit waktu, yang dalam banyak kasus memiliki efek positif pada kinerja. Secara teoritis, bus 256-bit dapat mentransfer data dua kali lebih banyak per siklus clock dibandingkan bus 128-bit. Dalam praktiknya, perbedaan kecepatan rendering, meskipun tidak mencapai dua kali lipat, dalam banyak kasus sangat dekat dengan ini dengan penekanan pada bandwidth memori video.

Kartu video game modern menggunakan lebar bus yang berbeda: dari 64 hingga 384 bit (sebelumnya ada chip dengan bus 512-bit), tergantung pada kisaran harga dan waktu rilis model tertentu GPU Untuk kartu video kelas bawah termurah, 64 atau lebih jarang 128 bit paling sering digunakan, untuk tingkat menengah dari 128 hingga 256 bit, dan kartu video dari kisaran harga atas menggunakan bus dengan lebar 256 hingga 384 bit. Lebar bus tidak dapat lagi bertambah hanya karena keterbatasan fisik - ukuran die GPU tidak cukup untuk menampung lebih dari bus 512-bit, dan ini terlalu mahal. Oleh karena itu, bandwidth memori kini ditingkatkan dengan menggunakan jenis memori baru (lihat di bawah).

Frekuensi memori video

Parameter lain yang mempengaruhi bandwidth memori adalah frekuensi clocknya. Dan peningkatan bandwidth seringkali secara langsung mempengaruhi kinerja kartu video dalam aplikasi 3D. Frekuensi bus memori pada kartu video modern berkisar dari 533 (1066, dengan memperhitungkan penggandaan) MHz hingga 1375 (5500, dengan memperhitungkan empat kali lipat) MHz, artinya, dapat berbeda lebih dari lima kali lipat! Dan karena bandwidth bergantung pada frekuensi memori dan lebar busnya, memori dengan bus 256-bit yang beroperasi pada frekuensi 800 (3200) MHz akan memiliki bandwidth yang lebih besar dibandingkan memori yang beroperasi pada 1000 (4000) MHz dengan frekuensi 128. -sedikit bis.

Perhatian khusus pada parameter lebar bus memori, jenisnya, dan frekuensi pengoperasiannya harus diberikan saat membeli kartu video yang relatif murah, banyak di antaranya hanya memiliki antarmuka 128-bit atau bahkan 64-bit, yang berdampak sangat negatif pada kinerjanya. . Secara umum, kami tidak menyarankan pembelian kartu video menggunakan bus memori video 64-bit untuk PC gaming. Dianjurkan untuk memberikan preferensi pada setidaknya tingkat menengah dengan setidaknya bus 128 atau 192-bit.

Jenis memori

Kartu video modern dilengkapi dengan beberapa jenis memori berbeda. Anda tidak akan menemukan memori SDR kecepatan tunggal lama di mana pun lagi, tetapi jenis memori DDR dan GDDR modern memiliki karakteristik yang sangat berbeda. Berbagai jenis DDR dan GDDR memungkinkan Anda mentransfer data dua atau empat kali lebih banyak pada frekuensi clock yang sama per satuan waktu, dan oleh karena itu angka frekuensi pengoperasian sering kali dua atau empat kali lipat, dikalikan 2 atau 4. Jadi, jika frekuensi 1400 MHz ditentukan untuk memori DDR , maka memori ini beroperasi pada frekuensi fisik 700 MHz, tetapi memori tersebut menunjukkan apa yang disebut frekuensi "efektif", yaitu frekuensi di mana memori SDR harus beroperasi untuk menyediakan bandwidth yang sama. Hal yang sama terjadi pada GDDR5, tetapi frekuensinya bahkan empat kali lipat.

Keuntungan utama dari jenis memori baru adalah kemampuannya untuk beroperasi pada kecepatan clock yang lebih tinggi, dan karenanya meningkatkan bandwidth dibandingkan teknologi sebelumnya. Hal ini dicapai melalui peningkatan latensi, yang, bagaimanapun, tidak begitu penting untuk kartu video. Papan pertama yang menggunakan memori DDR2 adalah NVIDIA GeForce FX 5800 Ultra. Sejak itu, teknologi memori grafis telah mengalami kemajuan yang signifikan, dan standar GDDR3 dikembangkan, yang mendekati spesifikasi DDR2, dengan beberapa perubahan khusus untuk kartu video.

GDDR3 adalah memori yang dirancang khusus untuk kartu video, dengan teknologi yang sama seperti DDR2, tetapi dengan karakteristik konsumsi dan pembuangan panas yang lebih baik, yang memungkinkan terciptanya chip yang beroperasi pada kecepatan clock lebih tinggi. Terlepas dari kenyataan bahwa standar tersebut dikembangkan oleh ATI, kartu video pertama yang menggunakannya adalah modifikasi kedua dari NVIDIA GeForce FX 5700 Ultra, dan yang berikutnya adalah GeForce 6800 Ultra.

GDDR4 merupakan pengembangan lebih lanjut dari memori “grafis”, yang berjalan hampir dua kali lebih cepat dari GDDR3. Perbedaan utama antara GDDR4 dan GDDR3, yang penting bagi pengguna, sekali lagi adalah peningkatan frekuensi pengoperasian dan pengurangan konsumsi daya. Secara teknis, memori GDDR4 tidak jauh berbeda dengan GDDR3; ini merupakan pengembangan lebih lanjut dari ide yang sama. Kartu video pertama dengan chip GDDR4 adalah ATI Radeon X1950 XTX, dan NVIDIA sama sekali tidak merilis produk berdasarkan jenis memori ini. Keuntungan chip memori baru dibandingkan GDDR3 adalah konsumsi daya modul bisa sekitar sepertiga lebih rendah. Hal ini dicapai melalui peringkat tegangan yang lebih rendah untuk GDDR4.

Namun, GDDR4 tidak banyak digunakan bahkan dalam solusi AMD. Dimulai dengan keluarga GPU RV7x0, pengontrol memori kartu video mendukung memori GDDR5 jenis baru yang beroperasi pada frekuensi empat kali lipat efektif hingga 5,5 GHz dan lebih tinggi (secara teoritis, frekuensi hingga 7 GHz dimungkinkan), yang memberikan throughput hingga hingga 176 GB/s menggunakan antarmuka 256-bit. Jika untuk meningkatkan bandwidth memori GDDR3/GDDR4 perlu menggunakan bus 512-bit, maka transisi ke penggunaan GDDR5 memungkinkan peningkatan kinerja dua kali lipat pada ukuran yang lebih kecil kristal dan konsumsi energi lebih sedikit.

Jenis memori video paling modern adalah GDDR3 dan GDDR5; keduanya berbeda dari DDR dalam beberapa detail dan juga berfungsi dengan transfer data ganda/empat kali lipat. Jenis memori ini menggunakan beberapa teknologi khusus untuk meningkatkan frekuensi pengoperasian. Jadi, memori GDDR2 biasanya beroperasi pada frekuensi yang lebih tinggi dibandingkan DDR, GDDR3 pada frekuensi yang lebih tinggi, dan GDDR5 menyediakan frekuensi dan bandwidth maksimum saat ini. Tapi terus model murah Mereka masih memasang memori DDR3 "non-grafis" dengan frekuensi yang jauh lebih rendah, jadi Anda harus memilih kartu video dengan lebih hati-hati.