Utilitas untuk kartu radeon 7800. Keluarga kartu video AMD Radeon Informasi referensi

AMD secara resmi telah meluncurkan seri kartu video baru berdasarkan mikroarsitektur GCN 28nm – AMD Radeon HD 7800. Saat ini, ini mencakup dua model: dan. Produk baru ini didasarkan pada prosesor grafis AMD “Pitcairn Pro” dan AMD “Pitcairn XT”, yang beroperasi pada frekuensi clock masing-masing 860 MHz dan 1000 MHz. Dengan demikian, kartu video tersebut akan menjadi yang kedua di jajaran perusahaan (setelah AMD Radeon HD 7770) dengan nama “Ghz Edition”.

Solusi tersebut dilengkapi dengan 16 unit komputasi, 1024 stream processor, 64 unit tekstur, dan 32 unit ROP. Subsistem video produk baru ini terdiri dari chip GDDR5 256-bit dengan total kapasitas 2 GB. Frekuensi clock nominalnya adalah 1200 MHz, dan frekuensi clock efektifnya adalah 4800 MHz.

Antarmuka eksternal model ini mencakup empat port: DVI, HDMI, dan dua miniDisplayPort.

Adaptor grafis memiliki struktur yang lebih baik, yang meliputi: 20 unit komputasi, 1280 stream processor, 80 tekstur, dan 32 unit ROP. Subsistem video produk baru ini, serta rangkaian antarmuka eksternalnya, identik dengan modelnya.

Penjualan massal solusi akan dimulai pada 19 Maret. Harga eceran yang disarankan untuk produk baru ini masing-masing adalah $249 dan $349. Tabel perbandingan spesifikasi teknis kartu video baru dalam seri ini AMD Radeon HD 7800 memiliki bentuk berikut:

Standar proses produksi, nm

Mikroarsitektur

GPU

AMD "Pitcairn Pro"

AMD "Pitcairn XT"

Frekuensi jam, MHz

Jumlah unit komputasi

Jumlah pemroses aliran

Jumlah blok tekstur

Jumlah blok ROP

Memori video

Volume, GB

Frekuensi jam nominal, MHz

Frekuensi jam efektif, MHz

Lebar bus, bit

Antarmuka dalam

PCI Ekspres 3.0x16

Antarmuka eksternal

1xDVI
1xHDMI
2 x miniDisplayPort

Perkiraan harga, $

Instruksi dan teknologi yang didukung

DirectX 11.1, DirectCompute 11, OpenGL 4.2, OpenCL 1.2, AMD Eyefinity, AMD CrossFireX, AMD HD3D, AMD PowerPlay, AMD PowerTune, AMD Eyespeed, AMD ZeroCore

Halaman 2 dari 5

"Pulau Selatan"

Pertama, sedikit tentang pelabelan AMD pada produk terbarunya. Pabrikan telah membaginya menjadi tiga level sesuai dengan kinerjanya. Nama kode "Cape Verde" mengacu pada Radeon HD 7700. Nama "Pitcairn" menyembunyikan peserta tes hari ini Radeon HD 7870 dan HD 7850. Produk berperforma tinggi disebut "Tahiti" atau Radeon HD 7900. Hal ini ditunjukkan lebih jelas di bawah.

  • Level awal = Tanjung Verde = seri Radeon HD 7700;
  • Arus Utama = Pitcairn = seri Radeon HD 7800;
  • Produk Berkinerja Tinggi = Tahiti = Seri Radeon HD 7900.

Artinya, saat ini AMD telah menjangkau seluruh segmen pasar dengan chip grafis 28 nm miliknya. Hanya diharapkan rilis kartu video dual-core berdasarkan chip Tahiti. Nama awal Radeon HD 7990.

Fitur seri AMD Radeon HD 7800

Prosesor grafis Radeon HD 7800 (Pitcairn) memiliki sekitar 2,8 miliar transistor dan mikroarsitektur Graphic Core Next. Seperti disebutkan di atas, chip Radeon HD 7850 (Pitcairn Pro) memiliki 16 unit komputasi, dan TDP maksimumnya adalah 130 watt. Untuk Radeon HD 7870 (Pitcairn XT), angkanya masing-masing adalah 20 dan 175.

Slide di bawah ini menunjukkan spesifikasi utama kartu video Radeon HD 7850 dan HD 7870

Memori GDDR5 sebesar 2 GB sudah menjadi standar untuk sebagian besar model kelas menengah dan atas. Berkat 256-bit. bus dan frekuensi clock tinggi 1200 MHz (efektif 4800 MHz), bandwidth 154 GB/s. Hal ini akan berdampak positif pada performa pada game dengan resolusi dan kualitas gambar yang tinggi.

Antarmuka PCI Express 3

Pada paruh kedua tahun 2011, hampir semua produsen motherboard memperkenalkan model motherboard mereka dengan antarmuka PCI Express generasi ke-3. Dengan dirilisnya seri Radeon HD 7000, kartu video dengan antarmuka ini juga muncul. PCI Express 3 memiliki bandwidth dua kali lipat (32 Gb/s) dibandingkan PCI Express generasi sebelumnya. Dibandingkan dengan PCIe 2, bandwidth per jalur telah ditingkatkan dua kali lipat dari 500 MB/s menjadi 1 GB/s.

Tentu saja, untuk memanfaatkan PCIe 3 baru, Anda tidak hanya memerlukan kartu video dan motherboard dengan antarmuka ini, tetapi juga dukungan prosesor (tidak semua model dari keluarga Ivy Bridge akan mendukung PCIe 3).

Keterbatasan Mata 2.0

AMD telah melangkah lebih jauh dalam mengembangkan teknologi Eyefinity, yang dirancang untuk menampilkan gambar di beberapa monitor. Berkat kekuatan pemrosesan yang tinggi dari seri HD 7000 dan dukungan Eyefinity 2.0, kini dimungkinkan untuk menampilkan gambar di beberapa monitor dengan resolusi total 16000 x 16000. Hal ini memungkinkan Anda menampilkan gambar pada 5 layar dengan resolusi 2560x1600 dipasang dalam orientasi lanskap. Untuk bekerja dengan resolusi seperti itu, model lama dari keluarga ini dilengkapi dengan rekor GDDR5 3 GB (HD 7970 dan HD 7950).

Driver AMD Catalyst akan mendukung resolusi khusus mulai rilis bulan Februari. Artinya, Anda dapat mengatur resolusi yang diperlukan tergantung pada konfigurasi tampilan di Eyefinity. Pada Catalyst 12.2, terdapat opsi untuk menginstal menu Start pada tampilan yang paling nyaman bagi Anda, dan bukan di paling kiri, seperti sebelumnya. Selain itu, Eyefinity 2 mendukung output gambar dalam mode stereo HD3D. Kombinasi tiga monitor yang beroperasi dalam mode 3D didukung.

Tesselasi yang ditingkatkan

Keluarga kartu grafis AMD Radeon HD 7000 dilengkapi tessellator generasi kesembilan dan telah memperoleh peningkatan kinerja yang signifikan saat memproses geometri di game modern. Inti GCN masih mencakup dua Mesin Grafis, namun yang dulunya berisi unit tesselasi dan rasterisasi, kini terdiri dari sejumlah pipeline yang didedikasikan untuk pemrosesan geometri dan piksel.

Kartu video AMD Radeon HD 7800 mendukung antarmuka HDMI 1.4a, yang memungkinkan Anda mengeluarkan gambar 120 Hz (60 Hz per mata), yang memungkinkan Anda menampilkan gambar 3D. Dengan versi HDMI sebelumnya, hal ini tidak mungkin dilakukan. Mulai bulan Desember, AMD mengaktifkan kemampuan HD3D dan Eyefinity untuk bekerja sama di driver.

DirectX 11.1

Kartu video keluarga Radeon 7000 akan mendukung DirectX 11.1 masa depan. Masih terlalu dini untuk mengatakan apa yang akan terjadi dalam praktiknya, karena DX 11.1 akan dirilis bersamaan dengan Windows 8. Keuntungan utama dari API baru ini diuraikan sebagai berikut:

  • rasterisasi independen;
  • Kombinasi fleksibel antara komputasi grafis dan pemrosesan video;
  • Dukungan Stereo 3D asli.

Dekoder Video Terpadu AMD

Ini adalah bagian perangkat keras GPU AMD yang bertanggung jawab untuk memecahkan kode aliran video. UVF telah menerima beberapa perbaikan pada seri Radeon 7000. Secara umum UVD tetap mempertahankan seluruh fungsi pendahulunya yaitu dukungan H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV profile D, Multi-View Codec (MVC), Video Codec Engine (VCE), AMD Stabil Video 2.0. Menambahkan dukungan untuk format Dual Stream HD+HD.

AMD Radeon HD 7850M- Kartu video yang mendukung DirectX 11, berdasarkan arsitektur GCN. Kartu ini dirancang untuk laptop menengah dan besar. Ini adalah salah satu kartu video paling produktif tahun 2012. Itu diproduksi menggunakan teknologi proses 28 nm.

Adaptor seri Radeon 7800M juga dibuat pada chip Cape Verde RadeonHD 7770 untuk komputer desktop, dengan 640 inti shader 1D dan 40 unit tekstur. Namun dalam hal frekuensi clock, HD 7850M lebih rendah daripada kartu HD 7870M (masing-masing 675 MHz hingga 800 MHz). Secara keseluruhan, 7850M setara dalam hal kinerja HD 7750 untuk desktop.

Seperti yang diharapkan, Radeon HD 7850M telah menjadi pesaing GeForce GTX 560M dari NVIDIA, karena selain performa yang lebih tinggi, juga menunjukkan tingkat konsumsi daya yang lebih rendah (sama dengan GeForce GTX 660M). Oleh karena itu, game modern yang menuntut berjalan dengan lancar pada pengaturan sedang dan tinggi.

Fitur khusus dari 7850M adalah hadirnya decoder video UVD3 baru untuk decoding MPEG-4 AVC/H.264, VC-1, MPEG-2, Flash, Multi-View Codec (MVC) dan MPEG-4 part 2 ( DivX, xVid) format video HD.

Kartu seri 7800M juga mendukung teknologi peralihan otomatis antara grafis terintegrasi dan diskrit. Fitur ini disebut Enduro, mirip dengan teknologi Optimus NVIDIA. Selain itu, HD 7850M dapat mendukung hingga 6 monitor secara bersamaan menggunakan teknologi Eyefinity ketika Enduro dinonaktifkan.

Fitur berikutnya HD 7850M adalah fungsi ZeroCore, yang secara otomatis mengurangi konsumsi daya dalam mode tidur dengan layar dimatikan. Teknologi PowerTune memungkinkan kartu video melakukan overclock selama konsumsi daya masih dalam batas yang dapat diterima. Misalnya, frekuensinya mungkin berkurang saat menjalankan FurMark dan OCCT, dan meningkat di beberapa game (Planet, Crysis, atau Resident Evil 5).

Prosesor audio HD internal mampu mentransmisikan audio berkualitas tinggi (format TrueHD atau DTS Master Audio) menggunakan HDMI dan DisplayPort (misalnya, video Blu-ray). Selain itu, dengan menggunakan teknologi DDMA, dimungkinkan untuk mengeluarkan suara dari beberapa perangkat secara bersamaan.

Tingkat konsumsi daya 7850M jauh lebih rendah dari 7870M karena jam inti yang lebih rendah.

Pabrikan: AMD
Seri: RadeonHD 7800M
Kode: Heathrow Pro
Arsitektur: GCN
Aliran: 640 - bersatu
Frekuensi jam: 675*MHz
Frekuensi bayangan: 675*MHz
Frekuensi memori: 1000*MHz
Lebar bus memori: 128 sedikit
Jenis memori: GDDR5
Memori umum: TIDAK
LangsungX: DirectX 11.1, Shader 5.1
Konsumsi energi: 32 watt
Teknologi: 28nm
Ukuran laptop: besar
Tanggal rilis: 24.04.2012

*Kecepatan jam yang ditunjukkan dapat berubah oleh pabrikan.

  • Nama kode chip: "Tahiti"
  • 4,3 miliar transistor (lebih dari 60% lebih banyak dari Cayman dan dua kali lebih banyak dari Cypress)
  • Bus memori 384-bit: enam pengontrol lebar 64-bit yang mendukung memori GDDR5
  • Jam inti: hingga 925 MHz (untuk Radeon HD 7970)
  • 32 unit komputasi GCN, termasuk 128 inti SIMD, yang terdiri dari total 2048 ALU floating point (format integer dan floating point, dukungan untuk presisi FP32 dan FP64 dalam standar IEEE 754)
  • 128 unit tekstur, dengan dukungan pemfilteran trilinear dan anisotropik untuk semua format tekstur
  • 32 unit ROP dengan dukungan mode anti-aliasing dengan pengambilan sampel yang dapat diprogram lebih dari 16 sampel per piksel, termasuk dengan format buffer bingkai FP16 atau FP32. Performa puncak hingga 32 sampel per jam, dan dalam mode Z saja - 128 sampel per jam
  • Dukungan terintegrasi untuk enam monitor, termasuk HDMI 1.4a dan DisplayPort 1.2

Spesifikasi kartu grafis Radeon HD 7970

  • Frekuensi inti: 925 MHz
  • Jumlah prosesor universal: 2048
  • Jumlah blok tekstur: 128, blok pencampuran: 32
  • Frekuensi memori efektif: 5500 MHz (4x1375 MHz)
  • Jenis memori: GDDR5
  • Kapasitas memori: 3 gigabyte
  • Bandwidth memori: 264 gigabyte per detik.
  • Laju pengisian maksimum teoritis: 29,6 gigapiksel per detik.
  • Kecepatan pengambilan sampel tekstur teoretis: 118,4 gigatexel per detik.
  • Dua konektor CrossFire
  • bus PCI Express 3.0
  • Konsumsi daya: dari 3 hingga 250 W
  • Satu konektor daya 8-pin dan satu konektor daya 6-pin
  • Desain slot ganda
  • Harga yang disarankan untuk pasar AS: $549

Spesifikasi kartu grafis Radeon HD 7950

  • Frekuensi inti: 800 MHz
  • Jumlah prosesor universal: 1792
  • Jumlah blok tekstur: 112, blok pencampuran: 32
  • Frekuensi memori efektif: 5000 MHz (4x1250 MHz)
  • Jenis memori: GDDR5
  • Kapasitas memori: 3 gigabyte
  • Bandwidth memori: 240 gigabyte per detik.
  • Laju pengisian maksimum teoritis: 25,6 gigapiksel per detik.
  • Kecepatan pengambilan sampel tekstur teoretis: 89,6 gigatexel per detik.
  • Dua konektor CrossFire
  • bus PCI Express 3.0
  • Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
  • Konsumsi daya: dari 3 hingga 200 W
  • Desain slot ganda
  • MSRP AS: $449

Kompleksitas tinggi dari chip baru ini patut diperhatikan - 4,3 miliar transistor, lebih dari setengah jumlah transistor pada prosesor grafis kelas atas sebelumnya. Kemampuan untuk membuat kristal kompleks seperti itu dimungkinkan melalui penggunaan teknologi proses modern 28 nanometer, dan chip baru ini bahkan memiliki luas yang sedikit lebih kecil daripada Cayman. Dan karakteristik praktisnya yang memengaruhi kinerja telah ditingkatkan secara nyata: jumlah ALU, TMU, dan bus memori. Hanya jumlah blok ROP yang tidak bertambah, dan frekuensi memori video GDDR5 tetap pada level yang sama.

Prinsip penamaan kartu video perusahaan tetap sama. Radeon HD 7970 adalah solusi chip tunggal paling produktif dari perusahaan, setelah beberapa waktu, model junior HD 7950 dirilis, diumumkan beberapa saat kemudian. Awalnya, HD 7970 tidak memiliki pesaing di pasar dan tidak menggantikan kartu video tertentu dari lini AMD, melainkan menurunkannya. Sebagai perbandingan dengan pesaingnya, NVIDIA merilis solusi 28 nanometernya jauh kemudian.

Kartu video AMD baru dilengkapi dengan memori GDDR5 yang sama, tetapi volumenya, bukannya 2 gigabyte pada generasi sebelumnya, telah meningkat menjadi 3 gigabyte. Hal ini terjadi karena perluasan bus memori dari 256-bit menjadi 384-bit. Dan sekarang Anda dapat memasang 1,5 GB atau 3 GB di papan baru. Tentu saja, dari sudut pandang pemasaran, memasang volume yang lebih kecil jelas merupakan kerugian, jadi keputusan dibuat untuk memasang 3 GB, meskipun saat ini hal ini agak berlebihan. Hanya dalam resolusi ultra-tinggi dan dengan MSAA 16x 1,5-2 GB tidak cukup. Namun, AMD juga memiliki Eyefinity, dan untuk game di tiga monitor atau lebih, buffer layar akan memakan volume yang sangat besar.

Jadi, mari kita lihat Radeon HD 7970. Kartu video baru di kisaran harga atas memiliki sistem pendingin dua slot, ditutupi dengan casing plastik yang akrab dengan semua papan AMD modern di sepanjang kartu. Hanya desain casing ini yang sedikit berubah, meski bagian belakangnya masih melampaui papan sirkuit cetak. Namun desain strip dengan pin diubah - untuk meningkatkan pendinginan kartu video, salah satu dari dua slot (setengah strip) ditempati secara eksklusif oleh lubang ventilasi untuk pembuangan panas.

Namun pengguna tidak akan mengalami penurunan jumlah konektor DVI yang disolder langsung ke papan. Untuk kenyamanannya, adaptor HDMI-DVI khusus akan disertakan dalam paket, yang memungkinkan Anda menyambungkan dua monitor dengan konektor DVI. Omong-omong, konsumsi daya kartu baru ini tidak lebih rendah dari Radeon HD 6970, sehingga harus dilengkapi dengan satu set konektor daya 8-pin dan satu konektor daya 6-pin.

Namun pada Radeon HD 7970 baru, sistem pendinginnya berubah menjadi lebih baik. Ruang evaporasi generasi baru dan pendingin baru yang lebih besar digunakan, dengan bilah yang dibentuk ulang dan peningkatan kinerja (aliran udara lebih banyak disediakan). Hasilnya adalah peningkatan efisiensi pendingin sekaligus mengurangi kebisingan.

Sakelar firmware Dual BIOS, yang kami tulis dalam deskripsi Radeon HD 6900, juga tidak hilang dari papan. Singkatnya: kartu video memiliki dua versi BIOS, satu dengan kemampuan untuk mem-flash firmware secara khusus, dan yang lainnya kedua dengan firmware yang di-hardcode di pabrik. Baik pengguna maupun AMD sendiri sangat menyukai solusi praktis ini sehingga memutuskan untuk terus mengemasnya dengan solusi kelas atas.

Kami hanya dapat menyambut solusi ini, yang sangat membantu dalam berbagai kasus terkait masalah tak terduga selama flashing (misalnya pemadaman listrik selama proses), dan memungkinkan Anda melakukan berbagai eksperimen tanpa rasa takut dengan image BIOS. Tidak mengherankan jika AMD berulang kali mengisyaratkan kemampuan overclocking yang luar biasa dari kartu video barunya:

Seperti yang Anda lihat, overclocking ke frekuensi 1 GHz dan lebih tinggi secara praktis dijanjikan, jika Anda tidak memperhitungkan tulisan kecil (yang tidak disertakan dalam tangkapan layar) bahwa garansi tidak lagi berlaku meskipun kartu video gagal sebagai hasil percobaan menaikkan frekuensi dari pengaturan driver video.

Fitur arsitektur Radeon HD 7970

Untuk mengapresiasi relevansi modifikasi arsitektur di Southern Islands, pertama-tama kita melihat perkembangan GPU selama beberapa tahun terakhir yang diwakili oleh AMD. Hingga tahun 2002, chip grafis adalah perangkat keras khusus yang mampu melakukan komputasi grafis secara eksklusif. Chip video pada masa itu memiliki fungsionalitas terbatas; mereka hanya dapat menerapkan dan memfilter tekstur, memproses geometri, dan melakukan rasterisasi primitif dan oleh karena itu sama sekali tidak cocok untuk tugas komputasi universal.

Selama beberapa tahun berikutnya, kemampuan program dasar ditambahkan ke GPU, tetapi juga berfokus secara eksklusif pada tugas-tugas grafis. Ini adalah masa dukungan untuk DirectX 8 dan 9, program shader fungsi terbatas dengan kemampuan menghitung dengan floating point. Chip video pada masa itu memiliki unit ALU khusus untuk pemrosesan titik dan piksel, serta cache khusus untuk piksel, tekstur, dan data lainnya. Fleksibilitas masih belum mendekati.

Baru pada tahun 2007 AMD memperoleh arsitektur shader DirectX 10 terpadu, serta kemampuan untuk memprogram GPU menggunakan alat khusus: CAL, Brook, ATI Stream. GPU pada masa itu sudah memiliki caching tingkat lanjut dan dukungan untuk data bersama lokal dan global. Secara arsitektural, chip tersebut didasarkan pada blok VLIW5 dan VLIW4, cukup fleksibel untuk beberapa perhitungan dasar non-grafis, namun tetap fokus pada algoritma grafis.

Sekarang saatnya untuk arsitektur baru yang lebih cocok untuk komputasi tujuan umum - Inti Grafis Berikutnya (GCN). Ini adalah era arsitektur baru bagi AMD, itulah sebabnya nama tersebut dipilih. GPU baru ini menawarkan kemampuan dan kinerja pemrosesan grafis yang luar biasa, namun perubahan arsitektur yang dilakukan terutama ditujukan untuk meningkatkan posisi dalam komputasi non-grafis - meningkatkan kinerja dan efisiensi dalam tugas-tugas kompleks untuk keperluan umum. Desain GPU baru ditujukan untuk apa yang disebut komputasi heterogen - campuran grafis dan komputasi tujuan umum dalam lingkungan multitasking. Arsitektur GCN menjadi lebih fleksibel dan seharusnya lebih cocok untuk pelaksanaan berbagai tugas yang hemat energi.

Blok dasar dalam arsitektur baru adalah blok GCN. Pada “blok bangunan” inilah semua prosesor grafis seri Kepulauan Selatan yang baru didasarkan. Arsitektur chip grafis AMD yang pertama kali menggunakan desain non-VLIW, menggunakan unit vektor dan skalar, dan salah satu perubahan terpenting adalah setiap unit komputasi GCN memiliki penjadwalnya sendiri dan dapat menjalankan instruksi dari berbagai program. (inti).

Arsitektur komputasi baru dirancang untuk efisiensi tinggi dalam memuat unit komputasi dalam lingkungan multitasking. Unit komputasi GCN dibagi menjadi empat subbagian, yang masing-masing bekerja pada aliran instruksinya sendiri setiap siklus clock. Thread juga dapat menggunakan blok skalar yang disediakan oleh GCN untuk kontrol aliran atau operasi penunjuk. Kombinasi blok vektor dan skalar menawarkan model pemrograman yang sangat sederhana. Misalnya, penunjuk fungsi dan penunjuk tumpukan jauh lebih mudah untuk diprogram, dan tugas kompiler kini disederhanakan secara signifikan, karena unit eksekusinya adalah skalar.

Setiap blok GCN memiliki 64 KB penyimpanan data lokal khusus untuk pertukaran data atau perluasan tumpukan register lokal. Blok ini juga mencakup cache tingkat pertama dengan kemampuan membaca dan menulis, dan pipeline tekstur lengkap (unit pengambilan sampel dan pemfilteran). Oleh karena itu, unit komputasi baru dapat bekerja secara mandiri, tanpa penjadwal pusat, yang pada arsitektur sebelumnya bertanggung jawab untuk mendistribusikan pekerjaan antar unit. Kini masing-masing blok GCN mampu menjadwalkan dan mendistribusikan perintah sendiri; satu blok komputasi dapat mengeksekusi hingga 32 aliran perintah berbeda, yang dapat berasal dari ruang alamat virtual berbeda di memori dan sepenuhnya terlindungi serta independen satu sama lain.

Arsitektur GPU AMD sebelumnya menggunakan model arsitektur VLIW4 dan VLIW5, dan meskipun cukup baik untuk tugas grafis, namun tidak cukup efisien untuk komputasi tujuan umum, karena sangat sulit untuk memuat semua unit eksekusi dengan pekerjaan dalam kondisi seperti itu. Arsitektur GCN baru menawarkan jumlah unit eksekusi yang sama besarnya, namun dengan eksekusi skalar yang menghilangkan batasan dan ketergantungan register dan instruksi. Transisi dari arsitektur VLIW ke eksekusi skalar memberikan penyederhanaan nyata dalam tugas pengoptimalan kode.

Saat menjalankan instruksi pada arsitektur VLIW4 sebelumnya, kompiler harus menangani konflik register, melakukan distribusi instruksi yang kompleks ke unit eksekusi pada tahap kompilasi kode, dll. Pada saat yang sama, mencapai kinerja tinggi seringkali memerlukan optimasi yang tidak sepele, yang mana cocok untuk sebagian besar tugas grafis dan kurang fleksibel untuk perhitungan lainnya. Arsitektur baru ini menawarkan penyederhanaan pengembangan dan dukungan yang signifikan, pembuatan yang disederhanakan, analisis dan penangkapan kesalahan dalam kode tingkat rendah, kinerja yang stabil dan dapat diprediksi.

Subsistem cache memori

Bandwidth, memori, dan cache tidak pernah cukup, dan selalu ada kebutuhan dan metode untuk meningkatkannya. GPU baru AMD menggunakan cache baca/tulis dua tingkat penuh. Setiap unit komputasi memiliki 16 kilobyte cache tingkat pertama, dan total volume cache tingkat kedua adalah 768 kilobyte (total, chip tersebut memiliki 512 KB L1 dan 768 KB L2), yaitu 50% lebih banyak dibandingkan chip sebelumnya , yang tidak memiliki kemampuan menulis sama sekali di cache L2.

Dari segi performa, setiap unit komputasi GCN dapat menerima atau menulis 64 byte data dari/ke cache L1 atau memori global, yang digunakan untuk pertukaran data antar thread instruksi, dalam satu siklus clock. Setiap bagian dari cache L2 tingkat kedua mampu mengirim dan menerima jumlah data yang sama. Hasilnya, GPU kelas atas perusahaan ini mencapai 2 terabyte/dtk untuk L1 dan 700 GB/dtk untuk L2, yang merupakan 50% lebih tinggi dibandingkan solusi kelas atas AMD sebelumnya.

GPU Tahiti

Sekarang kita telah melihat perubahan arsitektur tingkat rendah pada seri Southern Islands yang baru, sekarang saatnya beralih ke detail solusi paling kuat dari lini ini, Radeon HD 7900, yang mencakup dua model. Pertama-tama, mari kita perhatikan kompleksitas GPU baru ini, karena GPU ini mencakup lebih dari 4,3 miliar transistor, dua kali lebih banyak dari chip yang menjadi dasar Radeon HD 5870! Tentu saja, chip sekuat itu menjadi mungkin hanya berkat penggunaan teknologi proses 28 nm yang baru. Jadi apa yang ada di dalam dirinya?

Jumlah balok geometris tidak berubah, dibandingkan dengan Cayman, masih ada dua balok, tetapi efisiensi kerjanya telah meningkat secara signifikan - kita akan membahasnya lebih detail nanti. Dalam diagram GPU kita melihat 32 unit komputasi arsitektur GCN tersedia di Radeon HD 7970, dan dalam kasus solusi kelas bawah, beberapa di antaranya akan dinonaktifkan. Jika kita mempertimbangkan kinerja komputasi puncak dari solusi ini, hampir 3,8 teraflops (operasi floating point per detik), yang merupakan rekor mutlak untuk sebuah GPU hingga saat ini.

Setiap blok GCN berisi 16 unit tekstur, yang memberikan angka akhir 128 TMU per chip, atau lebih dari 118 gigatexel/detik - dan ini merupakan rekor lain pada saat dirilis, dan ini bukan yang terakhir. Namun jumlah blok ROP tidak berubah, masih ada 32 blok di 8 blok RBE yang diperbesar. Perubahan arsitektur menarik lainnya adalah blok ROP kini “melekat” bukan pada saluran memori, seperti yang terjadi sebelumnya, namun pada blok GCN.

Meskipun secara teoritis kecepatan tulis ke framebuffer hampir tidak berubah, dan kemungkinan maksimum adalah 32 nilai warna dan 128 nilai kedalaman per jam yang sama, kecepatan pengisian praktis dalam aplikasi dunia nyata telah meningkat secara signifikan karena peningkatan bandwidth memori. Menurut pengukuran AMD, Cayman hanya mencatat 23 piksel per jam, sedangkan Tahiti baru mendekati angka teoritis 32 piksel per jam.

Hal ini dapat dimengerti, karena chip video baru AMD memiliki bus memori 384-bit - enam saluran 64-bit, sama seperti solusi top-end pesaing saat ini. Peningkatan bandwidth memori sebesar satu setengah kali inilah yang memungkinkan peningkatan kecepatan aktual pengambilan dan penulisan tekstur ke framebuffer. Bandwidth sebesar 264 GB/detik akan membantu mendekati angka teoritis yaitu 118 gigapixel/detik dan 30 gigapixel/detik, dan pada bagian praktiknya kita akan memeriksanya.

Dalam kasus GPU Radeon HD 7950 yang “dipotong”, Tahiti menyertakan 28 unit komputasi aktif arsitektur GCN dari 32 unit yang tersedia secara fisik pada chip tersebut. Dalam kasus solusi junior seri Radeon HD 7970, diputuskan untuk menonaktifkan empat di antaranya. Karena setiap unit GCN berisi 16 unit tekstur, jumlah total TMU untuk model baru ini adalah 112 TMU, yang memberikan performa hampir 90 gigatexel/detik.

Namun jumlah unit ROP dan pengontrol memori di HD 7950 tidak berubah; mereka memutuskan untuk tidak memotongnya dan membiarkannya masing-masing sebanyak 32 dan 6 buah. Oleh karena itu, chip video Tahiti Pro memiliki bus memori 384-bit yang sama, yang dirakit dari enam saluran 64-bit, sebagai solusi teratas AMD. Rupanya, perangkat fungsional komputasilah yang paling menderita akibat cacat produksi, dan mereka memutuskan untuk tidak menghentikan yang lainnya.

Tesselasi dan pemrosesan geometri

Dari sudut pandang arsitektur, tidak banyak yang berubah pada blok geometris Tahiti sejak Cayman. Dua blok masih digunakan untuk memproses (mengatur simpul dan tesselasi) data geometris dan rasterisasi, dan skemanya sangat mirip dengan yang kita lihat sebelumnya, kecuali tessellator tersebut disebut generasi ke-9:

Terlepas dari kesamaan skema, generasi terbaru dari blok ini mampu melakukan tessellasi dan kinerja pemrosesan geometri yang jauh lebih besar, karena blok tersebut telah mengalami modifikasi yang signifikan. Meskipun kinerja puncak hanya meningkat hingga hampir dua miliar simpul dan primitif per detik (925 MHz dan dua simpul per jam), kinerja sebenarnya meningkat lebih banyak. Hal ini dicapai dengan meningkatkan ukuran cache, meningkatkan buffering data geometri, dan menggunakan kembali data vertex.

Hasilnya, kinerja tessellation ditingkatkan di semua rasio segitiga hingga empat kali lipat dibandingkan Radeon HD 6970 generasi sebelumnya. Namun empat kali tidak tercapai di semua kasus, bahkan pada diagram dari AMD sendiri:

Bagan tersebut membandingkan kinerja tessellation Radeon HD 7970 versus HD 6970 pada faktor partisi yang berkisar antara 1 hingga 32. Dan seperti yang Anda lihat, perbedaan kinerjanya adalah antara 1,7 dan 4 kali lipat. Tapi ini sintetis. Dan untuk lebih mendekati kenyataan, mari berikan lebih banyak data tentang kecepatan tessellation dalam aplikasi game:

Seperti yang Anda lihat, nomor sintetis AMD didukung dengan baik oleh nomor game - kinerja dalam aplikasi nyata dengan tesselasi "berat" telah meningkat secara signifikan. Ini adalah hasil yang sangat bagus, yang pasti akan kami periksa di bagian praktisnya, dengan menggunakan contoh aplikasi sintetis dan game.

Komputasi non-grafis

Dari sudut pandang tugas komputasi yang heterogen dan non-grafis, kemunculan dua mesin komputasi asinkron (Asynchronous Compute Engines - ACE) sangatlah penting. Mereka dirancang untuk menjadwalkan dan mendistribusikan pekerjaan antar unit eksekusi untuk multitasking yang efisien dan bekerja bersama dengan prosesor perintah grafis (Command Processor).

Radeon HD 7900 memiliki dua mesin komputasi independen dan satu mesin grafis. Secara total, ini menghasilkan tiga blok yang dapat diprogram dan tiga aliran perintah, yang sepenuhnya terpisah satu sama lain. Dan selain penyampaian perintah asinkron untuk peralihan konteks yang cepat, GPU baru ini juga dilengkapi dua pengontrol akses memori langsung (DMA) dua arah yang diperkenalkan di Cayman. Kedua pengontrol ini diharuskan untuk memanfaatkan sepenuhnya bus PCI Express 3.0 yang baru.

Seperti yang kita ketahui, dari sudut pandang komputasi yang serius, tidak hanya kecepatan melakukan operasi titik mengambang presisi tunggal yang penting, tetapi juga titik mengambang presisi ganda. Dan arsitektur AMD yang baru mengatasi tugas ini dengan cukup baik. Saat ini, diasumsikan terdapat dua versi unit komputasi GCN yang memiliki tingkat eksekusi instruksi FP64 yang berbeda. Untuk GPU lama, kecepatan eksekusinya adalah 1/4 dari kecepatan FP32, dan untuk chip yang lebih muda, kecepatan eksekusinya adalah 1/16, yang cukup untuk menjaga kompatibilitas, namun tidak terlalu mempersulit solusi yang murah. Hasilnya, Radeon HD 7970 mampu melakukan 947 miliar operasi presisi ganda per detik (oh, mereka gagal mencapai teraflop!) - ini merupakan pencapaian tertinggi lainnya dari chip AMD baru.

Selain itu, ini bukan gigaflop yang sama seperti pada arsitektur sebelumnya, tetapi lebih "gemuk". Bagaimanapun, efisiensi GPU baru dalam tugas komputasi yang kompleks akan meningkat secara signifikan. Pertama, subsistem memori dan caching telah ditingkatkan. Kedua, setiap unit komputasi GCN memiliki penjadwalnya sendiri, yang akan meningkatkan eksekusi kode percabangan dan efisiensi secara keseluruhan. Dan ketiga, kami mencatat eksekusi skalar, yang tidak memerlukan optimasi rumit dari kompiler, sehingga unit komputasi akan lebih jarang menganggur. Hasilnya, dalam tugas apa pun, chip baru akan lebih mudah menunjukkan kinerja tinggi dan beban ALU.

Di antara inovasi lain yang terkait dengan kemampuan komputasi, kami mencatat dukungan penuh ECC untuk DRAM dan SRAM. Di sisi perangkat lunak, penting bahwa Tahiti menjadi GPU pertama dengan dukungan penuh untuk versi API baru: OpenCL 1.2, DirectCompute 11.1 dan C++ AMP serta kemampuannya. Misalnya, OpenCL 1.2 memungkinkan Anda menggabungkan kemampuan beberapa perangkat komputasi menjadi satu, dan AMD telah merilis dukungan untuk ini dalam bentuk AMD APP SDK 2.6 dan driver Catalyst 11.12.

Kinerja dan efisiensi arsitektur

Setelah meninjau semua inovasi arsitektur menggunakan contoh chip kelas atas dari seri Pulau Selatan, sekarang saatnya membicarakan efektivitas semua perubahan ini. Jelas bahwa kinerja chip baru ini jauh lebih tinggi dibandingkan chip sebelumnya; sebaliknya akan cukup mengejutkan. Pertanyaannya adalah seberapa cepat. Dalam berbagai tugas, hasilnya berkisar antara 40-50% (minimum!) hingga perbedaan lima kali lipat. Perbaikan dalam arsitektur memungkinkannya melebihi perbedaan teoritis sebesar 1,4 kali dalam gigaflop bodoh. Mari kita lihat ini dengan contoh:

Diagram tersebut membandingkan solusi teratas baru dan solusi chip tunggal sebelumnya: Radeon HD 7970 dan HD 6970, yang cukup adil. Tes kinerja yang dipilih berbeda: SmallptGPU dan LuxMark adalah ray tracing pada OpenCL, SHA256 adalah algoritma hashing yang aman, dan AES256 adalah algoritma enkripsi simetris. Mandelbrot adalah masalah terkenal yang dihitung dengan presisi ganda.

Garis putus-putus vertikal pada grafik menandai perbedaan teoritis dalam kinerja, namun data kecepatan menunjukkan bahwa dalam tiga dari lima tugas, kecepatan GPU baru jauh lebih tinggi. Hal ini disebabkan oleh semua perubahan yang bertujuan untuk meningkatkan efisiensi: beralih dari VLIW, memiliki penjadwal di setiap unit komputasi, peningkatan caching, dll.

Perubahan pada kualitas rendering

Sebenarnya bagian ini bisa saja dilewati dengan mudah, karena akhir-akhir ini tidak ada keluhan khusus mengenai kualitas gambar dan tidak bisa ada - karena berbagai alasan. Misalnya, kualitas anti-aliasing layar penuh di antara kartu video dari produsen yang berbeda sangat mirip, terutama mengingat meluasnya penggunaan metode anti-aliasing perangkat lunak menggunakan filter pasca-pemrosesan, yang dijalankan dengan cara yang persis sama di semua GPU.

Hal yang sama berlaku untuk pemfilteran tekstur - sekarang kualitasnya sedemikian rupa sehingga sangat sulit untuk membedakan antara solusi AMD dan NVIDIA bahkan jika Anda membuat perbandingan piksel demi piksel. Pada Radeon HD 6900 - generasi sebelumnya dari perusahaan - pemfilteran anisotropik telah sedikit ditingkatkan, dan sekarang bahkan "mikroskop" tidak akan membantu menemukan kekurangan yang signifikan di sana. Satu-satunya catatan adalah bahwa kartu grafis Radeon sedikit lebih rendah daripada GeForce karena artefak spesifik yang lebih terlihat, seperti "noise" atau "sand".

Dengan dirilisnya chip video generasi baru, bobot texel dalam filter tekstur ditinjau kembali, memodifikasinya sedemikian rupa untuk mengurangi artefak tersebut, terkadang terlihat pada Radeon HD 6900 dengan adanya jenis tekstur tertentu (“tinggi -frekuensi”, dengan transisi tajam dari gelap ke terang, misalnya). Perubahan kualitas sangat sulit untuk ditunjukkan dengan contoh sehingga AMD tidak memberikan gambar perbandingan HD 7900 versus HD 6900, tetapi hanya membandingkan kualitas algoritma “perangkat keras” dengan algoritma perangkat lunak murni yang dijalankan pada prosesor aliran GPU, dan oleh karena itu ideal:

Dalam tangkapan layar sekecil itu, perbedaan kualitas tidak terlihat, namun AMD memastikan bahwa semua perubahan yang dilakukan tidak menyebabkan penurunan kinerja dan tidak menurunkan kualitas gambar dalam aspek apa pun - tetap tidak bergantung pada sudut dan sudut. kualitas penyaringan mendekati ideal. Kami pasti akan memeriksanya di salah satu materi praktik mendatang.

Tekstur Residen Sebagian

Ide Partially Resident Textures (PRT) adalah menggunakan kemampuan perangkat keras dari GPU yang disajikan - memori virtual. Pasti banyak pengguna yang pernah melihat game RAGE dari id Software, yang menggunakan teknologi tekstur virtual, yang disebut megatexturing (“MegaTexture”), yang memungkinkan untuk menggunakan data tekstur dalam jumlah besar dan mengalirkannya ke dalam memori video.

Dengan menggunakan memori video virtual, sangat mudah untuk mendapatkan dukungan perangkat keras yang efektif untuk algoritme tersebut, memungkinkan Anda menggunakan tekstur hingga 32 terabyte dalam sebuah aplikasi, yang memungkinkan untuk membuat lokasi unik dalam game, tanpa mengulangi potongan tekstur, dan tanpa masalah dengan memuat data tekstur. Benar, AMD memberikan contoh jelas yang terlalu aneh, dan tidak ada yang jelas:

PRT memungkinkan Anda mencapai kualitas gambar yang tinggi dan membantu meningkatkan efisiensi penggunaan memori video. Algoritme serupa sudah digunakan di mesin id Software, dan diharapkan muncul di banyak mesin generasi berikutnya. Game masa depan perlu bekerja dengan data dalam jumlah besar, dan keuntungan dari GPU baru adalah memori grafis lokal dalam algoritma ala PRT berfungsi sebagai memori cache perangkat keras, dan tekstur dimuat ke dalamnya bila diperlukan. GPU dari keluarga Kepulauan Selatan mendukung "megatekstur" dengan volume hingga 32 terabyte (resolusi hingga 16384 × 16384) dan, yang paling penting, pemfilteran tekstur perangkat keras untuknya, yang tidak tersedia pada chip video sebelumnya.

Tekstur virtual dibagi menjadi beberapa bagian berukuran 64 kilobyte (kilobyte, bukan texel) dan ukuran bagian ini tetap. Dan hanya frame yang diperlukan saat merender frame saat ini yang dimuat ke dalam memori lokal kartu video. Teknologi ini bekerja terlepas dari format teksturnya, hanya saja ukuran potongan di texel akan berbeda. Misalnya, untuk tekstur biasa yang tidak terkompresi dengan 32 bit per warna, ukuran potongannya adalah 128x128 texel, dan untuk tekstur yang dikompresi dalam format DXT3 - 256x256 texel.

Teknologi ini juga melibatkan penggunaan level tekstur mip (salinan yang dikurangi yang digunakan dalam pemfilteran tekstur). Mereka memerlukan banyak akses selama rendering dan pemfilteran. Mari kita lihat pengoperasian algoritma menggunakan sebuah contoh.

Gambar ini menyoroti empat potongan berbeda dari level mip berbeda yang diperlukan untuk rendering. Ketika program shader meminta data dari mereka, beberapa potongan sudah ada di memori lokal dan data ini segera dikirim ke shader untuk perhitungan lebih lanjut. Namun beberapa bagian hilang dari tabel, dan aplikasi harus memilih apa yang harus dilakukan selanjutnya jika bagian tersebut hilang. Misalnya, Anda dapat meminta data dari tingkat mip resolusi yang lebih rendah, maka gambar akan menjadi kabur, namun setidaknya akan terlihat seperti aslinya dan akan dirender tanpa penundaan. Dan pada saat frame berikutnya dirender, frame tersebut sudah dapat dimuat ke dalam cache - memori video lokal. Mereka yang memainkan RAGE akan memahami kami.

Ini adalah algoritme canggih yang memungkinkan Anda menggunakan tekstur besar yang unik untuk setiap objek. Algoritme serupa telah lama digunakan dalam rendering offline, kecuali untuk kebutuhan penghitungan waktu nyata. AMD bahkan membuat demo menggunakan teknik Per-Face Texture Mapping yang dikembangkan oleh Walt Disney Animation Studios untuk film animasinya. Sayangnya, demonya belum siap, dan kami hanya melihat tangkapan layar beresolusi rendah.

Inti dari teknik pemetaan tekstur ini adalah untuk menetapkan potongan tekstur tertentu pada setiap poligon, tanpa perlu menggunakan transformasi UV (mencari korespondensi antara koordinat permukaan objek tiga dimensi dan koordinat pada tekstur dua dimensi) . Pendekatan ini memecahkan beberapa masalah dalam pembuatan konten tessellated dengan membuat algoritma pemetaan perpindahan menjadi sangat sederhana. Dan PRT dalam metode ini digunakan untuk menyimpan dan mengakses data tekstur secara efisien.

Petunjuk Pemrosesan Media

Inovasi menarik di Kepulauan Selatan tampaknya adalah dukungan instruksi khusus yang digunakan dalam pemrosesan gambar, statis dan dinamis. Misalnya, instruksi yang banyak digunakan yang disebut “jumlah perbedaan absolut”, lebih dikenal sebagai SAD (Jumlah Perbedaan Absolut), telah diperbaiki. Kecepatan eksekusinya merupakan hambatan kinerja yang sangat penting bagi banyak algoritma pemrosesan gambar dan video, seperti deteksi gerakan, pengenalan gerakan, pencarian gambar, visi komputer, dan banyak lainnya.

Namun dalam ulasan kami tentang kartu video Radeon HD 5870 kuno, kami sudah menulis tentang dukungan SAD. Sekarang, selain SAD biasa (4x1), Kepulauan Selatan memiliki instruksi baru - QSAD (quad SAD), yang menggabungkan SAD dengan operator shift untuk meningkatkan kinerja dan efisiensi energi, serta instruksi “tertutup” MQSAD, yang mengabaikan piksel latar belakang dan digunakan untuk mengisolasi objek yang bergerak dalam bingkai dari latar belakang.

GPU baru ini dapat memproses hingga 256 piksel per unit komputasi GCN per jam, yang dalam kasus model AMD Radeon HD 7970 berarti kemampuan untuk memproses hingga 7,6 triliun piksel per detik dalam kasus nilai warna integer 8-bit. Meskipun ini merupakan gambaran teoritis, kemampuan pemrosesan visual dari GPU baru ini cukup mengesankan - banyak tugas pemrosesan video dapat dilakukan secara real-time.

PCI Ekspres 3.0

Kami tidak dapat mengabaikan dukungan PCI Express versi ketiga oleh seluruh lini solusi grafis Kepulauan Selatan yang baru. Dukungan ini cukup diharapkan, karena spesifikasi PCI Express versi ketiga akhirnya disetujui pada musim gugur tahun 2010, namun masih belum ada solusi perangkat keras dengan dukungannya, meskipun motherboard sudah muncul, kartu video dirilis pada akhirnya. tahun 2011, dan prosesor pusat yang sesuai Ada.

Antarmuka yang diperbarui memiliki kecepatan transfer 8 gigatransaksi per detik, bukan 5 GT/dtk untuk versi 2.0, dan throughputnya sekali lagi meningkat dua kali lipat (menjadi 32 GB/dtk) dibandingkan dengan standar PCI Express 2.0. Bus baru menggunakan skema pengkodean berbeda untuk data yang dikirim melalui bus, tetapi kompatibilitas dengan versi PCI Express sebelumnya tetap dipertahankan.

Motherboard pertama yang mendukung PCI Express 3.0 diperkenalkan pada musim panas 2011, sebagian besar didasarkan pada chipset Intel Z68, dan baru tersedia secara luas pada musim gugur tahun yang sama. Kini kartu video telah hadir, dan AMD sekali lagi menjadi yang terdepan dalam hal kecepatan peluncuran prosesor grafis baru yang mendukung teknologi tercanggih. Namun apakah PCI-E 3.0 akan masuk akal secara praktis masih terlalu dini untuk dinilai.

Teknologi AMD PowerTune

Salah satu inovasi paling menarik di Cayman adalah teknologi manajemen daya PowerTune yang canggih. Manajemen daya GPU yang fleksibel telah digunakan sejak lama, tetapi sebelum Radeon HD 6900, semua teknologi ini agak primitif dan sebagian besar merupakan metode perangkat lunak dan mengubah frekuensi dan voltase secara bertahap, tidak dapat mematikan sebagian besar chip video.

Bahkan dalam keluarga Radeon HD 5000, pembatas kinerja muncul ketika tingkat konsumsi tertentu terlampaui, dan di Radeon HD 6900 sistem berpindah ke tingkat yang berbeda secara kualitatif. Untuk melakukan ini, chip tersebut menyertakan sensor khusus di semua blok yang memantau parameter boot. GPU secara konstan mengukur beban dan konsumsi daya dan tidak membiarkan beban dan konsumsi daya melampaui ambang batas tertentu, secara otomatis menyesuaikan frekuensi dan voltase sehingga parameter tetap berada dalam paket termal yang ditentukan.

Tidak seperti teknologi manajemen daya sebelumnya, PowerTune memberikan kontrol langsung atas konsumsi daya GPU, dibandingkan kontrol tidak langsung dengan mengubah frekuensi dan voltase. Teknologi ini membantu Anda mengatur jam GPU Anda ke kecepatan tinggi, mencapai performa gaming tinggi tanpa khawatir konsumsi daya melampaui batas aman. Lagi pula, sebagian besar game dan aplikasi umum yang menggunakan komputasi GPU memiliki kebutuhan daya yang jauh lebih rendah dan tidak mendekati batas konsumsi daya yang berbahaya, tidak seperti uji stabilitas seperti Furmark dan OCCT.

Bahkan game terberat pun tidak memerlukan konsumsi daya maksimum, dan jika Anda membatasi konsumsi berdasarkan frekuensi, menguji kartu video dengan pengujian ekstrem, maka dalam kasus game 3D akan ada cukup banyak kinerja dan potensi daya yang belum dimanfaatkan. Jika kartu video belum mencapai tingkat konsumsi aman, GPU akan beroperasi pada frekuensi yang disetel di pabrik, dan dalam pengujian FurMark dan OCCT, frekuensi GPU akan diturunkan agar tetap dalam batas konsumsi.

Dengan demikian, PowerTune membantu menyetel frekuensi pabrik yang lebih tinggi dan mengonfigurasi sistem agar menggunakan sumber daya GPU seefisien mungkin pada tingkat konsumsi maksimum yang ditetapkan. Pada contoh di atas, HD 5870 tidak menggunakan PowerTune dan, karena keterbatasan frekuensi GPU akibat konsumsi yang tinggi dalam uji ketahanan, tidak menggunakan semua kemampuannya. Sementara Radeon HD 7970 diatur ke TDP maksimum, dan chip video mengatur ulang frekuensi hanya jika terlampaui, sehingga memperoleh kinerja setinggi mungkin dalam aplikasi apa pun.

Hal ini terlihat jelas pada diagram berikut. Dalam kasus aplikasi game, pencapaian TDP dapat dicapai dengan meningkatkan frekuensi GPU, dan untuk beban puncak, uji ketahanan mengurangi frekuensi ke tingkat konsumsi daya yang aman. Tanpa PowerTune, Anda harus memilih - kemungkinan kegagalan kartu video saat menggunakan FurMark dan OCCT untuk waktu yang lama, atau mengurangi potensi kinerja dalam game. Teknologi baru memecahkan masalah ini seefisien mungkin.

AMD PowerTune cepat tanggap terhadap perubahan kondisi (mikrodetik) karena merupakan teknologi perangkat keras. Ini juga dibedakan dengan pengaturan frekuensi yang fleksibel, dan tidak bertahap, seperti yang terjadi pada chip sebelumnya. Semua pengukuran tidak bergantung pada pengemudi, tetapi dapat disesuaikan oleh pengguna menggunakan pengaturan kartu video.

Perbedaan antara PowerTune dan pendekatan yang diterima secara umum sebelumnya adalah bahwa dalam kasus lain, pelambatan termal digunakan, yang menempatkan GPU dalam mode konsumsi yang dikurangi secara signifikan, sementara PowerTune dengan lancar mengurangi frekuensinya, sehingga konsumsi GPU ke batas yang ditetapkan. Ini mencapai kecepatan clock dan kinerja yang lebih tinggi.

Teknologi AMD ZeroCore

AMD tidak membatasi diri pada penggunaan teknologi manajemen daya yang sudah dikenal dari solusi sebelumnya. Pada chip pertama di keluarga Southern Islands, ia memperkenalkan teknologi AMD ZeroCore, yang membantu mencapai efisiensi energi yang lebih besar dalam mode "deep idle" (atau "sleep") dengan perangkat tampilan dinonaktifkan, yang didukung oleh semua sistem operasi.

Lagi pula, hampir semua sistem, bahkan sistem game, menghabiskan sebagian besar waktunya dalam mode beban rendah pada prosesor grafis. Dan kartu video tidak akan menghabiskan banyak energi dalam mode ini. Dan terlebih lagi, belum lagi mode dengan monitor dimatikan - dalam hal ini, disarankan untuk mematikan GPU sepenuhnya. Itulah yang dilakukan AMD. Berkat ZeroCore, dalam kondisi idle yang dalam, GPU baru mengkonsumsi kurang dari 5% energi mode penuh, sehingga menonaktifkan sebagian besar blok fungsional dalam mode ini.

AMD memberikan perbandingan skematis dengan Radeon HD 5870 miliknya, yang tidak mendukung teknologi tersebut. ZeroCore adalah inovasi eksklusif Kepulauan Selatan yang dihadirkan ke solusi desktop dari GPU seluler yang dirancang untuk laptop. Omong-omong, keunggulan teknologi ini tidak hanya terkait dengan pengurangan konsumsi. Selain itu, dalam mode idle jangka panjang saat layar dimatikan, kartu video juga mematikan kipas pada pendingin kartu video sepenuhnya!

Inilah yang telah lama ditunggu-tunggu oleh banyak pengguna. Hal yang paling menarik adalah, menurut data kami, pengujian laboratorium terhadap solusi PowerTune dan ZeroCore serupa dilakukan beberapa generasi kartu video yang lalu. Beberapa contoh rekayasa kartu video dari seri AMD yang telah lama keluar dari pasaran bekerja persis seperti ini, mematikan pendingin sepenuhnya saat tidak digunakan.

Namun bukan hanya pengguna GPU tunggal yang akan mendapatkan keuntungan dari pengurangan kebisingan dan konsumsi daya dengan kartu grafis baru AMD yang mendukung ZeroCore. Peningkatan serupa menunggu pemilik sistem CrossFire yang bahagia berdasarkan dua, tiga, dan bahkan empat GPU. Masuk akal bahwa dalam mode rendering antarmuka dua dimensi sistem operasi, semua kartu video kecuali yang utama tidak berfungsi sama sekali? Tapi itulah cara kerjanya sekarang!

Dalam kasus sistem CrossFire pada kartu video dengan dukungan ZeroCore dalam mode 2D, semua kartu video sekunder akan dialihkan ke mode tidur nyenyak dengan konsumsi daya minimal dan pendingin dinonaktifkan. Mode ini berfungsi untuk beberapa kartu video chip tunggal dan untuk solusi chip ganda. Selain itu, kartu video CrossFire utama juga akan memasuki mode ini jika tidak ada aktivitas dalam waktu lama, yang dikonfigurasi di Windows. Perbedaan pengoperasiannya terlihat seperti ini:

Ternyata, teknologinya tidak sesederhana kelihatannya. Insinyur AMD harus memecahkan banyak masalah terkait pengoperasian sistem operasi dalam mode siaga. Misalnya, mereka menemukan bahwa Windows mencoba memperbarui informasi di layar meskipun monitor dimatikan. Yang tentu saja tidak memungkinkan Anda untuk menonaktifkan GPU sama sekali. Oleh karena itu, pemrogram perusahaan harus mengambil solusi dengan mengabaikan semua perintah menggambar layar saat monitor dimatikan dalam mode tidur.

Teknologi AMD Eyefinity 2.0

Tentu saja, dalam arsitektur baru juga terdapat ruang untuk peningkatan pada teknologi yang telah terbukti untuk menampilkan gambar di beberapa monitor - AMD Eyefinity, kini dalam versi 2.0. Ia menerima fitur-fitur baru, resolusi lebih tinggi, dukungan untuk tampilan lebih banyak dan peningkatan fleksibilitas.

Teknologi ini cukup menarik, meskipun sangat sedikit pengguna yang menemukan ruang di dalam ruangan dan berani memasang lebih dari dua monitor di keluarga mereka. Namun lebih baik memiliki kesempatan untuk selalu bisa memanfaatkannya daripada tidak memilikinya sama sekali. Selain itu, harga monitor diagonal besar hampir tidak turun, tetapi solusi tingkat menengah terus menjadi lebih murah.

Memang, sekarang lebih menguntungkan membeli tiga monitor dengan diagonal layar 24″ daripada satu monitor berukuran 30 inci. AMD memberikan contoh seperti itu, ketika sebuah monitor 30″ dengan resolusi 2560×1600 berharga lebih dari $1000, dan tiga monitor 24″ FullHD dapat dibeli dengan setengah harga tersebut:

Namun cara membelanjakan uang dan ruang di dalam ruangan adalah urusan pribadi setiap pengguna. Yang penting peluang seperti itu ada. Selain itu, Eyefinity 2.0 kini mendukung output gambar dalam mode stereo HD3D - sesuatu yang tidak ada pada solusi sebelumnya, yang lebih rendah dibandingkan solusi pesaing dalam parameter ini. Menggabungkan teknologi AMD Eyefinity dan HD3D, kartu grafis Radeon HD 7970 adalah solusi chip tunggal pertama yang mendukung tiga monitor yang beroperasi dalam mode stereo.

Render stereo resolusi tinggi memerlukan antarmuka data yang sangat cepat. Dan dengan keluaran HDMI versi sebelumnya, kemampuannya dibatasi hingga 24 Hz per mata, yang cukup untuk menonton film Blu-ray 3D, tetapi jelas terlalu rendah untuk para gamer.

Untuk tugas seperti itu, mereka mulai menggunakan format pengepakan bingkai, ketika bingkai untuk mata kiri dan kanan digabungkan menjadi satu, dan AMD Radeon HD 7970 mendukung format pengepakan bingkai HDMI 1.4a untuk keluaran gambar stereo. Ini adalah kartu video pertama yang mendukung HDMI 3 GHz dengan pengepakan bingkai, ketika setiap mata menerima gambar FullHD dengan frekuensi 60 Hz (total 120 Hz):

Produk baru lainnya yang menarik bagi kami adalah teknologi output audio multi-saluran Discrete Digital Multi-Point Audio (DDMA), yang bekerja sama dengan Eyefinity. Semua GPU sebelumnya hanya mampu mengeluarkan satu aliran audio melalui HDMI dan DisplayPort. Artinya, meskipun tiga monitor yang terletak di ruangan berbeda dihubungkan ke PC melalui HDMI, hanya satu saluran audio yang dikirimkan. Namun AMD Radeon HD 7900 menerima dukungan untuk keluaran simultan beberapa saluran audio independen, yang mungkin berguna dalam beberapa konfigurasi multi-monitor.

Fitur yang sama akan sangat berguna untuk digunakan dalam konferensi video dengan tampilan beberapa lawan bicara di layar terpisah, serta aplikasi multitasking seperti bermain di tiga monitor dengan audio game dan melihat berita di layar terpisah dengan aliran audio independen. Sebelumnya, untuk semua ini perlu menggunakan beberapa sistem audio terpisah, tetapi sekarang semuanya bekerja senyaman mungkin.

Dukungan perangkat lunak Eyefinity juga tidak dilupakan, teknologinya diperbarui hampir setiap bulan - peluang baru bermunculan. Jadi, pada bulan Oktober, dukungan untuk resolusi hingga 16384x16384 dan konfigurasi multi-monitor baru muncul: horizontal dan vertikal 5x1, serta berdasarkan enam monitor dalam mode 3x2.

Pembaruan bulan Desember untuk driver video AMD Catalyst memungkinkan untuk bekerja sama antara Eyefinity dan HD3D, dan pada bulan Februari mereka menjanjikan dukungan untuk resolusi khusus, pengaturan penempatan bilah tugas, dan peningkatan manajemen preset.

Output ke enam monitor dapat dicapai dengan menggunakan dua port DisplayPort 1.2 dan dua hub MST (yang telah kami tulis sebelumnya), sedangkan tiga atau bahkan empat monitor hanya memerlukan satu port dan hub yang sesuai. Hub tersebut memungkinkan konfigurasi sistem keluaran gambar yang fleksibel; hub tersebut mendukung hingga empat perangkat FullHD per konektor DisplayPort 1.2 dan akan tersedia untuk dijual pada musim panas 2012.

Berbicara tentang resolusi. Resolusi tinggi atau bahkan sangat tinggi - Resolusi Ultra Tinggi. Perangkat terkini dengan resolusi 4000 piksel di sisi yang lebih besar memerlukan koneksi menggunakan beberapa kabel sekaligus: dua DP 1.1 atau empat DVI. Monitor resolusi generasi berikutnya ini hanya akan dihubungkan melalui satu kabel: DP 1.2 HBR2 atau HDMI 1.4a 3 GHz. Dan kartu video baru dari AMD sudah siap untuk monitor seperti itu, sekali lagi menjadi yang pertama di dunia.

Pengkodean dan penguraian video

Sangat wajar jika AMD Radeon HD 7970 menyertakan unit UVD yang sama untuk mendekode data video, yang muncul pada chip video perusahaan generasi sebelumnya. Itu tidak memerlukan modifikasi apa pun, mendukung codec MVC multi-stream, mendekode format MPEG-2/MPEG-4 (DivX), VC-1 dan H.264, serta mendekode dua aliran FullHD dalam semua format yang didukung.

Solusi AMD memberikan kualitas decoding aliran video yang maksimal, menggunakan beberapa lusin algoritma peningkatan kualitas khusus dan memberikan hasil maksimal dalam pengujian kualitas seperti HQV. Di antara fitur-fitur yang didukung, kami mencatat: penyesuaian warna dan nada, pengurangan noise, penajaman, penskalaan berkualitas tinggi, kontras dinamis, deinterlacing tingkat lanjut, dan telecine terbalik. Berikut ini contoh meningkatkan kontras dengan cepat:

Namun decoding pada semua chip video kurang lebih sudah dilakukan sejak lama. Semua GPU baru memberikan kualitas dan kinerja yang layak saat melihat data video. Namun pengkodean video pada GPU masih dalam tahap awal dan keluhan utama dari pengguna ditujukan pada rendahnya kualitas gambar terkompresi yang dihasilkan.

Mungkin seri Radeon HD 7000 baru dapat membantu dalam hal ini, karena semua GPU dalam seri ini menyertakan unit pengkodean video Video Codec Engine (VCE). Model Radeon HD 7970 menjadi kartu video pertama yang mendukung pengkodean dan kompresi video yang dipercepat perangkat keras menggunakan unit khusus (sebelumnya, pemroses aliran mengambil bagian dalam pengkodean).

Kualitas dan kinerja jelas lebih baik dari sebelumnya, dengan dukungan pengkodean 1080p pada 60 frame per detik, dan bahkan lebih cepat dari waktu nyata. Sulit untuk mengatakan apa pun tentang kualitas tanpa pengujian, tetapi kami dijanjikan berbagai tingkat pengoptimalan encoder untuk data video dan game, serta kualitas kompresi variabel (kemampuan untuk memilih antara peningkatan kualitas atau kinerja).

Saat ini tidak ada tempat untuk mencoba VCE - tidak ada aplikasi yang mendukungnya, namun AMD bekerja sama dengan mitra seperti ArcSoft untuk memberikan dukungan untuk VCE di produk perangkat lunaknya masing-masing. Di masa depan, kami berencana untuk merilis perpustakaan perangkat lunak untuk mempercepat pengkodean video, yang akan memudahkan pengembang untuk mendukung produk AMD generasi berikutnya.

Pengkodean dapat dilakukan dalam dua mode: penuh dan hybrid (menggunakan kemampuan prosesor aliran GPU). Mode penuh dirancang untuk tugas-tugas yang memerlukan efisiensi energi maksimum dan tingkat kinerja yang konsisten. Pengkodean mode penuh pada VCE lebih cepat daripada waktu nyata dan memberikan latensi rendah. Namun ada juga mode hybrid:

Dalam mode ini, blok matematika GPU juga bekerja sama dengan VCE. Semua tahapan yang sangat dapat diparalelkan, yang diberi garis kuning pada diagram, dapat memanfaatkan kekuatan unit komputasi GCN, sementara unit VCE khusus menangani pengkodean entropi perangkat keras yang efisien. Mode ini sangat cocok untuk kartu video dengan kekuatan matematika yang besar, seperti Radeon HD 7970. Masih ada pertanyaan tentang kualitas kedua mode ini, tetapi hal ini memerlukan analisis yang cermat dalam artikel terpisah.

Video Stabil AMD

Selain pengkodean dan decoding data video, ada area lain di mana kekuatan grafis baru dari AMD dapat digunakan - meningkatkan kualitas video buruk yang diambil dengan tangan, tanpa menggunakan tripod atau alat stabilisasi gambar serupa lainnya. Teknologi stabilisasi video disebut AMD Steady Video, dan versi keduanya telah dirilis.

Algoritme pengoperasian penstabil perangkat lunak cukup sederhana: berdasarkan aliran video, statistik tentang pergerakan kamera (pergeseran, rotasi, zoom) dikumpulkan dan gerakan ini dikompensasi dalam bingkai saat ini, relatif terhadap yang sebelumnya - gambar digeser , diputar dan diskalakan agar gambar tidak banyak melompat dan tetap stabil.

Meski terdengar sederhana, penerapannya juga sulit. Hanya karena ada dua juta piksel di layar, dan hingga 30 atau bahkan 60 frame per detik Bayangkan berapa banyak perhitungan yang perlu dilakukan untuk melacak semua kemungkinan perpindahan frame. Kami telah menulis di atas tentang fungsi QSAD yang digunakan dalam pemrosesan video; fungsi ini juga digunakan di Steady Video 2.0 untuk mempercepat algoritma deteksi gerakan. Jadi GPU harus memproses pergeseran acak dengan amplitudo hingga 32 piksel ke segala arah dan ini memerlukan kinerja yang setara dengan lebih dari 500 miliar operasi SAD per detik (untuk 1920x1080 pada 60 FPS).

Karena dukungan instruksi QSAD baru di Radeon HD 7970, keunggulannya dibandingkan CPU bertenaga dalam algoritma deteksi gerakan melebihi 10x! Artinya, kita sekarang akan disuguhi video berkualitas tinggi, dan tidak hanya saat memproses video rumahan di editor video, tetapi juga saat menonton video online orang lain, yang direkam entah apa dan entah bagaimana caranya.

Detail: Seri Radeon HD 7800

  • Nama kode chip: "Pitcairn"
  • Teknologi manufaktur: 28 nm
  • 2,8 miliar transistor (sedikit lebih banyak dari Cayman, yang merupakan basis seri Radeon HD 6900)
  • Arsitektur terpadu dengan serangkaian prosesor umum untuk pemrosesan aliran berbagai jenis data: simpul, piksel, dll.
  • Dukungan perangkat keras untuk DirectX 11.1, termasuk Shader Model 5.0
  • Bus memori 256-bit: empat pengontrol lebar 64-bit yang mendukung memori GDDR5
  • Frekuensi inti: hingga 1000 MHz (untuk Radeon HD 7870)
  • 20 unit komputasi GCN, termasuk 80 inti SIMD, yang terdiri dari total 1.280 ALU untuk penghitungan floating point (format integer dan floating, dukungan presisi FP32 dan FP64 dalam standar IEEE 754)
  • 80 unit tekstur, dengan dukungan pemfilteran trilinear dan anisotropik untuk semua format tekstur
  • 32 unit ROP dengan dukungan mode anti-aliasing dengan pengambilan sampel yang dapat diprogram lebih dari 16 sampel per piksel, termasuk dengan format buffer bingkai FP16 atau FP32. Performa puncak hingga 32 sampel per jam, dan dalam mode Z saja - 128 sampel per jam

Spesifikasi kartu grafis Radeon HD 7870

  • Frekuensi inti: 1000 MHz
  • Jumlah prosesor universal: 1280
  • Jumlah blok tekstur: 80, blok pencampuran: 32
  • Jenis memori: GDDR5
  • Kapasitas memori: 2 gigabyte
  • Laju pengisian maksimum teoritis: 32,0 gigapiksel per detik.
  • Kecepatan pengambilan sampel tekstur teoretis: 80,0 gigatexel per detik.
  • Satu konektor CrossFire
  • bus PCI Express 3.0
  • Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
  • Konsumsi daya: dari 3 hingga 175 W
  • Dua konektor daya 6-pin
  • Desain slot ganda
  • Harga yang disarankan untuk pasar AS: $349

Spesifikasi kartu grafis Radeon HD 7850

  • Jam inti: 860 MHz
  • Jumlah prosesor universal: 1024
  • Jumlah blok tekstur: 64, blok pencampuran: 32
  • Frekuensi memori efektif: 4800 MHz (4x1200 MHz)
  • Jenis memori: GDDR5
  • Kapasitas memori: 2 gigabyte
  • Bandwidth memori: 153,6 gigabyte per detik.
  • Laju pengisian maksimum teoritis: 27,5 gigapiksel per detik.
  • Kecepatan pengambilan sampel tekstur teoretis: 55,0 gigatexel per detik.
  • Satu konektor CrossFire
  • bus PCI Express 3.0
  • Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
  • Konsumsi daya: dari 3 hingga 130 W
  • Desain slot ganda
  • MSRP AS: $249

Dan kali ini prinsip penamaan produk perusahaan tidak diubah dan tren seri sebelumnya tetap dilanjutkan. Seri kartu video anggaran menengah berdasarkan arsitektur GCN berbeda dari garis atas dan anggaran dengan digit kedua dalam indeks: alih-alih 7 dan 9, angka 8 dimasukkan, yang cukup logis. Karena AMD mengambil ambang psikologis 1000 MHz untuk frekuensi GPU, Radeon HD 7870 menerima tambahan “GHz Edition” pada namanya, yang menunjukkan bahwa frekuensi ini telah digunakan.

Dari namanya jelas bahwa Radeon HD 7800 lebih produktif daripada HD 7700, tetapi memiliki kecepatan lebih rendah dibandingkan model lama - HD 7900. Sedangkan untuk perbandingan dengan solusi NVIDIA, model lama dirilis HD 7870 pada saat itu rilis bersaing dengan kartu video GeForce GTX 570, dan yang lebih muda ditujukan untuk melawan GTX 560 Ti, dan NVIDIA belum merilis chip kelas menengah 28 nm yang baru.

Kedua model kartu video AMD memiliki memori GDDR5 dengan kapasitas yang sama yaitu 2 gigabyte. Keduanya menggunakan bus memori 256-bit, sehingga dapat dikonfigurasi dengan 1, 2, atau 4 GB. 1 GB terlalu sedikit, dan 4 GB terlalu mahal untuk segmen harga ini. Oleh karena itu, kami dapat mengatakan bahwa volume ideal memori video 2 GB telah dipilih, cukup memadai untuk sebagian besar game, bahkan dalam resolusi tinggi, dan tidak terlalu mahal dari segi biaya.

Sebaliknya, dari sudut pandang konsumen, model HD 7850 dan HD 7870 masih berbeda. Radeon HD 7870 yang lebih lama memiliki konsumsi daya yang lebih tinggi, sehingga memerlukan dua konektor daya 6-pin tambahan, sedangkan HD 7850 hanya puas dengan salah satunya. Kedua papan memiliki desain sistem pendingin slot ganda, tetapi sebagian besar produsen memproduksi papan dengan desain mereka sendiri setidaknya untuk pendingin, atau bahkan papan sirkuit tercetak.

Fitur arsitektur dari keluarga Radeon HD 7800

Di atas dalam teks, kami dengan cermat menjelaskan semua fitur arsitektur Graphics Core Next (GCN) yang baru, jadi kami hanya akan mengulangi yang paling penting saja. Semua GPU baru perusahaan menawarkan kemampuan dan kinerja luar biasa tidak hanya dalam pemrosesan grafis, tetapi juga dalam komputasi non-grafis, termasuk campuran berbagai jenis perhitungan. Selain itu, arsitektur GCN yang baru menawarkan penyederhanaan tugas pengoptimalan kode yang signifikan, pengembangan dan dukungan yang disederhanakan, serta kinerja yang stabil dan dapat diprediksi, serta, secara umum, efisiensi yang cukup tinggi.

Blok dasar arsitektur baru ini adalah blok GCN, dan semua GPU seri Kepulauan Selatan dirakit dari blok tersebut. Perhatikan diagram blok chip Pitcairn:

Diagram menunjukkan prosesor grafis Radeon HD 7870 ("HD 7850 yang "disederhanakan" berbeda darinya dalam beberapa unit yang dinonaktifkan); kita melihat 20 unit komputasi arsitektur GCN. Dalam kasus solusi junior seri Radeon HD 7800, empat di antaranya dinonaktifkan, dan jumlah blok aktif di dalamnya adalah 16. Ini masing-masing setara dengan 1280 dan 1024 prosesor aliran (persis seperti dalam kasus HD 7700 keluarga, hanya saja jumlah bloknya dua kali lebih banyak) . Karena setiap blok GCN berisi empat unit tekstur, jumlah TMU akhir untuk model lama adalah 80 TMU, dan untuk model lebih muda - 64 TMU.

Namun jumlah unit ROP dan pengontrol memori pada HD 7870 dan HD 7850 juga sama, seperti pada solusi lini termuda. Jumlah blok ROP yang tersisa cukup banyak - 32 buah untuk kedua model. Bus memori papan berbasis Pitcairn dikurangi menjadi 256-bit, dirakit dari empat saluran 64-bit. Ini lumayan untuk solusi level ini, meskipun satu setengah kali lebih kecil dari solusi teratas, karena bus memori secara tradisional merupakan hal pertama yang harus dipotong. Ada baiknya penggunaan memori GDDR5 yang cepat memberikan bandwidth yang relatif tinggi yaitu 153 GB/s.

Seperti chip arsitektur GCN lainnya, Pitcairn menggunakan unit tessellator generasi ke-9, yang dilengkapi banyak optimasi buffering dan caching untuk meningkatkan kinerja pemrosesan geometri secara signifikan. Berikut perbandingan board AMD baru dengan solusi generasi sebelumnya dalam masalah sintetis, yang menunjukkan peningkatan kecepatan tessellation hingga empat kali lipat:

Demikian pula, banyak teknologi AMD yang didukung, yang diperkenalkan dan ditingkatkan pada chip video baru dari lini Radeon HD 7000. Berikut daftar lengkapnya: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, peningkatan kualitas pemfilteran tekstur , dll. Semua ini ditulis lebih detail di atas. Mari tambahkan ke daftar bahwa Radeon HD 7800 sepenuhnya mendukung algoritma anti-aliasing MLAA 2.0 yang ditingkatkan dan anti-aliasing super-sampling (SSAA).

Ketika membandingkan kinerja gaming, Radeon HD 7870 secara signifikan lebih cepat dibandingkan pesaing langsungnya, GeForce GTX 570, terutama mengingat kurangnya memori video 1,25 GB pada yang terakhir (dibandingkan dengan 2 GB pada solusi yang ditinjau), diamati dalam game modern pada resolusi rendering tinggi. Radeon HD 7850 yang lebih muda dapat dibandingkan dengan GeForce GTX 560 Ti, dan di sini tidak lagi dapat membanggakan kapasitas memori. Namun menurut pengukuran AMD, solusi baru mereka masih lebih cepat dibandingkan pesaingnya di sebagian besar game.

Detail: Seri Radeon HD 7700

  • Nama kode chip: "Tanjung Verde"
  • Teknologi manufaktur: 28 nm
  • 1,5 miliar transistor (kurang dari Barts, yang merupakan dasar dari seri Radeon HD 6800)
  • Arsitektur terpadu dengan serangkaian prosesor umum untuk pemrosesan aliran berbagai jenis data: simpul, piksel, dll.
  • Dukungan perangkat keras untuk DirectX 11.1, termasuk Shader Model 5.0
  • Frekuensi inti: hingga 1000 MHz (untuk Radeon HD 7770)
  • 10 unit komputasi GCN, termasuk 40 inti SIMD, yang terdiri dari total 640 ALU floating point (format integer dan floating point, dukungan untuk presisi FP32 dan FP64 dalam standar IEEE 754)
  • 40 unit tekstur, dengan dukungan pemfilteran trilinear dan anisotropik untuk semua format tekstur
  • Dukungan terintegrasi hingga enam monitor, termasuk HDMI 1.4a dan DisplayPort 1.2

Spesifikasi kartu grafis Radeon HD 7770

  • Frekuensi inti: 1000 MHz
  • Jumlah prosesor universal: 640
  • Jumlah blok tekstur: 40, blok pencampuran: 16
  • Jenis memori: GDDR5
  • Kapasitas memori: 1 gigabyte
  • Kecepatan pengambilan sampel tekstur teoretis: 40,0 gigatexel per detik.
  • Satu konektor CrossFire
  • bus PCI Express 3.0
  • Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
  • Konsumsi daya: dari 3 hingga 80 W
  • Satu konektor daya 6-pin
  • Desain slot ganda
  • Harga yang disarankan untuk pasar AS: $159

Spesifikasi kartu grafis Radeon HD 7750

  • Frekuensi inti: 800 MHz
  • Jumlah prosesor universal: 512
  • Jumlah blok tekstur: 32, blok pencampuran: 16
  • Frekuensi memori efektif: 4500 MHz (4x1125 MHz)
  • Jenis memori: GDDR5
  • Kapasitas memori: 1 gigabyte
  • Bandwidth memori: 72 gigabyte per detik.
  • Laju pengisian maksimum teoritis: 12,8 gigapiksel per detik.
  • Kecepatan pengambilan sampel tekstur teoretis: 25,6 gigatexel per detik.
  • bus PCI Express 3.0
  • Konektor: DVI Dual Link, HDMI 1.4, satu DisplayPort 1.2
  • Konsumsi daya: dari 3 hingga 55 W
  • Tidak memerlukan daya tambahan
  • Desain slot tunggal
  • Harga yang disarankan untuk pasar AS: $109

Seri kartu video murah berdasarkan arsitektur GCN berbeda dari garis atas dan menengah dengan digit kedua dalam indeks: angka 9 ditempati oleh angka 7, seperti yang terjadi sebelumnya. Radeon HD 7770 adalah solusi yang lebih produktif, tetapi ada juga model yang lebih muda - HD 7750. Papan yang lebih tua pada saat dirilis tidak memiliki pesaing langsung di pasar, terletak di antara GeForce GTX 560 dan GTX 550 Ti , dan yang lebih muda ditujukan untuk melawan GTX 550 Ti. Untuk HD 7770, pesaing kemudian diumumkan dalam bentuk GeForce GTX 560 SE (semua solusi NVIDIA didasarkan pada GPU lama).

Kedua model kartu video AMD yang dimaksud memiliki memori GDDR5 dengan kapasitas yang sama yaitu 1 gigabyte. Karena penggunaan bus memori 128-bit, mereka dapat dilengkapi dengan 2 GB, tetapi memori GDDR5 sebanyak itu akan terlalu mahal untuk segmen harganya. Oleh karena itu, sejauh ini model dengan volume sebesar ini telah dirilis, meski kedepannya tidak menutup kemungkinan akan dirilis varian dengan memori video 2 GB. Untuk saat ini, mereka memutuskan untuk meninggalkan kapasitas tersebut untuk HD 7800.

Dari segi karakteristik konsumen lainnya, model HD 7750 dan HD 7770 cukup berbeda. Jika Radeon HD 7770 lama memiliki desain sistem pendingin dua slot dan pendinginnya dilapisi dengan casing plastik seperti solusi lama, maka HD 7750 yang lebih muda terlihat jauh lebih sederhana, menempati satu slot dan memiliki pendingin sederhana. Namun sebagian besar produsen masih memproduksi papan dengan desainnya sendiri. Konsumsi daya model baru dalam kisaran harga ini juga berbeda, model lama memiliki satu konektor daya tambahan 6-pin, dan model lebih muda menggunakan daya yang diterima melalui PCI Express.

Fitur arsitektur Radeon HD 7700

Blok dasar arsitektur baru ini adalah blok GCN, dan semua GPU dalam seri ini dirakit dari blok tersebut. Setiap blok GCN yang tersedia mampu menjadwalkan dan mendistribusikan perintah itu sendiri, dan satu blok komputasi dapat mengeksekusi hingga 32 thread perintah independen. Mari kita lihat diagram blok chip Cape Verde:

Diagram menunjukkan prosesor grafis Radeon HD 7770 (“HD 7750 yang “dipreteli” memiliki beberapa unit yang dinonaktifkan); kita melihat 10 unit komputasi arsitektur GCN. Dalam kasus solusi junior seri Radeon HD 7700, diputuskan untuk menonaktifkan dua di antaranya, dan jumlah blok menjadi 8. Ini setara dengan 640 dan 512 prosesor aliran. Dan karena setiap blok GCN berisi 4 unit tekstur, jumlah TMU akhir untuk model lama adalah 40 TMU, dan untuk model lebih muda - 32 TMU.

Jumlah unit ROP dan pengontrol memori di HD 7770 dan HD 7750 tidak berbeda, dan mereka memutuskan untuk tidak memotong ROP terlalu banyak, menyisakan masing-masing 16 unit. Namun bus memori Cape Verde dipotong menjadi 128-bit, yang dirakit dari dua saluran 64-bit. Secara umum, ini tiga kali lebih sedikit dibandingkan seri teratas, dan kami melihat konfirmasi lain bahwa bus memori secara tradisional merupakan hal pertama yang harus dipotong pada chip murah. Meskipun penggunaan memori GDDR5 yang cepat memungkinkan untuk mempertahankan bandwidth yang relatif tinggi (untuk solusi murah seperti itu) yaitu 72 GB/s.

Yang perlu kami perhatikan hanyalah jumlah cache tingkat kedua yang cukup besar - sebanyak 512 kilobyte (bandingkan dengan 768 KB untuk chip teratas - tampaknya cache L2 tidak memakan terlalu banyak ruang pada chip), karena serta peningkatan kinerja geometrik. Seperti chip kelas atas, Cape Verde dilengkapi tessellator generasi ke-9 yang menampilkan banyak optimasi buffering dan caching untuk meningkatkan kinerja pemrosesan geometri secara signifikan dibandingkan dengan seri Radeon HD 6000.

Secara umum, kami tidak akan mengulangi semua informasi tentang teknologi AMD yang telah diperkenalkan dan ditingkatkan pada chip video baru dari lini Radeon HD 7000 (berikut daftar lengkapnya: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, peningkatan dalam kualitas pemfilteran tekstur, dll. .p.), semua ini ditulis secara rinci di atas. Seri HD 7700 mendukung semua fitur yang tercantum di sana, termasuk AMD Eyefinity 2.0 dengan enam monitor dan rendering stereo, dan juga memiliki unit decoding dan pengkodean video yang ditingkatkan.

Namun bagaimana dengan hal yang paling penting - performa gaming? Perkiraan pertama kecepatan rendering selalu dapat dibuat dari presentasi pabrikan. AMD percaya bahwa Radeon HD 7770 terletak di tengah-tengah antara GeForce GTX 560 dan GeForce GTX 550 Ti, dan membandingkan materialnya dengan model kedua pesaingnya.

Namun mereka tidak membandingkan Radeon HD 7750 dengan apa pun, hanya mencatat bahwa sebagian besar game modern dapat dimainkan pada model ini pada pengaturan maksimum dalam resolusi FullHD. Namun, hal ini tidak mengherankan, karena dalam beberapa tahun terakhir praktis tidak ada game eksklusif PC, dan game multi-platform tidak terlalu menuntut. Jadi papan seri Radeon HD 7700 sangat cocok untuk pengguna ringan.

Detail: Model Radeon HD 7790

  • Nama kode chip: "Bonaire"
  • Teknologi manufaktur: 28 nm
  • 2,08 miliar transistor (lebih banyak dari Cape Verde di Radeon HD 7700, tetapi lebih sedikit dari Pitcairn di Radeon HD 7800)
  • Arsitektur terpadu dengan serangkaian prosesor umum untuk pemrosesan aliran berbagai jenis data: simpul, piksel, dll.
  • Dukungan perangkat keras untuk DirectX 11.1, termasuk Shader Model 5.0
  • Bus memori 128-bit: dua pengontrol lebar 64-bit yang mendukung memori GDDR5
  • Frekuensi inti: 1000 MHz
  • 14 unit komputasi GCN, termasuk 56 inti SIMD, yang terdiri dari total 896 ALU floating point (format integer dan floating point, dukungan untuk presisi FP32 dan FP64 dalam standar IEEE 754)
  • 56 unit tekstur, dengan dukungan pemfilteran trilinear dan anisotropik untuk semua format tekstur
  • 16 blok ROP dengan dukungan mode antialiasing dengan kemampuan mengambil sampel lebih dari 16 sampel per piksel secara terprogram, termasuk dengan format buffer bingkai FP16 atau FP32. Performa puncak hingga 16 sampel per jam, dan dalam mode Z saja - 64 sampel per jam

Spesifikasi kartu grafis Radeon HD 7790

  • Frekuensi inti: 1000 MHz
  • Jumlah prosesor universal: 896
  • Jumlah blok tekstur: 56, blok pencampuran: 16
  • Jenis memori: GDDR5
  • Kapasitas memori: 1 gigabyte
  • Bandwidth memori: 96 gigabyte per detik.
  • Laju pengisian maksimum teoritis: 16,0 gigapiksel per detik.
  • Kecepatan pengambilan sampel tekstur teoretis: 56,0 gigatexel per detik.
  • Satu konektor CrossFire
  • bus PCI Express 3.0
  • Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
  • Konsumsi daya: dari 3 hingga 85 W
  • Satu konektor daya 6-pin
  • Desain slot ganda
  • MSRP AS: $149

Model kartu video murah, berdasarkan chip anggaran menengah baru, berbeda dari model teratas sebelumnya dari subfamili HD 7700 dengan digit ketiga dalam indeks: alih-alih 7, mereka mencantumkan angka 9, yang menunjukkan peningkatan kinerja . Pada saat yang sama, indeks Radeon HD 7790 dengan jelas menunjukkan bahwa ini adalah kartu video yang kurang bertenaga dibandingkan dengan lini yang satu langkah lebih tinggi - HD 7800.

Namun, semuanya tidak sesederhana itu di sini - ia pasti dapat bersaing dengan HD 7850 yang lebih muda. Namun harga yang direkomendasikan untuk Radeon HD 7790 dipatok pada $149, yaitu kira-kira di tengah-tengah antara harga HD 7770 dan HD 7850. Sedangkan untuk solusi pesaing dari segmen harga yang sama, rilis HD 7790 jelas dimaksudkan untuk bersaing dengan NVIDIA GeForce GTX 650 Ti, berdasarkan chip GK106, yang terletak tepat di antara HD 7770 dan HD 7850 dalam hal harga dan kecepatan. Namun NVIDIA segera merespon perilisan board baru dari AMD tersebut dengan merilis ke pasaran versi overclock dari GeForce GTX 650 Ti Boost yang memiliki performa lebih baik.

Model kartu video AMD ini memiliki memori GDDR5 dengan kapasitas hanya 1 gigabyte. GPU memiliki bus memori 128-bit, dan secara teoritis bisa mencapai 2 GB, tetapi jumlah memori GDDR5 cepat ini masih terlalu mahal untuk segmen harga ini, dan AMD telah merilis model dengan kapasitas lebih kecil, meskipun mungkin tidak demikian. cukup untuk beberapa game modern bahkan pada pengaturan dan resolusi yang tidak tertinggi. Namun, dimungkinkan untuk merilis kartu video dari mitra dengan memori video 2 GB.

Seperti model berikutnya, Radeon HD 7790 memiliki desain sistem pendingin slot ganda yang dilapisi casing plastik. Meski sebagian besar produsen masih merilis motherboard dengan desainnya sendiri yang lebih keren, sehingga referensinya tidak begitu penting. Menariknya, konsumsi daya model baru ini tidak meningkat terlalu banyak dibandingkan HD 7770, namun peningkatan efisiensi energi diharapkan terjadi. Omong-omong, inilah mengapa produk baru ini juga hanya memiliki satu konektor daya tambahan 6-pin.

Fitur arsitektur

Prosesor grafis Bonaire baru, yang menjadi dasar model Radeon HD 7790 yang dirilis, memiliki arsitektur Graphics Core Next (GCN) yang sama yang telah kita kenal selama satu setengah tahun, tetapi AMD menyebutnya GCN 1.1, mengisyaratkan perubahan kecil. Sebenarnya secara arsitektur chip ini bisa dibilang tidak ada bedanya dengan chip sebelumnya, meski memang ada beberapa perubahan kecil. Misalnya, arsitektur baru memperkenalkan instruksi yang berguna untuk arsitektur sistem heterogen (HSA), dukungan untuk sejumlah besar thread yang dijalankan secara bersamaan, serta versi baru teknologi AMD PowerTune, yang akan kita bahas nanti. Namun semua perubahan ini tidak bisa disebut signifikan, karena tidak ada yang baru pada blok dasar dan peningkatan efisiensinya.

Oleh karena itu, Anda dapat merujuk dengan aman, yang dengan cermat menjelaskan semua fitur arsitektur Graphics Core Next (GCN) baru, dan di sini kami hanya akan mengulangi karakteristik dan fitur terpenting dari produk tertentu. Semua GPU terbaru AMD menawarkan kemampuan dan kinerja luar biasa baik dalam komputasi grafis maupun non-grafis, dan perpaduan keduanya. Arsitektur GCN yang baru juga telah menyederhanakan tugas-tugas optimasi dan pengembangan perangkat lunak dengan tetap mempertahankan efisiensi yang tinggi.

Seperti yang Anda ketahui, blok dasar arsitekturnya adalah blok GCN, tempat semua prosesor grafis seri Kepulauan Selatan dirakit. Blok komputasi GCN dibagi menjadi beberapa subbagian, yang masing-masing bekerja berdasarkan alur perintahnya sendiri. Blok GCN memiliki penyimpanan data lokal khusus sebesar 64 KB untuk bertukar data atau memperluas tumpukan register lokal. Blok ini juga memiliki cache tingkat pertama dengan kemampuan baca-tulis dan saluran tekstur lengkap dengan unit pengambilan sampel dan pemfilteran. Masing-masing blok GCN yang ada mampu menjadwalkan dan mendistribusikan perintah itu sendiri, dan satu blok komputasi dapat menjalankan beberapa aliran perintah independen. Mari kita lihat diagram blok chip baru:

Desain Bonaire menegaskan tujuan solusi baru untuk menawarkan kinerja antara Cape Verde, yang memiliki 10 unit komputasi GCN, dan Pitcairn, dengan 20 unit GCN. Kedua GPU ini, yang dirilis pada tahun 2012, berukuran hampir setengah dari satu sama lain, meninggalkan kesenjangan kinerja yang cukup besar di tengah-tengah yang kini telah diisi oleh Bonaire.

Diagram menunjukkan prosesor grafis berupa Radeon HD 7790, yang merupakan solusi lengkap tanpa mengurangi blok apa pun. Chip tersebut mencakup 14 unit komputasi arsitektur GCN, yang setara dengan 896 prosesor aliran. Karena setiap blok GCN berisi 4 unit tekstur, jumlah TMU akhir untuk model baru adalah 56 TMU. Artinya, Bonaire persis 1,4 kali lebih cepat daripada chip Cape Verde dalam hal kecepatan perhitungan matematis dan pengambilan tekstur, dengan asumsi frekuensi yang sama.

Tetapi jumlah unit ROP dan pengontrol memori di Bonaire dan Radeon HD 7790 serupa dengan yang kita lihat di Cape Verde dan Radeon HD 7770 - mereka memutuskan untuk meninggalkan 16 unit ROP, dan bus memori chip baru adalah 128-bit, dirakit dari dua saluran bit 64-bit. Jumlah blok ROP yang sedikit mungkin menjadi “kelemahan” dari solusi tersebut, karena penggunaan memori GDDR5 yang cepat memungkinkan untuk menyediakan bandwidth yang relatif tinggi yaitu 96 GB/s, namun tidak ada yang dapat dilakukan mengenai kinerja ROP.

Namun GPU baru ini memiliki peningkatan dalam kinerja geometris dan kecepatan tesselasi. Ya, Cape Verde juga memiliki tessellator generasi ke-9, tetapi Bonaire juga menggandakan jumlah blok geometris, rasterizer, dan pemroses perintah (ditunjukkan sebagai ACE dalam diagram) - sekarang semuanya ada dua. Peningkatan ini memberi Bonaire kemampuan untuk memproses hingga dua primitif geometris per siklus jam - seperti Pitcairn dan Tahiti yang lebih kuat.

Seperti yang Anda ingat, di Radeon HD 7770 AMD pertama kali mencapai tonggak psikologis penting dari frekuensi clock GPU 1 GHz. Jadi, HD 7790 juga memiliki frekuensi referensi yang persis sama yaitu 1 GHz, sehingga peningkatan kinerja dibandingkan dengan HD 7770 hanya akan dibenarkan oleh perubahan arsitektur dan peningkatan jumlah unit eksekusi.

Namun frekuensi pengoperasian memori video produk baru ini jauh lebih tinggi. Jika HD 7770 memiliki frekuensi memori yang relatif rendah yaitu 4,5 GHz, maka HD 7790 dilengkapi dengan memori GDDR5 cepat yang beroperasi pada 6 GHz, yang menyediakan bandwidth sepertiga lebih banyak. Bandwidth memori video yang meningkat sebesar 33% dibandingkan model subfamili Radeon HD 7700 menghasilkan peningkatan yang jelas dalam performa gaming. AMD memberikan bagan berikut yang membandingkan kecepatan bingkai pada HD 7790 dengan memori yang berjalan pada 4,5 dan 6,0 GHz:

Akselerasi maksimum dari peningkatan bandwidth memori dicapai dalam game seperti StarCraft II dan Crysis 2. Dan rata-rata, peningkatan bandwidth memori sebesar 33% menghasilkan peningkatan rata-rata frame rate sekitar 10% dalam serangkaian game modern. . Ini merupakan indikator yang baik, menunjukkan bahwa bandwidth memori cukup penting saat ini, meskipun bukan satu-satunya fokus pada produktivitas. Meskipun sangat mungkin dengan ROP yang lebih banyak, kecepatan Bonaire akan lebih tinggi lagi...

Jelas terlihat bahwa konsumsi daya rata-rata sedikit meningkat dibandingkan HD 7770. Jika untuk model lama nilainya adalah 80 W, maka untuk HD 7790 adalah 85 W - ini adalah harga yang sangat kecil yang harus dibayar untuk peningkatan kinerja teoritis sebesar 33-40%! Perbaikan arsitektur (PowerTune), perancangan GPU baru menggunakan pengalaman dari yang sebelumnya, serta peningkatan berkelanjutan dari proses teknis di TSMC - semua ini menyebabkan sedikit peningkatan konsumsi dengan peningkatan signifikan dalam karakteristik kecepatan.

Mengenai area chip dan jumlah transistor di Bonaire, chip baru ini jelas lebih besar dari Cape Verde, namun penambahan unit komputasi, tekstur, dan geometri tidak dapat diabaikan. Menurut parameter ini, Bonaire juga terletak kira-kira di tengah-tengah antara Tanjung Verde dan Pitcairn. Bonaire berisi 2,08 miliar transistor dalam chip 160 mm 2, untuk Cape Verde angkanya masing-masing adalah 1,5 miliar dan 123 mm 2, dan untuk Pitcairn - 2,8 miliar transistor dan area chip 212 mm 2.

Tentu saja, chip baru ini mendukung semua teknologi AMD yang diperkenalkan dan ditingkatkan dalam keluarga Radeon HD 7000 baru (daftar tidak lengkap: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, peningkatan kualitas pemfilteran tekstur, dll.), keduanya semua adalah ditulis secara detail di artikel AMD Radeon HD 7970: Pemimpin Prosesor Tunggal Baru. HD 7790 mendukung semua fitur yang tercantum di sana, termasuk AMD Eyefinity 2.0 dengan enam monitor dan rendering stereo, dan juga memiliki unit decoding dan pengkodean video yang ditingkatkan.

Peningkatan teknologi PowerTune

Pada tahun 2010, AMD memperkenalkan teknologi PowerTune dalam chip Cayman-nya (seri AMD Radeon HD 6900). GPU ini adalah yang pertama memiliki fitur manajemen daya dinamis, yang disebut PowerTune. Ini memungkinkan kecepatan clock maksimum yang lebih tinggi untuk aplikasi umum, sekaligus menghindari terlalu banyak konsumsi daya dalam uji stabilitas khusus seperti FurMark. Kemudian teknologi tersebut diterapkan pada model dual-chip AMD Radeon HD 6990, yang semakin membutuhkannya karena alasan yang jelas.

Teknologi ini menerima pembaruan besar pada pertengahan tahun 2012, ketika peningkatan frekuensi otomatis - Boost - ditambahkan ke AMD PowerTune. Pada AMD Radeon HD 7970 GHz Edition, algoritma ini memungkinkan peningkatan kinerja lebih lanjut dibandingkan dengan versi kartu video biasa. Algoritme pengoperasian PowerTune pada kartu video tanpa overclocking otomatis menggunakan tiga status: idle, 3D rendah, dan kecepatan penuh. HD 7970 GHz juga menambahkan mode Boost overclocking. PowerTune berfungsi untuk tetap berada dalam konsumsi yang diperlukan, beralih ke mode beban lebih rendah bila diperlukan. Dalam hal ini, teknologi secara tajam mengurangi frekuensi clock. Dalam praktiknya, lompatan seperti itu jarang terjadi - karena kesenjangan yang besar antara dua mode aktif.

Mengurangi kecepatan jam GPU akan mengurangi konsumsi daya, tetapi untuk kontrol yang lebih efisien, Anda juga perlu mengurangi voltase. Itulah tepatnya yang dilakukan Radeon HD 7790. Chip grafis Bonaire yang baru memiliki delapan status dengan frekuensi dan voltase berbeda, memungkinkan Anda mencapai kecepatan clock lebih tinggi dari sebelumnya, sementara GPU selalu berjalan pada voltase dan frekuensi optimal. Peralihan antar status didasarkan pada beban GPU, serta konsumsi energi chip video saat ini.

Dalam algoritma baru, PowerTune tidak perlu mengatur ulang frekuensi secara tiba-tiba ketika tingkat konsumsi terlampaui, dan seiring dengan frekuensi, tegangan juga menurun. Transisi antar status harus secepat mungkin agar tidak melebihi batas konsumsi bahkan untuk waktu yang singkat, sehingga Bonaire mengganti status PowerTune setiap 10 ms, yaitu status chip berubah 100 kali setiap detik.

Dengan perubahan frekuensi yang konstan, aplikasi pihak ketiga seperti MSI Afterburner dan GPU-Z tidak akan menampilkan nilai kecepatan clock sesaat, tetapi nilai rata-rata selama periode waktu tertentu - yang disebut frekuensi “efektif”. Perkembangan menarik lainnya adalah AMD membuka pengaturan PowerTune baru untuk aplikasi pihak ketiga. Mitra juga dapat mengatur pengaturan PowerTune mereka sendiri, yang akan membantu saat membuat model kartu video yang di-overclock pabrik dan memberikan lebih banyak opsi yang tidak dibatasi oleh nilai referensi AMD. Benar, pengaturan PowerTune yang berbeda dapat mengarah pada fakta bahwa kartu video dengan model yang sama dari produsen yang berbeda tidak hanya memiliki frekuensi clock yang berbeda, tetapi juga algoritma untuk mengubahnya seiring waktu, yang akan mempersulit perbandingan dalam kondisi yang sama.

Penjualan kartu video Radeon HD 7790 di pasaran dimulai pada awal April 2013. AMD, bersama dengan mitranya, mengatur peluncuran motherboard dengan frekuensi referensi dan solusi overclock pabrik. Dan kini kedua pabrikan meluncurkan kartu video baru ke pasar dengan cara yang kurang lebih sama, dengan berbagai pilihan tersedia dengan cepat dari mitra mereka. Faktanya, para mitra merilis versi HD 7790 yang hampir lebih banyak di-overclock daripada versi biasa, dan chip grafis di dalamnya beroperasi pada frekuensi sekitar 1075 MHz.

Detail: Model Radeon HD 7990

  • Nama kode "Malta"
  • Teknologi manufaktur: 28 nm
  • 2 chip dengan masing-masing 4,3 miliar transistor
  • Arsitektur terpadu dengan serangkaian prosesor umum untuk pemrosesan aliran berbagai jenis data: simpul, piksel, dll.
  • Dukungan perangkat keras untuk DirectX 11.1, termasuk Shader Model 5.0
  • Bus memori ganda 384-bit: dua kali enam pengontrol lebar 64-bit dengan dukungan untuk memori GDDR5
  • Frekuensi GPU: 1000MHz
  • Dua kali 32 unit komputasi GCN, masing-masing dengan 128 inti SIMD, yang terdiri dari total 4096 ALU floating point (format integer dan floating point, dukungan untuk presisi FP32 dan FP64 dalam standar IEEE 754)
  • Unit tekstur 2x128, dengan dukungan pemfilteran trilinear dan anisotropik untuk semua format tekstur
  • Unit ROP 2x32 dengan dukungan mode antialiasing dengan kemampuan mengambil sampel lebih dari 16 sampel per piksel secara terprogram, termasuk dengan format buffer bingkai FP16 atau FP32. Performa puncak hingga 64 sampel per jam, dan dalam mode Z saja - 256 sampel per jam
  • Dukungan terintegrasi hingga enam monitor melalui antarmuka HDMI 1.4a dan DisplayPort 1.2

Spesifikasi Kartu Grafis Radeon HD 7990

  • Frekuensi inti: 1000 MHz
  • Jumlah prosesor universal: 4096
  • Jumlah blok tekstur: 2x128, blok pencampuran: 2x32
  • Frekuensi memori efektif: 6000 MHz (4x1500 MHz)
  • Jenis memori: GDDR5
  • Kapasitas memori: 2x3 gigabyte
  • Bandwidth memori: 2x288 gigabyte per detik.
  • Laju pengisian maksimum teoritis: 64 gigapiksel per detik.
  • Kecepatan pengambilan sampel tekstur teoretis: 256 gigatexel per detik.
  • Satu konektor CrossFire
  • bus PCI Express 3.0
  • Konektor: DVI Dual Link, empat Mini-DisplayPort 1.2
  • Konsumsi daya hingga 375 W
  • Dua konektor daya tambahan 8-pin
  • Desain slot ganda
  • Harga yang disarankan untuk Rusia adalah 32.999 rubel. (untuk AS - $999).

Sudah di kartu video AMD generasi kedua, prinsip penamaan model chip ganda tetap tidak berubah. Solusi teratas pada dua chip video yang kuat berbeda dari model generasi sebelumnya sesuai dengan kelasnya pada digit pertama dalam indeks: alih-alih 6, ia menerima angka 7, yang menunjukkan seri baru. Kartu video yang diumumkan berbeda dari solusi chip tunggal pada digit ketiga, yang menunjukkan kinerja maksimum dalam generasi tersebut.

Sebagai perbandingan dengan kompetitor, saingan utama model Radeon HD 7990 yang diumumkan hari ini adalah kartu video GeForce GTX 690, yang dirilis hampir setahun yang lalu, dan solusi dual-chip inilah yang harus bertarung satu sama lain. Benar, NVIDIA juga memiliki solusi kuat lainnya, tetapi berdasarkan pada satu GPU - GeForce GTX Titan, yang juga dapat dianggap sebagai pesaing board tersebut dari AMD.

Kartu video Radeon dual-chip baru dilengkapi dengan memori GDDR5 3 gigabyte untuk setiap GPU, berkat bus memori 384-bit dari chip Tahiti. Volume ini cukup masuk akal untuk produk dengan level tinggi, karena dalam beberapa aplikasi game modern, dengan pengaturan maksimum, anti-aliasing diaktifkan, dan resolusi tinggi, jumlah memori yang lebih kecil (2 gigabyte per chip atau kurang) mungkin tidak lagi diperlukan. cukup. Dan terlebih lagi ketika melakukan rendering dalam mode stereo atau pada beberapa monitor dalam mode Eyefinity.

Jelas bahwa kartu video chip ganda yang kuat memiliki sistem pendingin slot ganda yang sangat besar, yang berbeda dari pendingin tradisional untuk kartu AMD. Ia memiliki radiator besar yang tersembunyi di bawah casing dengan tiga kipas besar yang beroperasi pada kecepatan yang relatif rendah. Konsumsi daya kartu dengan dua GPU terpasang cukup tinggi karena alasan yang jelas, dan memiliki dua konektor daya 8-pin, tapi setidaknya ini bukan tiga, seperti yang terjadi pada sampel non-referensi berdasarkan dua chip Tahiti .

Arsitektur

Karena kartu video, dengan nama kode "Malta", didasarkan pada dua GPU "Tahiti" dari keluarga Kepulauan Selatan, Anda cukup merujuk ke, yang menjelaskan dengan cermat semua fitur arsitektur Graphics Core Next (GCN) saat ini. Dalam bahan dasar kami hanya mengulangi karakteristik dan fitur terpenting dari produk tertentu.

Blok dasar arsitekturnya adalah blok GCN, tempat semua GPU dalam seri ini dirakit. Unit komputasi dibagi menjadi beberapa subbagian, yang masing-masing bekerja pada alur instruksinya sendiri, memiliki penyimpanan data lokal khusus, cache L1 baca-tulis, dan pipeline tekstur lengkap dengan unit pengambilan dan filter. Masing-masing blok GCN mampu menjadwalkan dan mendistribusikan perintah itu sendiri, dan satu blok komputasi dapat menjalankan beberapa aliran perintah independen. Radeon HD 7990 menggunakan dua chip Tahiti yang sudah kita kenal:

Diagram prosesor grafis (ada dua di antaranya di Radeon HD 7990) menunjukkan 32 unit komputasi arsitektur GCN dan semuanya aktif. Sebelumnya, diasumsikan bahwa untuk solusi dua chip perlu menonaktifkan beberapa di antaranya, dan bahkan menurunkan frekuensinya agar dapat memasuki batas konsumsi daya 375 W, namun para insinyur AMD berhasil memecahkan masalah sulit ini. Mungkin revisi baru khusus dari Tahiti dengan konsumsi daya yang lebih rendah telah dirilis, atau chip tersebut hanya menjalani proses seleksi yang sangat ketat.

Karena setiap unit GCN berisi 16 unit tekstur, jumlah TMU adalah 128 unit per chip, yang memberikan performa akhir sebesar 256 gigatexel per detik, yang sangat bagus untuk pesaing GeForce GTX 690. Jumlah unit ROP dan pengontrol memori di HD 7990 juga tidak berubah dibandingkan dengan chip tunggalnya, masing-masing tersisa 32 dan 6 buah per GPU. Radeon HD 7990 memiliki bus memori ganda 384-bit yang terdiri dari dua belas saluran 64-bit, yang menyediakan total bandwidth memori sebesar 576 GB/s - angka yang memecahkan rekor lainnya.

Jika tidak, board baru ini mendukung semua teknologi AMD modern yang diperkenalkan dan ditingkatkan pada chip video baru dari lini Radeon HD 7000: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, peningkatan kualitas pemfilteran tekstur, dll. Semua ini dijelaskan secara rinci di atas dalam deskripsi Radeon HD 7970, dan tidak ada gunanya mengulanginya.

Sistem pendingin dan konsumsi daya

Dalam kasus papan chip ganda yang serius, sistem pendingin yang sangat efisien menjadi sangat penting. Jika dalam kasus solusi dari mitra berbasis dua Tahiti, solusi tiga slot digunakan, dan dalam kasus ASUS ARES II, pendingin air digunakan, dalam hal ini perlu dilakukan dengan lebih sedikit usaha, jadi pendingin dirancang dengan radiator yang sangat besar dan tiga kipas dengan karakteristik akustik yang ditingkatkan.

Tingkat kebisingan sistem pendingin dan suhu yang disediakan untuk GPU adalah beberapa karakteristik konsumen yang paling penting untuk kartu video apa pun, termasuk solusi kelas atas yang ditujukan untuk para penggemar. Sistem pendingin yang terlalu keras atau tidak efektif akan dianggap oleh pembeli sebagai pembelian yang kurang menguntungkan, karena semua faktor lainnya (kurang lebih) sama. Jadi AMD menangani masalah ini dengan sangat serius dalam kasus model Radeon HD 7990, jika dibandingkan dengan solusi terbaik lainnya di pasar. Mari kita lihat karakteristik akustik sistem baru ini:

Diagram menunjukkan tingkat kebisingan dari tiga kartu video berbeda: Radeon HD 7990 dan dua pesaing: GeForce GTX 690 chip ganda dan GTX Titan chip tunggal dari NVIDIA. Selain itu, kebisingan diukur dalam kondisi yang berbeda - dalam mode siaga (Sistem Idle) dan pada beban maksimum menggunakan Furmark. Jika Anda yakin dengan angka yang diberikan oleh AMD, bahkan Titan chip tunggal pun tidak bisa menyamai produk baru mereka dalam hal tingkat kebisingan dari pendinginnya, belum lagi dual-chip GTX 690, yang paling keras dalam perbandingan ini.

Namun apakah performa akustik yang mengesankan tersebut dicapai dengan mengorbankan suhu GPU? Bagan berikut menunjukkan suhu GPU yang diukur pada AMD Radeon HD 7990 dan dua pesaing yang sama. Kali ini, spesialis AMD hanya menggunakan mode beban tinggi saat pengujian di Furmark.

Dan sekali lagi, sumbu koordinat yang “rumit” digunakan dengan titik asal bukan nol. Perbedaan nyata antara 80 dan 82 derajat untuk Radeon HD 7990 dan GTX Titan hampir tidak terlihat, meskipun 87 derajat untuk GTX 690 jelas terlihat lebih buruk. Sekali lagi, kami mencatat bahwa semua pengujian ini dilakukan oleh pemangku kepentingan dan harus melalui verifikasi independen.

Dari segi konsumsi daya, tidak ada hal baru dalam solusi dual-chip, namun ada juga dukungan terhadap teknologi ZeroCore Power yang diumumkan sebelumnya. Teknologi ini membantu mencapai konsumsi daya yang jauh lebih rendah selama mode idle (atau tidur) dengan perangkat tampilan dimatikan. Dalam mode ini, GPU idle hampir sepenuhnya dimatikan dan mengonsumsi kurang dari 5% energi mode penuh, sehingga menonaktifkan sebagian besar unit fungsional. Dan dalam kasus papan dua chip, yang lebih penting lagi adalah bahwa dalam sistem CrossFire, saat merender antarmuka dua dimensi dari sistem operasi, semua GPU kecuali yang utama tidak berfungsi sama sekali. Artinya, dalam kasus Radeon HD 7990, salah satu chip dalam mode 2D akan tertidur lelap dengan konsumsi energi minimal, dan chip kedua akan “tertidur” dalam mode idle PC dalam.

Kartu video AMD Radeon HD 7800 Series ini memiliki frekuensi prosesor 800 megahertz. Performa dan throughput tinggi (153 gigabit per detik) disediakan oleh bus 256-bit. Sistem komputasi memproses data sebesar 1,76 teraflops. Terdapat 16 unit komputasi, dan 64 unit tekstur. Ada dua inti untuk proses komputasi.

Format memori sesuai dengan tanda GDDR5, dan dukungan DirectX versi 11 akan membantu mempercepat interaksi dengan aplikasi sistem operasi. Untuk mengoptimalkan kinerja kartu dengan lebih baik, pembaruan driver perlu dipantau, karena hanya pembaruan tersebut yang dapat sepenuhnya membuka semua kemampuan GPU dan menyediakan akses ke pengaturan yang diperlukan. Driver dasar yang mengidentifikasi kartu video dalam sistem disertakan dengan kartu tersebut, dan versi terbaru dapat dilihat di situs web AMD.
Prosesor grafis AMD Radeon HD 7800 Series ini mendukung teknologi built-in terkini yang memungkinkan Anda menikmati gambar berkualitas tinggi dan halus dalam 60 frame, serta resolusinya bisa mencapai 4096 x 2160 piksel. Hal yang sama berlaku untuk aliran audio, yang memenuhi semua persyaratan modern, menghasilkan suara berkualitas tinggi.

Radeon 7870

Kartu video AMD Radeon HD 7800 Series ini merupakan penerus kuat dari kartu sebelumnya. Ia memiliki gigahertz penuh untuk bekerja dengan prosesor grafis. Performa untuk operasi komputasi jauh lebih tinggi dibandingkan versi sebelumnya - 2,56 teraflops. Ada 20 unit komputasi dan 80 unit tekstur.


Karena ini adalah unggulan dari seri 7800, ia lebih unggul dari saudaranya dalam banyak hal. Dukungan untuk teknologi tessellation telah lama diterapkan pada kartu video dari pabrikan ini, tetapi dalam versi ini dukungan tersebut diambil hingga batasnya. Kini Anda dapat menikmati gambar tiga dimensi yang menakjubkan dalam realisme dan detailnya. Dan anti-aliasing yang ditingkatkan akan membantu menghasilkan gambar yang halus dan menyenangkan.
Dalam parameter lain, perwakilan AMD Radeon HD 7800 Series ini memiliki karakteristik yang sepenuhnya identik dengan kartu video sebelumnya. Kedua kartu tersebut mampu mendukung teknologi 3D baik dalam video maupun game. Dimungkinkan juga untuk menghubungkan beberapa kartu untuk meningkatkan kinerja, tetapi parameter ini mungkin juga bergantung pada kemampuan motherboard.