AMD Radeon VII & NVIDIA TITAN RTX GPUs Review - The Core: TU102
Σε αυτή τη σελίδα θα δούμε τον πλήρη πυρήνα της TITAN RTX που είναι ο TU102.
Tο πλήρες chip που είχαμε δει με τη κυκλοφορία της RTX 2080 στα τέλη του περσυνού καλοκαιριού είναι ο TU102 της NVIDIA, που πρακτικά είναι το δεύτερο μεγαλύτερο της εταιρίας μέχρι σήμερα. Στο εσωτερικό του συναντάμε συνολικά 4608 CUDA πυρήνες, 72 RT cores αποκλειστικά για ray tracing σε πραγματικό χρόνο καθώς και 576 Tensor cores για εφαρμογές και workloads που έχουν να κάνουν με machine learning και deep learning και αφορούν κυρίως εντολές τανυστών. Παράλληλα στη περίμετρο του die ζουν και οι 12 memory controllers εύρους 32-bit έκαστος που επικοινωνούν με τις μνήμες GDDR6 χωρητικότητας 24GB που εφοδιάζεται η εν λόγω GPU. Το μέγεθος της L2 cache ανέρχεται στα 6144 ΚΒ, σημαντικά περισσότερα από τα 4096ΚB της RTX 2080.
Οι τεχνικές της συμπίεσης στη RAM υπάρχουν και εδώ μαζί με όλες τις βελτιώσεις της Turing αρχιτεκτονικής, όπως τα ανασχεδιασμένα streaming multiprocessors που σύμφωνα με την NVIDIA προσφέρουν έως και 50% αυξημένες επιδόσεις αναφερόμενη φυσικά στις εσωτερικές διεργασίες της GPU. Η σημαντικότερη προσθήκη είναι το παράλληλο integer datapath που επιτρέπει τη παράλληλη εκτέλεσή τους με τις εντολές floating point. Η δεύτερη σημαντικότερη προσθήκη είναι αυτή της ενοποιημένης cache που εισήγαγε η εταιρία και αυτό μεταφράζεται σε περίπου διπλάσιο bandwidth ενώ κατά τον ίδιο βαθμό αυξάνεται και η χωρητικότητα της L1 cache. Φυσικά τα στοιχεία που γνωρίσαμε από τις προηγούμενες GPUs της Turing γενιάς υπάρχουν για άλλη μια φορά και έτσι το αρκετά σημαντικό variable shading είναι ένας ακόμη τρόπος που βελτιώνει τις τελικές επιδόσεις πραγματοποιώντας επιλεκτικό rendering σε χαμηλότερη ποιότητα εικόνας με έξυπνο τρόπο που δεν γίνεται αντιληπτός από τον χρήστη. Ένας τομέας όπου χρησιμοποιείται αρκετά αυτό είναι στις VR εφαρμογές όπου το load είναι υψηλότερο αφού η GPU θα πρέπει να κάνει διπλάσιο πρακτικά rendering, ένα για κάθε μάτι.
Τα μεγαλύτερα κέρδη στην Turing αρχιτεκτονική προέρχονται από τον παραλληλισμό αφού έδωσε στα integer blocks του επάνω σχήματος τον δικό τους 'χώρο' σε κάθε SM και τη δυνατότητα για ταυτόχρονη εκτέλεση εντολών με το floating point κομμάτι του chip που πραγματοποιεί το rastarization, μια από τις βασικές λειτουργίες που κάνουν οι κάρτες γραφικών σε μια 3D σκηνή. Το integer performance δείχνει σημαντικό στα πιο πρόσφατα παιχνίδια, ωστόσο το floating point κομμάτι εξακολουθεί και είναι η βασική μέθοδος του rasterization. Για να μας δείξει τις επιπτώσεις των int μονάδων της η NVIDIA μας δείχνει μερικά πρόσφατα παιχνίδια και το instruction pipeline σε καθένα από αυτά. Το Battlefield 1 είναι ένα παράδειγμα ενός τίτλου στον οποίο ίσως δούμε υψηλότερες επιδόσεις σε μια Turing GPU από μια 'αντίστοιχων FP επιδόσεων' αλλά διαφορετικής αρχιτεκτονικής κάρτα γραφικών.
Ray Tracing
Το ray tracing είναι μια ιδιαίτερα απαιτητική διεργασία από επεξεργαστικής ισχύος και έχει να κάνει με το simulation των ακτίδων φωτός σε ένα καρέ μιας 3D εφαρμογής το οποίο πραγματοποιείται για πρώτη φορά σε πραγματικό χρόνο στις Turing κάρτες γραφικών. Για χρόνια η NVIDIA διέθετε σε επαγγελματίες τα κλασικά Iray plugins και την μηχανή OptiX για ray tracing, όμως ένα βασικό μειονέκτημά τους ήταν το υψηλής ποιότητας rendering σε πραγματικό χρόνο το οποίο δεν ήταν μέχρι πρότινος δυνατό. Ακόμη και στις Volta GPUs, το real time ray tracing απουσιάζει στη μονή GPU. Αυτό μας οδηγεί στην Hybrid Rendering Pipeline που θα ενσωματώνουν οι νέες GPUs της NVIDIA. Πρακτικά οι Turing GPUs πραγματοποιούν rasterization και ray tracing τεχνικές εκεί όπου χρειάζεται προσφέροντας έτσι το καλύτερο δυνατό οπτικό αποτέλεσμα, ειδικά εάν το παιχνίδι το υποστηρίζει. Εδώ εντοπίζεται και το μεγαλύτερο μειονέκτημα των GPUs, η υποστήριξη του NVIDIA Ray Tracing σε υπάρχοντα παιχνίδια καθώς και η απουσία του από το DirectX 12 μιας και είναι εντελώς proprietary και θα χρησιμοποιείται απευθείας σε συνεργασία με τον developer με τα εργαλεία που έχει ήδη διαθέσιμα σε αυτούς.
Η ακολουθία που πραγματοποιείται στο ray tracing κομμάτι για τις αντανακλάσεις και τις διαθλάσεις, και του rasterization για το κομμάτι των textures.
Η NVIDIA για άλλη μια χρονιά αναφέρεται εκτενώς στο overclocking των νέων καρτών. Στην γενιά των RTX αναμένεται ακόμη καλύτερο κυρίως λόγω του ισχυρότερου κυκλώματος τροφοδοσίας των Founders Edition που είναι και αυτό στη λίστα των σημαντικών διαφορών από κατασκευαστικής άποψης που έχουν οι κάρτες της NVIDIA. Πέρα από το επιπλέον headroom σε Watt που ισχυρίζεται η NVIDIA έχουμε πιο σταθερό power delivery στον πυρήνα με λιγότερες αποκλίσεις και αυτόματο overclocking. Την ίδια στιγμή βάζοντας δύο axial fans, όπως γίνεται για χρόνια σε πολλές custom GPUs, οι θερμοκρασίες διατηρούνται σε χαμηλά και υγιή επίπεδα επιβραβεύοντας θεωρητικά τους χρήστες με καλύτερα overclocks.
Το SLI μέσω του NVLink interface θα λειτουργεί μόνο μέχρι δύο κάρτες ενώ στην περίπτωση του TU106 πυρήνα και της RTX 2070 δε θα υπάρχει η δυνατότητα αυτή. Έτσι 3-way και 4-way SLI δε θα υπάρξουν στην γενιά των Turing. Το bandwidth αυτής της σύνδεσης θα είναι 25GB/s και αμφίδρομο ενώ σε ένα dual link σενάριο με μια 2080 Ti το bandwidth τετραπλασιάζεται.
Οι έξοδοι εικόνας που υποστηρίζονται αλλά θα διαφέρουν πιθανόν από κάρτα σε κάρτα θα είναι DisplayPort 1.4a που θα μπορεί να οδηγήσει και 8K αναλύσεις στα 60Hz και μέχρι δύο 8K αναλύσεις συνολικά. Παράλληλα θα υπάρξει και μια USB Type-C σύνδεση οπότε αναμένομε ένα κύκλωμα 5V να ζει κάπου στο PCB των καρτών για την λειτουργία της. Η σύνδεση θα μπορεί και αυτή να μεταφέρει εικόνα στην οθόνη μας.
DLSS Antialiasing
Το 2014 είχαμε αναφέρει το τι ακριβώς είναι το antialising, είναι μια τεχνική εξομάλυνσης των ακρών που υπάρχει για δεκαετίες. Δεν είναι η πρώτη φορά που βλέπουμε μια proprietary τεχνική antialising από την NVIDIA μιας και ήδη υπάρχουν αρκετοί developers που αξιοποιούν τεχνικές όπως το TAA (Temporal Antialising) το οποίο λειτουργεί μόνο σε NVIDIA GPUs. Το DLSS υπόσχεται διπλάσιες επιδόσεις σε ανάλυση 4K σε σχέση με το TAA σε παλαιότερης γενιάς hardware όπως την GTX 1080 Ti. Η απόδοση αυξάνεται χάρη στα tensor cores που βρίσκονται στις νέες GPUs τόσο για αυτόν τον σκοπό όσο και για άλλα deep learning tasks. Είναι μια Super Sampling μέθοδος που χρησιμοποιεί AI για να βελτιώσει την ποιότητα εικόνας και λειτουργεί παρόμοια με το SSAA αλλά, με την προθήκη μια εξυπνότερης μεθόδου εκμεταλλευόμενη και τα Tensor Cores των καρτών. Η υποστήριξή του επαφίεται από τους developers και η NVIDIA έχει ήδη ανακοινώσει μερικά games που θα υποστηρίξουν την τεχνική, όμως το μέλλον του δεν είναι δεδομένο. Το DLSS όμως είναι για αρκετούς το σημαντικότερο feature μιας και μπορεί να ωθήσει τις επιδόσεις σε υψηλές αναλύσεις όπως 4K. Στις μετρήσεις της NVIDIA δείχνει πως το DLSS σε μια RTX 2080 Ti μπορεί να γίνει έως και δύο φορές πιο αποδοτικά από μια 1080 Ti με TAA, πάντα σε ανάλυση 4K.
high end, amd, radeon, nvidia, gaming, performance, graphics cards, gpu, review, graphics, tsmc, 7nm , gddr6, Turing , Titan RTX , Radeon VII
GregEl
Πολύ καλό review και πολλές πληροφορίες/γραφήματα. Η Radeon VII σε επιδόσεις και τιμές skroutz είναι μαζί με μια 2080 RTX για DX12, αλλά νομίζω ότι γενικά ίσως είναι λίγο καλύτερα μια 2080. Αναρωτιέμαι τι γίνεται σε linux όταν δεν μπλέκεται το dx12, μιας και το linux gaming ανεβαίνει αρκετά τελευταία και ακούω ότι οι AMD drivers είναι σχετικά σε καλύτερη κατάσταση.
kaRAmeLA
Καλησπέρα. Μου έκανε εντύπωση που τα παιχνίδια ήταν εγκατεστημένα σε σκληρό hdd και όχι σε ssd. Υπάρχει κάποιο σκεπτικό πίσω από αυτό ή απλά έτυχε;
MetallicGR
Καλημέρα. Δεν είναι ξεκάθαρο αλλά είναι M.2 το drive, ωστόσο είναι με το sata πρωτόκολλο οπότε δεν είναι και πολύ γρήγορο. Η αλήθεια είναι ότι επειδή μετράω τα in game benchmarks (και μερικά missions), δεν υπάρχουν 'διάκενα' που μπορεί να κάνουν τη διαφορά σε σχέση με έναν μηχανικό δίσκο.