Intel CPU Roundup: Haswell-E & Devil's Canyon face reality
The story so far...
The story so far...
Σχεδόν κάθε χρόνο έχουμε και από μια νέα γενιά επεξεργαστών, τόσο από την AMD όσο και την Intel. Η δεύτερη, δε, είναι αυτή που έχοντας το μεγαλύτερο μερίδιο στην αγορά αναπόφευκτα έχει και τον έλεγχο των εξελίξεων, ενώ η δύναμή της τόσο σε εργατικό δυναμικό όσο και στα ιδιόκτητα εργοστάσια παραγωγής της δίνει το πλεονέκτημα να σχεδιάζει και να παράγει από μόνη της τους επεξεργαστές που διεκδικούν μια θέση τόσο στο desktop όσο και το server κομμάτι της αγοράς.
Κάθε χρονιά σηματοδοτείται από τις νέες κυκλοφορίες της εταιρίας η οποία εφαρμόζοντας την τακτική "tick-tock". Για όσους δεν γνωρίζουν τι εστί, η Intel προσπαθώντας να κρατήσει "ζωντανό" τον νόμο του Moore, που προέβλεπε διπλάσια transistors σε έναν επεξεργαστή κάθε 18 μήνες, προσπαθεί να εμφανίζει μια νέα και πιο βελτιωμένη αρχιτεκτονική, ενώ αμέσως μετά καταπιάνεται με το πως θα την ενσωματώσει σε μια μικρότερη λιθογραφική μέθοδο. Έτσι, από την απαρχή της νεότερης ονοματολογίας Core ix και την Nehalem αρχιτεκτονική των 45nm, η Intel περίπου κάθε 18 μήνες φροντίζει να κατεβάζει την κλίμακα κατασκευής, φτάνοντας στο 2014 να έχουμε την λιθογραφική μέθοδο των 22nm που προσφέρει η Haswell αρχιτεκτονική.
Δεν μιλάμε όμως με αυθαίρετα στοιχεία. Ας δούμε πως ανταποκριθήκατε το κοινό του HwBox στο κάλεσμα του όταν σας ζητήθηκε για ερευνητικούς σκοπούς να μας απαντήσετε ποια είναι η γενιά επεξεργαστή που διαθέτετε.
CPU marketshare - HwBox 2014 poll results
Τα αποτελέσματα του παραπάνω γραφήματος είναι ιδιαιτέρως αποκαλυπτικά. Εν έτη 2014, μόλις ένα 16% των μελών έχει αναβαθμίσει σε Haswell-based αρχιτεκτονική, την ίδια στιγμή που τα ποσοστά στις τελευταίες πλατφόρμες της AMD παραμένουν λίγο κάτω από το 24%. Το υπόλοιπο 60% της αγοράς διαθέτει παλαιότερης γενιάς επεξεργαστή χωρίς να έχει άμεσο ενδιαφέρον για αναβάθμιση με κύρια αξιοσημείωτα το 16% της 775 πλατφόρμας η οποία έχει σταματήσει από την παραγωγή εδώ και μια 5ετία, ενώ κλείνοντας το marketshare της Intel εμφανίζεται συνολικά στο 65%, με το 35% να έχει επιλέξει την AMD πλατφόρμα.
Citius, altius, fortius
Το καλοκαίρι του 2014 ήταν ιδιαιτέρως θερμό για την "Μεγάλη Μπλε", εφόσον συνοδεύτηκε όχι από μια, αλλά δυο launch νέων επεξεργαστών. Την αρχή στα μέσα του Μαΐου έκανε η αναβάθμιση της mainstream / high end κατηγορίας του socket 1150 με την Z97 πλατφόρμα καθώς και μια σωρεία μητρικών που σας παρουσιάσαμε αναλυτικά μέσα από τις σελίδες του HwBox. Έπειτα, στις αρχές Ιουνίου ξεκίνησε η διάθεση των Devil's Canyon CPUs, με τρεις νέους επεξεργαστές να προστίθενται στην ήδη πληρέστατη Haswell αρχιτεκτονική.
Η "παραμελημένη" enthusiast κατηγορία δεν έμεινε όμως παραπονεμένη. Έτσι, παρελθόν αποτελεί το s2011 και η X79 πλατφόρμα που έμεινε μαζί μας για σχεδόν δυόμιση χρόνια. Ήρθε η ώρα για τους Haswell να ενσωματωθούν στην ισχυρότερη πλατφόρμα της Intel, με τους Haswell-E να είναι οι επεξεργαστές που θα καλύψουν τις ιδιαίτερες απαιτήσεις των enthusiasts, προσφέροντας μας παραπάνω πυρήνες αλλά και άλλα νέα εξίσου ενδιαφέροντα χαρακτηριστικά.
Έως τώρα τηρήσαμε "σιγή ιχθύος" εδώ στο HwBox.gr, ήρθε η ώρα όμως να αποκαλύψουμε τα χαρτιά μας. Μαζέψαμε αρκετά από τα πιο διαδεδομένα CPU της αγοράς και τα αντιπαραβάλλαμε με τους νέους Haswell-E και Devil's Canyon επεξεργαστές, προσπαθώντας να απαντήσουμε στο αιώνιο ερώτημα ενός HwBoxer: "Αξίζει η αναβάθμιση;"
...Η απάντηση δίνεται αναλυτικά στις σελίδες που ακολουθούν. Enjoy!
Haswell-E and X99 platform
Η 29η Αυγούστου 2014 σηματοδότησε και την ανανέωση της αποκαλούμενης Enthusiast πλατφόρμας. Μέχρι τώρα είχαμε το socket 2011 και το X79 ως chipset ελέγχου, σε μία πλατφόρμα που υποστήριζε τους τετραπύρηνους αλλά και εξαπύρηνους Core i7 της Sandy Bridge-E και Ivy Bridge-E αρχιτεκτονικής.
Νέα δεδομένα έχουμε πλέον και σε αυτήν την κατηγορία. Η Intel έδωσε στην κυκλοφορία την νέα enthusiast πλατφόρμα η οποία είναι βασισμένη και αυτή στην Haswell αρχιτεκτονική. Πιο συγκεκριμένα, έχουμε 3 νέους Haswell-E επεξεργαστές, ένα αναβαθμισμένο socket καθώς και ένα νέο chipset ελέγχου.
Στην κυκλοφορία δόθηκαν οι Core i7-5960X, i7-5930K και i7-5820K όλοι τους βασισμένοι στην Haswell αρχιτεκτονική. Ενώ όμως τα τελευταία χρόνια είχαμε τα κατώτερα μοντέλα να φέρουν 4 πυρήνες, σε αυτήν την γενιά η Intel θέλησε να διαφοροποιήσει πλήρως την Enthusiast από την High-end κατηγορία του s1150 η οποία μπορεί να υποστηρίξει το μέγιστο έως 4 πυρήνες. Οι νέοι Haswell-E θα έχουν 6 πυρήνες για τους 5820Κ και 5930Κ, ενώ ο μεγαλύτερος της σειράς 5960Χ θα απολαμβάνει 8 πλήρως ξεκλείδωτους Haswell πυρήνες.
Οι 5820Κ και 5930Κ διαφέρουν και σε άλλα στοιχεία από τον 5960Χ εκτός από τον αριθμό των πυρήνων τους. Έτσι, ενώ ο 5960Χ έχει 20MB κοινής L3 cache, οι υπόλοιποι 2 έχουν μόλις 15ΜΒ. Παράλληλα, 5960Χ και 5930Κ έχουν στην διάθεσή τους 40 PCI Express lanes, την ίδια στιγμή που ο 5820Κ φέρει μόλις 28, περιορίζοντας τις επιλογές σχετικά με την ταχύτητα των PCI Express καρτών: πιο συγκεκριμένα, σε dual-GPU συστήματα τα lanes περιορίζονται σε x16/x8 αντί για x16/16 ενώ σε triple GPU setups οι ταχύτητες λειτουργίας θα είναι οι x8/x8/x8 αντί για x16/x16/x8 των 40 λωρίδων. Αν και δεν έχουν διαπιστωθεί σημαντικές επιπτώσεις στις επιδόσεις των καρτών μεταξύ x16 και x8 mode, τα λιγότερα lanes είναι ένας ανασταλτικός παράγοντας για όσους θέλουν να γεμίσουν τις PCI-e θύρες τους με κάρτες γραφικών.
Η κυκλοφορία των Haswell-Ε πυροδότησε και μια νέα εποχή. Αρχικά, έχουμε ένα νέο chipset ελέγχου με το X99 να αντικαθιστά το X79. Το X99 φέρει το socket 2011-v3 socket το οποίο υποστηρίζει έως 8 πυρήνες των Haswell-E επεξεργαστών. Το νέο socket μπορεί να υποστηρίξει και τους παλαιότερους SB-E και IB-E, αλλά δεν μπορείτε να εγκαταστήσετε τους νέους Haswell-E στις παλαιότερες X79 μητρικές. Συνεχίζοντας, το νέο chipset προσφέρει πλέον εγγενή υποστήριξη σε Thunderbolt συνδεσιμότητα, BCLK overclocking μέσω του X99, αύξηση των SATA θυρών από 6 του Χ79 σε 10 καθώς και τα νέα πρότυπα M.2 και SATA Express για SSD δίσκους.
The DDR4 Era begins
Τέλος, στην νέα αυτήν πλατφόρμα έχουμε και το ντεμπούτο των DDR4 μνημών. Οι νέοι Haswell-E με τον αναβαθμισμένο memory controller που διαθέτουν, υποστηρίζουν αποκλειστικά DDR4 μνήμες μέχρι quad channel διάταξης! Με τις νέες DDR4 RAMs έχουμε υψηλότερο default bandwidth στα 2133MHz βάση του νέου JEDEC πρότυπου. Παράλληλα, οι DDR4 μνήμες κινούνται με βάση 3 βασικούς κανόνες έναντι του παλαιότερου DDR3 προτύπου, κανόνες οι οποίοι είναι οι εξής: 1) Υψηλότερες συχνότητες 2) Χαμηλότερη κατανάλωση (τάση λειτουργίας) 3) Περισσότερη χωρητικότητα.
Για αρχή θα συναντήσουμε DDR4 DIMMs που μπορούν να φτάσουν τα 3000MHz και τα 8GB ανά DIMM, αλλά σε επερχόμενες γενιές θα δούμε ακόμα πιο ταχύτερα ICs και σε χωρητικότητες έως και 16GB ανά DIMM.
Devil's Canyon and Z97: Haswell v2.0
Τι αλλάζει λοιπόν στους Devil's Canyon; Όπως επισημαίνει η Intel, στο σχετικό Press release των νέων επεξεργαστών που δημοσίευσε, υπάρχουν ορισμένες σημαντικές αλλαγές κυρίως για την κατηγορία των overclockers, όπως το βελτιστοποιημένο thermal interface material (TIM) που στην ουσία πρόκειται για την θερμοαγώγιμη πάστα που βρίσκεται μεταξύ του die και του heatspreader (IHS) και η οποία αλλάζει για να προσφέρει χαμηλότερες θερμοκρασίες.
Επιπλέον αυξάνονται οι χρονισμοί στα 4 GHz από 3.5 GHz που ήταν ο 4770K με το boost να σκαρφαλώνει και αυτό στα 4.4GHz έναντι 3.9GHz που βλέπαμε στον 4770K. Μάλιστα, η Intel βρίσκει την ευκαιρία να προωθήσει τον Core i7 4790K, ως "τον πρώτο επεξεργαστή που λειτουργεί στα 4GHz". Επίσης, η εταιρεία επισημαίνει πως οι νέοι επεξεργαστές Devil's Canyon μπορεί να αποτελούν την καλύτερη ευκαιρία να αλλάξετε το 3ετίας Sandy Bridge σύστημά σας καθώς το overclockability έχει βελτιωθεί, αλλά και οι θερμοκρασίες έχουν κατέβει σε πιο ανεκτά επίπεδα.
Για να διατηρηθούν οι εν λόγω χρονισμοί, κρίθηκε αναγκαίο από την Intel να προσθέσει επιπλέον capacitors (πυκνωτές) στην κάτω πλευρά του επεξεργαστή οι οποίοι μεταφέρουν πιο αποδοτικά το ρεύμα στα components του επεξεργαστή. Οι πυκνωτές αυτοί όμως αύξησαν το TDP των επεξεργαστών στα 88 Watt για τον «μεγάλο» Core i7 4790K.
Συνολικά, οι Devil's Canyon της Intel δεν αντιπροσωπεύουν κάτι νέο από πλευράς αρχιτεκτονικής, αφού βασίζονται στην Haswell των 22nm που γνωρίσαμε το 2013, όμως βελτιώνουν σημαντικά τα «αδύνατα σημεία» των Haswell, ενώ εγκαθίστανται κανονικά στο LGA 1150 socket και υποστηρίζονται από όλες τις 9 Series μητρικές αλλά και επιλεγμένες 8 Series μητρικές με ένα απλό BIOS update.
Παράλληλα, είχαμε και 2 νέα chipset ελέγχου όσον αφoρά την LGA 1150 πλατφόρμα. Έτσι, παρελθόν αποτελεί το Z87 και την θέση του έλαβε το Z97. Πρακτικά πρόκειται για το ίδιο chipset σε σχέση με το Z87, μόνο που η Intel προχώρησε σε μερικά μικρά tweaks για την βελτιστοποίηση της απόδοσης ενώ παράλληλα του πρόσθεσε και υποστήριξη για PCI Express M.2 SSDs άλλά και SATA Express, ενώ τέλος υποστηρίζει και εγγενώς τους επερχόμενους Broadwell των 14 νανόμετρων που θα τους συναντήσουμε γύρω στο 2015.
Επιπλέον είχαμε και μια περαιτέρω αποσαφήνιση στα φτηνότερα chipset. Ενώ γνωρίζαμε τα H81, H87 και Β81, πλέον στην 9η σειρά έχουμε στην διάθεσή μας μόλις ένα, το H97. Για το H97 ισχύει ότι γνωρίζαμε και για το H87: καμία (επίσημη) υποστήριξη για overclocking, μόλις μια PCI-e 3.0 θύρα καθώς και έλλειψη για RAID και Intel Smart Response Technology (SRT), όμως προστέθηκε η υποστήριξη για M.2 PCI-e SSDs. Τα παλαιότερα chipset δεν καταργούνται – όμως προορίζονται για φτηνότερα boards και έτσι η έλλειψη χαρακτηριστικών έναντι των Z/H 97 είναι το κύριο σημείο διαφοροποίησής τους.
It's all about efficiency. Αυτός ακριβώς ήταν ο στόχος της Intel με τους Haswell! Λέγοντας efficiency δεν εννοούμε μόνο την ωμή απόδοση του επεξεργαστή, αλλά και την χαμηλή ενεργειακή κατανάλωση, η οποία και αποτελούσε έναν από τους πρωταρχικούς στόχους της Intel στο επερχόμενο tock.
Ουσιαστικά η Intel εφάρμοσε τρεις διαφορετικές "τεχνικές" προκειμένου να μειώσει την κατανάλωση. Το πρώτο που έκανε ήταν να επικεντρωθεί σε στοιχεία της μητρικής και να βελτιώσει την ενεργειακή συμπεριφορά τους (πχ third party controllers, voltage regulation κ.τ.λ). Το δεύτερο ήταν η προσθήκη power gating αλλά και low power modes, πράγμα παραδοσιακό μεν, αποδοτικό δε. Το έξτρα power gating δίνει την δυνατότητα στο power control unit (pcu) να απενεργοποιεί ευκολότερα τα μέρη του πυρήνα που δεν χρησιμοποιούνται. Επιπλέον, η μετάβαση των Haswell μεταξύ διαφορετικών power states πραγματοποιείται 25% γρηγορότερα από ότι στους Ivy Bridge, πράγμα που απελευθερώνει λίγο το pcu και το κάνει αρκετά πιο επιθετικό στην εναλλαγή power states. Να το πούμε πιο πρακτικά; Όταν κάποιοι πυρήνες του επεξεργαστή μπαίνουν σε sleep mode, δεν απαιτούν ρεύμα. Παρόλο που το φαινόμενο αυτό συμβαίνει στιγμιαία (μιλάμε για milliseconds), εν τέλει η ενεργειακή κατανάλωση μειώνεται! Η τρίτη κίνηση του μπλε στρατοπέδου έχει να κάνει με την λιθογραφική μέθοδο των 22nm. Μην ξεχνάτε ότι κάθε Tick είναι μια καινούρια λιθογραφική μέθοδος και κάθε Tock, μια καινούρια αρχιτεκτονική στους επεξεργαστές. Εφόσον τώρα βρισκόμαστε στο Tock, οι Haswell αποτελούν την δεύτερη μικρο-αρχιτεκτονική που εκμεταλλεύεται τα πλεονεκτήματα των 22nm tri-gate transistors. Τα συγκεκριμένα, εκτός του ότι πλεονεκτούν σε "διαστάσεις", πλεονεκτούν και λόγω σχεδιασμού, ερχόμενα με σαφώς μικρότερο leakage σε σχέση με τα παλιότερα 2D planar και και με μεγαλύτερο Gate Delay.
Ας εστιάσουμε τώρα λίγο περισσότερο στην αρχιτεκτονική του Haswell και πιο συγκεκριμένα στο front end. Οι Conroe ήταν οι πρώτοι επεξεργαστές με 4-wide front end, πράγμα που σημαίνει ότι μπορούσαν να καλέσουν και να αποκωδικοποιήσουν παράλληλα μέχρι 4 instructions. Στην περίπτωση των Haswell, το front end παραμένει 4-wide, με την διαφορά ότι φέρει βελτιωμένο branch predictor και hardware prefetcher, βελτιώνοντας έτσι το efficiency. Το stage pipeline έχει παραμείνει 14-19 όπως και στους Sandy Bridge, το ίδιο και οι L1/L2 cache latencies. Επιπλέον και οι Haswell με τη σειρά τους υποστηρίζουν 2-way SMT/Hyper Threading. Αυτά εν ολίγοις για το front end του pipeline. Τι γίνεται όμως με το back end;
Το Out of Οrder Window Buffer Size, από 168 στους Sandy Bridge πλέον έφτασε τα 192. Έτσι τα execution units δύναται να εξάγουν παράλληλα περισσότερες εντολές, με αποτέλεσμα την περαιτέρω αύξηση του single threaded performance.
Από τους Conroe μέχρι και τους Ivy Bridge, η μικροαρχιτεκτονική της Intel υποστήριζε την παράλληλη εκτέλεση μέχρι και έξι micro-ops. Παρόλο που μες στο σύστημα υπάρχουν περισσότερα από έξι execution units, υπάρχουν μόνο έξι ports (port 0 - port 5). Οι τρεις από αυτές τις θύρες χρησιμοποιούνται για memory operations και οι άλλες τρεις για μαθηματικούς υπολογισμούς. Οι Sandy Bridge ήταν οι πρώτοι επεξεργαστές με 256-bit AVX operations (το περίφημο AVX), πράγμα που σήμαινε ότι προσέθεταν επιπλέον execution units, παραμένοντας πάντα όμως σε 6 port αρχιτεκτονική. Επιτέλους αυτό αλλάζει με τους Haswell οι οποίοι και φέρουν δύο ακόμα ports, μία για integer math & branches (port 6) και μία για store address calculation (port 7).
Η άλλη μεγάλη προσθήκη που έγινε στους Haswell, είναι η υποστήριξη Intel AVX2 instructions! Αυτό τι σημαίνει; Περισσότερα SP & DP FLOPs per cycle, προσθήκη του FMA (Fused Multiply-Add), εκ νέου σχεδιασμένα 256-bit FMA units και νέα integer instructions (indexing & hashing, cryptography & endian conversion). Πρακτικά μιλάμε για καλύτερες επιδόσεις σε high performance computing, παιχνίδια και διεργασίες audio/video.
Τι παρατηρούμε από τα παραπάνω; Η Intel αύξησε κατά πολύ την "ιπποδύναμη" των Haswell χωρίς όμως να επιβαρύνει τους νέους επεξεργαστές στον τομέα της κατανάλωσης. Όλα τα νέα units απενεργοποιούνται αυτόματα όταν δεν χρησιμοποιούνται. Με λίγα λόγια: Αν δεν κάνετε δουλειά, το σύστημα δεν καταναλώνει ενέργεια.
Συνεχίζουμε να εμβαθύνουμε περισσότερο στην αρχιτεκτονική των Haswell, κάνοντας μια σύντομη αναφορά και στο Cache Bandwidth, το οποίο και διπλασιάστηκε! Για ποιο λόγο όμως; Εφόσον το peak FP throughput διπλασιάστηκε, η Intel έπρεπε να εξασφαλίσει ότι τα execution units έχουν επαρκές bandwidth στις caches, ώστε οι επιδόσεις να παραμείνουν σε υψηλό επίπεδο. Έτσι λοιπόν έχουμε διπλασιασμό του L1 bandwidth, και του interface μεταξύ των L1 και L2 caches.
Μία από τις μεγαλύτερες διαφορές των Haswell με τις προηγούμενες γενιές επεξεργαστών, είναι η "αποσύνδεση" της L3 Cache. Για να καταλάβετε τι εννοούμε, πάρτε σαν παράδειγμα τους Nehalem. Περιείχαν δύο ξεχωριστά clock domains για την CPU (core + uncore) και ένα off-die intergrated graphics core. Το core clock είχε να κάνει με την συχνότητα λειτουργίας των πυρήνων του επεξεργαστή, ενώ το uncore clock έλεγχε την ταχύτητα της L3 Cache. Με τους Sandy Bridge, η Intel εφάρμοσε ένα καινούριο σκεπτικό. Τα CPU Cores και η L3 Cache έτρεχαν στην ίδια συχνότητα. Απλά τα πράγματα. Το πρόβλημα που υπήρχε τότε, ήταν: Τι θα συνέβαινε αν η GPU χρειαζόταν πρόσβαση στην L3 Cache, όταν το CPU (και κατ' επέκταση η L3 Cache) βρισκόταν σε low frequency state; Η λύση ήταν είτε η CPU και η L3 Cache να αναγκάζονταν να τρέξουν σε μεγαλύτερη ταχύτητα, ή να παραμείνει η L3 Cache σε χαμηλή συχνότητα για να μην ενεργοποιήσει χωρίς λόγο επιπλέον CPU cores. Η τελική λύση στο πρόβλημα αυτό ήρθε με τους Ivy Bridge όπου έφεραν μια μικρή graphics L3 cache, η οποία είχε ανεξάρτητη πρόσβαση στην κύρια L3 cache χωρίς να αυξάνει την ενεργειακή κατανάλωση.
Στην περίπτωση των Haswell λοιπόν, τα τρία clock domains βρίσκονται στο ίδιο die. Όλα τα CPU cores τρέχουν στην ίδια συχνότητα, η on-die GPU τρέχει σε ξεχωριστή συχνότητα και η L3 cache μαζί με το ring bus βρίσκονται σε ανεξάρτητο frequency domain. Έτσι προέκυψε η λεγόμενη "αποσύνδεση" της L3 Cache. Ως συνέπεια των προηγουμένων, στους Haswell, αν η GPU θέτει σε λειτουργία το ring bus για να δώσει/πάρει δεδομένα, δεν αυξάνει ταυτόχρονα και την συχνότητα λειτουργίας του επεξεργαστή. Επιπλέον, το power control unit (pcu) των Haswell έχει την δυνατότητα να κατανέμει δυναμικά το budget όταν είναι power-limited. Όλα λοιπόν έχουν δημιουργηθεί με τέτοιο τρόπο ώστε να εστιάζουν στην μείωση της κατανάλωσης!
Οι TSX instructions αποτελούν ακόμη μία καλοδεχούμενη προσθήκη στο Haswell package. Επιτρέπουν στον developer να μετατοπίσει την περιπλοκότητα των managing locks στον επεξεργαστή. Σε συνδυασμό με το νέο Hardware Lock Elision (XAQUIRE/XRELEASE instructions), οι haswell developers μπορούν να επισημάνουν ένα τμήμα κώδικα στον επεξεργαστή για transactional execution. Κατόπιν ο Haswell θα εκτελέσει τον κώδικα σαν να μην υπήρχαν hardware locks και αν η διαδικασία ολοκληρωθεί απροβλημάτιστα, το CPU θα πραγματοποιήσει τις απαραίτητες εγγραφές στην μνήμη και ο χρήστης θα απολαύσει βελτιωμένο performance. Βελτιώσεις έχουμε και στον τομέα του virtualization, όπου τα guest/host transition times έχουν μειωθεί αισθητά.
Μην αμελήσουμε να αναφέρουμε και την βελτίωση του ενσωματωμένου memory controller (βελτιωμένο write throughput to DRAM).
Κλείνοντας, δεν θα μπορούσαμε να μην πούμε δυο λόγια και για την ενσωματωμένη GPU των Haswell. Ουσιαστικά βασίζεται στην GPU αρχιτεκτονική των Ivy Bridge, φέρει όμως κάποιες βελτιώσεις σε ουσιαστικά σημεία. Όσοι περίμεναν μεγαλεία μάλλον θα απογοητευτούν, μιας και η μεγάλη αλλαγή στο GPU κομμάτι αναμένεται με το λανσάρισμα των Broadwell.
Η Haswell GPU θα γίνει διαθέσιμη σε τρία διαφορετικά configurations, γνωστά με τις ονομασίες GT1, GT2 και GT3. Οι GT3 έρχονται με 40 EUs (execution units), ενώ οι GT2 με 20. Όλες οι εκδόσεις υποστηρίζουν DirectX 11.1, OpenCL 1.2 και OpenGL 4.0. Προς το παρόν, όλοι οι Haswell που θα κυκλοφορήσουν έρχονται με GT2 GPU. Οι πληροφορίες που έχουμε στα χέρια μας την στιγμή που γράφονται αυτές οι γραμμές είναι κάπως περιορισμένες, όμως θα σας ενημερώσουμε σίγουρα με κάποια σχετική είδηση όταν μάθουμε περισσότερα.
Βελτιώσεις συναντάμε και στον τομέα του QuickSync. Hardware support για τον SVC (Scalable Video Coding) codec, hardware motion JPEG decoder, MPEG2 hardware encoder και υποστήριξη 4K video playback!
Cores vs threads: τι να προσέξω;
Αρκετοί από τους σύγχρονους επεξεργαστές διαφημίζουν την ικανότητα τους να λαμβάνουν περισσότερα από ένα νήματα (threads) ταυτόχρονα. Είναι όμως οι τεχνολογίες όπως το Hyper Threading η λύση για ακόμα ταχύτερους επεξεργαστές;
Αρχικά, τι είναι το νήμα; Πρόκειται για το μικρότερο σετ εντολών που δημιουργείται από μια διεργασία (process) και αποστέλλεται στον επεξεργαστή προς επεξεργασία/εκτέλεση, με τον scheduler του λειτουργικού συστήματος να αναλαμβάνει την ανάθεση του νήματος στους πυρήνες. Αυτό το σετ εντολών μπορεί να είναι είτε δεδομένα προς επεξεργασία είτε απλά εντολές για την συνέχεια της εκτέλεσης του προγράμματος.
[/TD]
[/TR]
[/TABLE]
Όσον αφορά το Hyper Threading είναι μια τεχνολογία της Intel η οποία προσπαθεί να αυξήσει το παραγόμενο έργο ενός επεξεργαστή. Για κάθε φυσικό (physical) πυρήνα το λειτουργικό σύστημα απευθύνεται σε δύο λογικούς (logical) πυρήνες και μοιράζει το φόρτο εργασίας μεταξύ τους, όταν είναι δυνατόν. Η κύρια λειτουργία του Hyper Threading είναι να μειώσει τον αριθμό των εξαρτώμενων instructions στο pipeline, εκμεταλλευόμενο την superscalar αρχιτεκτονική (πολλαπλές οδηγίες που λειτουργούν παράλληλα σε ξεχωριστά στοιχεία). Στο λειτουργικό σύστημα κάθε φυσικός πυρήνας εμφανίζεται ως δύο λογικές μονάδες, και έτσι το OS μπορεί να προγραμματίσει δύο διαδικασίες (processes) ταυτόχρονα. Επιπλέον, δύο ή περισσότερες διεργασίες μπορούν να χρησιμοποιήσουν τους ίδιους πόρους. Αν οι πόροι για μια διαδικασία δεν είναι διαθέσιμοι, τότε μπορεί να συνεχιστεί μια άλλη διαδικασία. Το Hyper threading προϋποθέτει όχι μόνο το λειτουργικό σύστημα να υποστηρίζει SMT, αλλά επίσης να είναι βελτιστοποιημένο ειδικά για HTT και η Intel συνιστά την απενεργοποίηση του ΗΤΤ για μη βελτιστοποιημένα λειτουργικά.
Συνεπώς, ποια είναι τα οφέλη; Δεν μπορούν να παράγουν όλες οι διεργασίες/εφαρμογές πολλά νήματα ταυτόχρονα – θα πρέπει να έχει γραφτεί ο κώδικάς τους κατάλληλα για να υποστηρίξει κάτι τέτοιο. Ως επί το πλείστον, μόνο εφαρμογές που παράγουν μεγάλο φόρτο δεδομένων για επεξεργασία (rendering, computational κ.ο.κ) μπορούν να έχουν τα μέγιστα οφέλη. Πάντως, το Hyper Threading δεν διπλασιάζει τις επιδόσεις ενός επεξεργαστή – για την ακρίβεια έχει παρατηρηθεί μια μέγιστη θεωρητική αύξηση που μπορεί να αγγίξει και το 20% και περισσότερο.
About Cache
Η «λανθάνουσα μνήμη» ή ευρέως γνωστή ως cache memory, πρόκειται για ένα είδος μνήμης η οποία πλέον εντοπίζεται ενσωματωμένη στο ίδιο το die ενός επεξεργαστή. Η cache χωρίζεται σε 3 επίπεδα, με το πρώτο (Level 1 – L1) να είναι πιο άμεσα προσβάσιμο καθώς ανατίθεται σε κάθε πυρήνα, το δεύτερο (Level 2 – L2) να ακολουθεί με την ίδια λογική αλλά να έχει ελαφρώς αυξημένη χωρητικότητα, και το τρίτο επίπεδο (Level 3 – L3) να έχει ακόμα μεγαλύτερη χωρητικότητα αλλά συνήθως είναι κοινή για όλους τους πυρήνες του επεξεργαστή.
[/TD]
Ένας επεξεργαστής δεν τραβάει αυθαίρετα τις εντολές προς εκτέλεση – αντίθετα θα πρέπει να τροφοδοτείται συνεχώς με δεδομένα τα οποία υπάρχουν αποθηκευμένα στην μνήμη RAM του συστήματος. Η RAM όμως έχει κάποια φυσική απόσταση ενώ χρησιμοποιεί και έναν δίαυλο (bus) για την μεταφορά των δεδομένων. Κάτι τέτοιο αυξάνει την καθυστέρηση (latency), δημιουργώντας μια κατάσταση με «χαμένους» επεξεργαστικούς κύκλους.
Για την ελάττωση των latencies έρχεται η cache μνήμη. Η cache αποθηκεύει μέρη των πιο πρόσφατων instructions που δημιουργήθηκαν από ένα πρόγραμμα και τα κρατά προσωρινά εκεί, ούτως ώστε όταν επαναζητηθούν οι εντολές, ο επεξεργαστής να μην χρειαστεί να τις «ξανα-τραβήξει» από την RAM του συστήματος. Πως καταφέρνει όμως κάτι με τόσο μικρή χωρητικότητα να αντεπεξέλθει στα τεράστια δεδομένα που αποθηκεύει η RAM;[/TR]
[/TABLE]
Εδώ έρχονται οι branch predictors, οι οποίοι έχοντας στην διάθεσή τους μέρη από τα πιο πρόσφατα instructions που δημιουργήθηκαν από ένα πρόγραμμα, προσπαθούν να «μαντέψουν» την λογική συνέχεια. Βέβαια η μαντεψιά αυτή δεν είναι τυχαία – οι branch predictors πρόκειται για προχωρημένα λογικά κυκλώματα που βασίζονται σε γνωστές αλγοριθμικές μεθόδους για την πρόβλεψη του αποτελέσματος.
Η περισσότερη cache βοηθά στην ταχύτερη επεξεργασία – κάνοντας έναν επεξεργαστή να αποκρίνεται ταχύτερα.Η περισσότερη cache όμως είναι και πιο ακριβή – γιʼ αυτό θα συναντήσουμε περισσότερη στα πιο ακριβά μοντέλα, ή σε επεξεργαστές με περισσότερους πυρήνες.
Instructions per clock και επεξεργαστική ισχύς: Είναι αλληλένδετα;
Συχνά πυκνά ακούμε για επεξεργαστές που έχουν αυξημένο IPC και γιʼ αυτόν τον λόγο αποδίδουν καλύτερα. Είναι όμως αυτός ο καθοριστικός παράγοντας για την συνολική ταχύτητα ενός επεξεργαστή; Ας ξεδιαλύνουμε μερικούς από τους «μύθους» που κυκλοφορούν.
Τι είναι το IPC; Ο ορισμός αναφέρει πως πρόκειται για τον μέσο όρο των εντολών που εκτελούνται σε κάθε κύκλο ρολογιού αριθμό των οδηγιών. Έτσι λοιπόν βάση του ορισμού, το IPC μπορεί να είναι ένας κατά προσέγγιση δείκτης της πιθανής απόδοσης του επεξεργαστή.
Είναι όμως ο καθοριστικός παράγοντας; Φυσικά και όχι, καθότι η ταχύτητα ενός CPU δεν εξαρτάται μόνο από το IPC, και η κύρια αιτία είναι πως δεν είναι μία μόνιμη σταθερά για έναν συγκεκριμένο επεξεργαστή. Αντίθετα, το IPC εξαρτάται από το πώς το συγκεκριμένο λογισμικό που τρέχει αλληλεπιδρά με τον επεξεργαστή, το σύνολο της μηχανής αλλά κυρίως την ιεραρχία της μνήμης. Ωστόσο, ορισμένα χαρακτηριστικά του επεξεργαστή τείνουν να οδηγήσουν σε υψηλότερο από το μέσο όρο των IPC. Η παρουσία πολλαπλών αριθμητικών λογικών μονάδων (Arithmetic Logical Unit – ALU, το υποσύστημα του επεξεργαστή που μπορεί να εκτελέσει αριθμητικές και λογικές πράξεις), καθώς και τα κοντύτερα pipelines. Όταν συγκρίνονται διαφορετικά instruction sets στον ίδιο επεξεργαστή, ένα απλούστερο σύνολο οδηγιών μπορεί να οδηγήσει σε ένα υψηλότερο αριθμό IPC σε αντίθεση με πιο πολύπλοκες εφαρμογές που παράγουν περίπλοκα IS. Ωστόσο, ένα πιο σύνθετο instruction set μπορεί να είναι σε θέση να επιτύχει πιο χρήσιμο έργο, με λιγότερες οδηγίες.
Για ένα δεδομένο επίπεδο των οδηγιών ανά δευτερόλεπτο μπορεί να επιτευχθεί όταν συνδυάζεται ένα υψηλό IPC και χαμηλή ταχύτητα ρολογιού (όπως οι AMD FX-series και Core Series της Intel), ή από ένα χαμηλό IPC και υψηλή ταχύτητα ρολογιού (όπως οι παλαιότεροι Pentium 4, και σε μικρότερο βαθμό οι AMD Bulldozer). Και οι δύο λύσεις είναι έγκυρες, ωστόσο η επιλογή μεταξύ αυτών των δύο υπαγορεύεται από την ιστορία, τους μηχανικούς περιορισμούς, ή ακόμα και… από τις πιέσεις του τμήματος μάρκετινγκ.
Το ωφέλιμο έργο που μπορεί να γίνει σε έναν οποιοδήποτε υπολογιστή εξαρτάται από πολλούς παράγοντες, πέρα από την ταχύτητα ενός επεξεργαστή. Αυτοί οι παράγοντες περιλαμβάνουν την αρχιτεκτονική του επεξεργαστή, την εσωτερική διαρρύθμιση του συστήματος, την ταχύτητα των μονάδων αποθήκευσης ή ακόμα και την ταχύτητα των άλλων συνδεδεμένων συσκευών, την αποτελεσματικότητα του λειτουργικού συστήματος, και τέλος τον προγραμματισμό της εφαρμογής.
C States and Turbo boost
Μια βαθιά παρανόηση που συμβαίνει τα τελευταία χρόνια αφορά την κατανάλωση ενός επεξεργαστή. Όντας συνηθισμένοι από παλαιότερες γενιές επεξεργαστών που διέθεταν σταθερούς χρονισμούς και άρα σταθερή τροφοδοσία ρεύματος, η κατανάλωση τους παρέμενε σε πιο σταθερά επίπεδα ανεξαρτήτως φόρτου. Με στόχο το καλύτερο efficiency, οι κατασκευαστές πλέον έχουν εισάγει καλύτερες τεχνικές εξοικονόμησης ενέργειας με στόχο να λαμβάνουμε το καλύτερο δυνατό από έναν επεξεργαστή, χωρίς να καταναλώνει αυτός πάντα την ίδια ενέργεια. Κοινώς έχουμε πλέον να κάνουμε με πλήρως δυναμικούς / μεταβλητούς χρονισμούς, ανάλογα πάντα με τον υπολογιστικό φόρτο του συστήματος εκείνη την δεδομένη στιγμή.
[/TD]
[/TR]
[/TABLE]
Επιπροσθέτως, τα C states επιτρέπουν ακόμα πιο βαθύτερη εξοικονόμηση ενέργειας, επιτρέποντας στον επεξεργαστή να απενεργοποιήσει πυρήνες (core parking) αφήνοντας ενεργούς μόνο όσους χρειάζονται, ρίχνοντας ακόμα περισσότερο την κατανάλωσή του.
TDP – Not to be confused
Ακόμα μια έννοια που έχει μπερδέψει αρκετό κόσμο, το TDP, το οποίο συχνά πυκνά συνδέεται με την κατανάλωση του. Ποια είναι όμως η πραγματικότητα; Ας πάρουμε τον ορισμό: «Το Thermal Design Power (TDP ή Thermal Design Point), αναφέρεται στο μέγιστο ποσό της θερμότητας που παράγεται από έναν επεξεργαστή, και η οποία απαιτείται από το σύστημα ψύξης να απαχθεί, σε ένα τυπικό σενάριο χρήσης». Έτσι, αντί να προσδιορίζει την απαγωγική δύναμη του επεξεργαστή, το TDP χρησιμεύει ως μια ονομαστική αξία για το σχεδιασμό συστημάτων ψύξης.
Η θεωρία όμως δεν τελειώνει εδώ. «Tο TDP συνήθως δεν είναι η μεγαλύτερη ποσότητα της θερμότητας που θα μπορούσε να δημιουργήσει ένας επεξεργαστής (σ.σ.: μέγιστη ισχύς), αλλά περισσότερο το μέγιστο ποσό της θερμότητας που παράγεται κατά τη εκτέλεση"πραγματικών εφαρμογών."» Με λίγα λόγια, το TDP εξασφαλίζει πως ο υπολογιστής θα είναι σε θέση να χειριστεί ουσιαστικά όλες τις εφαρμογές, χωρίς να υπερβαίνει το θερμικό όριό του.
Που ξεκινάει όμως η σύγχυση; Στο γεγονός πως το TDP μετριέται σε Watt, την ίδια μονάδα με την ισχύ. Οι δύο όμως αυτές έννοιες δεν θα έπρεπε να θεωρούνται ταυτόσημες – αντιθέτως, το Watt είναι κλίμακα μέτρησης της ενέργειας, καθώς τόσο η θερμότητα όσο και η ισχύς είναι δυο διαφορετικές μορφές ενέργειας.
Μια μεγάλη συνιστώσα, ωστόσο, του TDP είναι και η τάση λειτουργίας. Ένα CPU με υψηλό voltage είναι πιο πιθανό να έχει μεγαλύτερο TDP σε σχέση με ένα low-voltage CPU. Επιπλέον, το πυρίτιο και τα tranzistors συχνά θεωρούνται near-to-perfect μετατροπείς της ηλεκτρικής ενέργειας σε θερμότητα. Έτσι, μπορεί εύκολα να γίνει η συνεπαγωγή πως ένα CPU που καταναλώνει περισσότερο μπορεί να παράγει περισσότερη θερμότητα, παρʼ όλα αυτά όμως δεν είναι απαραίτητο να ισχύει σε όλες τις περιπτώσεις. Συνεπώς, το TDP δεν αποτελεί τίποτα περισσότερο από μια ένδειξη για το ποιας κατηγορίας ψύκτρα να αγοράσει ο πιθανός χρήστης ώστε να καλύπτει τις θερμικές απαιτήσεις του επεξεργαστή του.
Methodology
Με στόχο την καλύτερη ενημέρωσή σας, δημιουργήσαμε μια νέα και βελτιωμένη μεθοδολογία όσον αφορά τα CPU review μας.
Στα τεστ που θα δείτε στην συνέχεια, έχουμε εστιάσει στα πιο ενδιαφέροντα σημεία που μπορούν να αξιολογήσουν όσο το δυνατόν πιο σφαιρικά έναν επεξεργαστή. Έτσι, επικεντρωθήκαμε σε 9 κρίσιμες κατηγορίες, οι οποίες είναι οι εξής: Performance, Render, Video Conversion, iGPU Performance, Productivity, Overall System Performance, Memory Performance. Tα benchmarks που χρησιμοποιήθηκαν μπορείτε να τα δείτε παρακάτω:
- Performance: Winrar, Super Pi Mod 1.5 1M + 32M, wPrime 32MTrueCrypt, HwBot Prime
- Render: Cinebench R11.5 + R15, POV-Ray, Luxmark, Euler 3d, FryRender
- Video Conversion:x264 Encode, Handbrake, MediaSpresso
- iGPU Performance:3D Mark 11 Performance + Cloudgate, LuxMark, Compubench, MediaSpresso
- Productivity: Excel Benchmark, Photoshop Benchmark
- System Performance: FutureMark PCMark 7, PCMark 8
- Memory Performance:AIDA64
Settings
Για τις μετρήσεις μας, πραγματοποιήσαμε 3 σετ δοκιμών για κάθε benchmark και κάθε επεξεργαστή. Έτσι έχουμε 3 διαφορετικές καταστάσεις λειτουργίας: Stock / Default με τον επεξεργαστή να τίθεται στις default ρυθμίσεις της μητρικής εκμεταλλευόμενος τις Turbo Boost δυνατότητές του. Mild OC, όπου με ελαφριά αύξηση της τάσης του πετύχαμε την μέγιστη δυνατή συχνότητα και τέλος Maximum OC όπου επιχειρήσαμε να βρούμε τα όρια του εκάστοτε επεξεργαστή τόσο από άποψης τάσης όσο και συχνότητας. Τέλος, για όλες τις DDR3 πλατφόρμες χρησιμοποιήσαμε σταθερό divider κλειδωμένο στα 1866MHz με timings 11-12-12-30 2T. Παρακάτω παρουσιάζονται αναλυτικά τα συστήματα αξιολόγησης.
Αξιολόγηση
Για κάθε επεξεργαστή βασιζόμαστε σε 4 κατηγορίες όπου βαθμολογούμε με κλίμακα από 1.0 έως 10.0. Οι 4 κατηγορίες είναι οι εξής: Spec, Performance, Overclocking, Price. Στην τελική βαθμολογία οι 4 κατηγορίες μετράνε ισοβαρώς, κατά 25% έκαστη.
Performance Assessment
Σε αυτό το κομμάτι αξιολογούμε την συνολική απόδοση ενός επεξεργαστή σε διάφορα all-around φορτία.
Winrar
Η πλειοψηφία των χρηστών το έχει εγκατεστημένο και το χρησιμοποιεί, αλλά ελάχιστοι γνωρίζουν για το ενσωματωμένο benchmark το οποίο διαθέτει. Ο λόγος για το WinRAR, το δημοφιλέστατο πρόγραμμα συμπίεσης αρχείων, το οποίο ξεχώρισε χάρη στην ευκολία χρήσης και τις επιδόσεις του, ενώ μας δίνει και έναν πολύ καλό τρόπο για να συγκρίνουμε τις επιδόσεις των επεξεργαστών μας, εφόσον το benchmark που περιλαμβάνει, εκμεταλλεύεται στο έπακρο την ισχύ των σύγχρονων CPU και των πολλαπλών πυρήνων τους. Το Benchmark & Hardware Test του WinRAR μετράει πόσα είναι τα μέγιστα KB/s που μπορεί να συμπιέσει ο υπολογιστής μας. Για να προσαρμόσουμε το WinRAR σε πιο real life συνθήκες, μαζέψαμε φωτογραφίες συνολικής χωρητικότητας 1GB και τις συμπιέσαμε χρησιμοποιώντας το Best compression method - χρονομετρώντας πόσο χρόνο χρειάστηκε το PC.
Ξεκινάμε με το πρώτο μας benchmark, με το πιο δημοφιλές πρόγραμμα αποσυμπίεσης να δίνει ήδη την πρώτη εικόνα για το που κυμαίνεται η απόδοση κάθε επεξεργαστή.
Τα πράγματα είναι ξεκάθαρα από την αρχή: "Ρίχνοντας" περισσότερους πυρήνες, αποκτάμε και αυτόματα περισσότερη απόδοση. Συνεπώς, ο Core i7 5960X ήδη βρίσκεται σχεδόν σε δική του κατηγορία, την ίδια στιγμή που οι προηγούμενης γενιάς Ivy Bridge-E ακολουθούν αλλά με σημαντική απόσταση.
Στην κατηγορία των τετραπύρηνων παρατηρούμε πως όσοι έχουν στην διάθεσή τους περισσότερη cache και Hyper Threading αποδίδουν γύρω στο 25& παραπάνω σε σχέση με τα τυπικά 4c/4t κομμάτια.
Ο Pentium G3258 βρίσκεται στο τέλος της λίστας, ξεκάθαρα λόγω έλλειψης πυρήνων.
SuperPi Mod v1.5
Το γνωστό σε όλους μας SuperPi είναι το benchmark που χρησιμοποιείται κατά κόρον από τους overclockers του HwBot.org. Το πρόγραμμα μετράει το «π» (υπολογισμοί του π) δηλαδή την αναλογία της περιφέρειας ενός κύκλου προς τη διάμετρό του που είναι 3.14. Το πρόγραμμα εμφανίζει τα αποτελέσματα σε miliseconds (1.5 mod) και γενικά όσο πιο γρήγορα το ολοκληρώσει, τόσο ταχύτερος είναι ο υπολογιστής. Χρησιμοποιεί κατά κύριο λόγο τον επεξεργαστή του συστήματος αλλά και τις RAM. Για να διαγνώσετε θέματα με τις RAM, αρκεί να τρέξετε το 32M επιλέγοντάς το από τις ρυθμίσεις του. Οι 32 εκατομμύρια υπολογισμοί είναι ικανοί να αξιολογήσουν τον IMC και τις RAM.
Σε ένα benchmark που βασίζεται στο single threaded performance και ευνοεί αρκετά το μεγαλύτερο IPC παρά τους πυρήνες, ο 4790Κ με τους υψηλούς χρονισμούς του αλλά και το IPC του βρίσκεται στην κορυφή των αποτελεσμάτων. Το χαμηλότερο IPC των i7 940 είναι ικανό να τον ρίξει στην τελευταία θέση, με τον Pentium G3258 να αφήνει έναν αρκετά πιο δυνατό επεξεργαστή πίσω του. Τέλος βλέπουμε πως οι περισσότεροι πυρήνες δεν βοηθούν κανέναν από τους εξαπύρηνους και τον οκταπύρηνο 5960Χ.
wPrime
Φτάσαμε στο multi-threaded wPrime (Measure Computer Performance | wPrime Multithreaded Benchmark) σιγά-σιγά. Εδώ τα πράγματα γίνονται αρκετά περίπλοκα. Το wPrime χρησιμοποιεί μία παρόμοια προσέγγιση με την μέθοδο του Νεύτωνα προκειμένου να υπολογίζει συναρτήσεις. Έτσι έχουμε την f(x) = x^2 - k (όπου k είναι ο αριθμός που τετραγωνίζουμε), μέχρι η Sgn[f(x)-f'(x)] να μην επαναλαμβάνεται πια, ξεκινώντας ξανά τον υπολογισμό της συνάρτησης με το k/2. Από 'κει και πέρα το πρόγραμμα επικαλείται ξανά την επανάληψη της ίδιας μεθόδου για ένα συγκεκριμένο αριθμό επαναλήψεων έτσι ώστε να αυξηθεί στο μέγιστο η ακρίβεια του τελικού αποτελέσματος (μία εναλλακτική μέθοδος επαλήθευσης). Στο τελικό στάδιο πράξεων, το πρόγραμμα επιβεβαιώνει ότι ισχύει η ισότητα n(k)^2 = k έτσι ώστε να είναι 100% σίγουρο για το αποτέλεσμα. Η διαδικασία αυτή επαληθεύεται ανάλογα με το νήμα που θα επιλέξει ο χρήστης. Στην overclocking community όταν πρόκειται ο overclocker να τρέξει το 32M Test επιλέγει σαν αριθμό threads το 2, ενώ στο 1024M Test το 4.
Πλήρης αντιστροφή του σκηνικού στο wPrime. Τα 16 νήματα που μπορεί να προσφέρει ο 5960Χ είναι ικανά να υπολογίσουν 32 εκατομμύρια ψηφία του Π σε 3.2 δευτερόλεπτα, σχεδόν υποδιπλάσια από ότι τους λοιπούς τετραπύρηνους.
TrueCrypt
Το γνωστό encryption software μπορεί να αποδειχθεί ιδιαιτέρως απαιτητικό. Το ενσωματωμένο benchmark μας παρουσιάζει την ταχύτητα αποκρυπτογράφησης ενός κρυπτογραφημένου στοιχείου κατά την AES κωδικοποίηση, με το ποσό να μεταφράζεται σε bytes per second.
Η ωμή επεξεργαστική δύναμη του 5960Χ δείχνει τα πρώτα σημάδια του πόσο ωφέλιμοι είναι οι περισσότεροι πυρήνες σε number-crunching διεργασίες, ενώ ταυτόχρονα βλέπουμε πως το overclocking κατά 1 περίπου GHz "εκτοξεύει" τις επιδόσεις. Από κει και πέρα, το scaling των πυρήνων φαίνεται πως λειτουργεί αρκετά σωστά σε αυτό το benchmark, την ίδια στιγμή που ο 940 δείχνει την ηλικία του και ο G3258 την "λιγοστή" επεξεργαστική του δύναμη.
HwBot Prime
Το συγκεκριμένο benchmark χρησιμοποιεί την Java που έχετε εγκατεστημένη στο σύστημά σας για να μετρήσει τα "primes" per second (pps). Όσο πιο μεγάλο είναι το νούμερο, τόσο ταχύτερος είναι ο υπολογιστής. Στην συγκεκριμένη έκδοση, κρίσιμο ρόλο παίζει η συχνότητα του επεξεργαστή, όσο ψηλότερη, τόσο μεγαλύτερο αποτέλεσμα θα μας δώσει το πρόγραμμα. Επίσης χρησιμοποιείται για ανταγωνιστικούς σκοπούς στη βάση δεδομένων overclocking HwBot.org.
Στο τελευταίο performance test τα πράγματα επιστρέφουν στην φυσιολογική τους ροή. Αυτήν την φορά βλέπουμε πως οι νεότερες αρχιτεκτονικές είναι ένα σκαλί πιο γρήγορες σε σχέση με το άμεσο παρελθόν.
Impressions
Ήδη η πρώτη σειρά των benchmarks μας δίνει την πρώτη εικόνα - ο 5960Χ ξεχωρίζει με την απόλυτη ταχύτητά του, ενώ ο ο 4790Κ μας δείχνει πως η Haswell αρχιτεκτονική είναι ελαφρώς πιο γρήγορη - αλλά όχι με διαφορές που ξεχωρίζουν.
Rendering Assessment
Η απόδοση ενός CPU σε βαριά workloads μας απασχολεί σε αυτόν τον τομέα.
Cinebench
Το CINEBENCH είναι μία σειρά real-world tests τα οποία υπολογίζουν συγκεντρωτικά τις επιδόσεις του υπολογιστή σας. Βασίζεται στο animation software CINEMA 4D (σχεδιασμένο από την award-winning MAXON), που χρησιμοποιείται εκτεταμένα από studios και εταιρείες παραγωγής παγκοσμίως για να δημιουργείται περιεχόμενο 3D. Προγράμματα της MAXON συμμετείχαν στην προσπάθεια δημιουργίας κινηματογραφικών ταινιών που έσπασαν τα ταμία όπως τα: Spider Man, Star Wars, The Chronicles of Narnia και πολλά άλλα. Καταλαβαίνεται λοιπόν το κύρος που έχει σαν πρόγραμμα το CINEBNECH.
Ο επεξεργαστής και η κάρτα γραφικών παίζουν καθοριστικό ρόλο στο τελικό score που θα πάρετε. Είναι από τα λίγα benchmarks που δύναται να χρησιμοποιήσουν μέχρι και 64 processor threads, προκειμένου να μετρήσουν τα 2.000 αντικείμενα και 300.000 συνολικά πολύγωνα του CPU test scene. Τα εφέ που στρατολογήθηκαν για να κάνουν τον επεξεργαστή σας να υποφέρει στο test αυτό περιλαμβάνουν sharp και blurred reflections, area lights και shadows, procedural shaders, antialising και πολλά ακόμα.
Το Cinebench ξεκαθαρίζει ακόμα περισσότερο το τοπίο. Οι περισσότεροι πυρήνες φέρνουν την ζυγαριά υπέρ των CPU με τους περισσότερους πυρήνες και το Hyper Threading. Το πως "στοιβάζονται" τα CPU της δοκιμής μας είναι μια ενδεικτική εικόνα το για το ποιες είναι οι πραγματικές δυνατότητες των 12 αυτών επεξεργαστών σε heavy - workloads.
POV-Ray
Ένα από τα πιο γνωστά Rendering λογισμικά διαθέτει και ενσωματωμένο benchmark script. Όντας ένα από τα πιο διαδεδομένα ray-tracing software που κυκλοφορεί, το POV-Ray είναι ικανό να εκμεταλλευτεί όλους τους διαθέσιμους πυρήνες του συστήματος και τις ALU τους για τον πολύπλοκο υπολογισμών της κίνησης των φωτονίων και της διάχυσης του φωτός στο περιβάλλον. Το ενσωματωμένο script δημιουργεί ένα προκαθορισμένο αντικείμενο και στόχος μας είναι ο χρόνος ολοκλήρωσης του. Είναι μια εφαρμογή που σίγουρα ευνοεί τους περισσότερους πυρήνες.
Μία από τα ίδια και στο POV-RAY - ο 5960Χ χρειάζεται ακριβώς τον μισό χρόνο για να ολοκληρώσει το rendering σε σχέση με τον τετραπύρηνο 4790Κ.
LuxMark
To αρκετά δημοφιλές benchmark έχει την ικανότητα να δημιουργεί φωτορεαλιστικά renders με τις πιο γνωστές τεχνικές, όπως το ray-tracing. Το LuxMark είναι ένα πλήρως multithreaded benchmark, ενώ μπορεί να υποστηρίξει τόσο CPU όσο και GPU accelleration. Στην συγκεκριμένη περίπτωση, το LuxBall HDR που χρησιμοποιήθηκε, ενώ οι παράγοντες που καθορίζουν το τελικό σκορ είναι τόσο ο χρόνος εκτέλεσης όσο και ο αριθμός δειγμάτων ανά δευτερόλεπτο.
Euler3D
FryRender
Impressions
LuxMark, Euler3d και FryRender διατηρούν την ίδια εικόνα που σχηματίσαμε από τα πρώτα rendering tests. Πάντως οι επιδόσεις των λοιπών τετραπύρηνων είναι αρκετά αποδεκτές, ενώ το overclocking μπορεί να βοηθήσει σε περαιτέρω βελτίωση των αποτελεσμάτων, με το πιο εντυπωσιακό αποτέλεσμα να παραδίδεται από τον G3258 που βελτίωσε κατά σχεδόν 3 λεπτά τον χρόνο του - αλλά και πάλι αποδεικνύεται αργός για οποιοδήποτε rendering workload.
Video Conversion Assessment
Ένας επεξεργαστής κρίνεται από την ταχύτητα μετατροπής βίντεο σε διαφορετικά formats. Χρησιμοποιήσαμε το γνωστό Big Buck Bunny clip διάρκειας 10 λεπτών για να το μετατρέψουμε σε μερικά διαφορετικά φορμά.
x264 Encode
Αυτό το πρόγραμμα μπορείτε να το βρείτε εδώ και διαθέτει ένα default αρχείο το οποίο το περνάει από δύο περάσματα, κάνοντάς το εκείνη την ώρα encode σε 720p video. Ο λόγος για τον οποίο εκτελεί δύο περάσματα, είναι επειδή δίνουν ένα καλύτερο αποτέλεσμα σε ποιότητα, εφόσον το πρώτο σκανάρει την ταινία για να κάνει μια ανάλυση, ώστε το δεύτερο πέρασμα να βρει τα σημεία που χρειάζονται περισσότερη προσοχή στη λεπτομέρεια και το αρχείο μας τελικά να έχει τη μέγιστη δυνατή ποιότητα, για τη συμπίεση που επιλέξαμε.
Αρκετά bold η δήλωση που έχει να κάνει ο 5960Χ όσον αφορά τις επιδόσεις του στην μετατροπή βίντεο. Δεν αλλάζει κάτι σε αυτά που γνωρίζαμε - ακολουθούν οι 6-πύρηνοι IB-E και ύστερα όλα τα υπόλοιπα τετραπύρηνα CPU.
Handbrake
Το Handbrake είναι ένα πρόγραμμα μετατροπής βίντεο. Φτιαγμένο για να χρησιμοποιεί όσο το δυνατόν περισσότερους πυρήνες, το Handbrake μετατρέπει ταχύτατα το βίντεο της πηγής σε πολυπύρηνα συστήματα. Ο βολικός counter στο κάτω μέρος του, μας βοηθά να κρατήσουμε "σκορ" από κάθε CPU.
MediaSpresso 6.5
Το MediaEspresso είναι ένα ολοκληρωμένο πρόγραμμα μετατροπής βίντεο. Μπορεί να χρησιμοποιήσει την κάρτα γραφικών και τον επεξεργαστή του συστήματος, προς αύξηση των επιδόσεων ενώ διαθέτει πληθώρα από έτοιμα preset με δημοφιλείς συσκευές για να εξάγετε το αρχείο σας. Διαθέτει όμορφο και "καθαρό" περιβάλλον και είναι γενικά εύκολο στην χρήση, με το μόνο αρνητικό, το γεγονός ότι είναι paid.
To MediaSpresso δεν δείχνει να εκμεταλλεύεται στο 100% τους πυρήνες μας - έτσι οι διαφορές για την μετατροπή ενός 10-λεπτου HD Video σε iPhone format δεν έχει εξόφθαλμες διαφορές σε σχέση με τα προηγούμενα benchmarks.
Impressions
Ασχολείστε με video rendering; Οι περισσότεροι πυρήνες είναι η καλύτερη επιλογή που έχετε να κάνετε όταν ασχολείστε με μεγάλης διάρκειας project. Στον αντίποδα, οι τετραπύρηνοι μπορούν να αποδειχθούν μια χαρά εαν η μετατροπή βίντεο είναι μια σπάνια υπόθεση για τον οικιακό χρήστη,
iGPU Performance Assessment
Η ενσωματωμένη κάρτα γραφικών έχει και αυτή την δική της βαρύτητα. Συμμετέχουν μόνο όσα CPU έχουν ενσωματωμένη κάρτα γραφικών που να υποστηρίζει τουλάχιστον DX11.
3D Mark 11, Cloudgate
To 3DMark11 είναι η τελευταία έκδοση της πασίγνωστης Futuremark 3DMark suite. Επηρεάζεται κατά συντριπτικό ποσοστό από την κάρτα γραφικών και εκμεταλλεύεται features τελευταίας τεχνολογίας όπως DirectX 11, tesselation, compute shaders και multi-threading. Τα Graphics Test περιλαμβάνουν πολυάριθμες αντανακλάσεις, έξυπνο φωτισμό με πληθώρα shadow casting lights, βαρύ tesselations και physics simulation με πολλά αντικείμενα. Αντιπροσωπεύει μία σίγουρη λύση για να δοκιμάσετε αν αντέχει η κάρτα γραφικών σας στις overclocked συχνότητες που καταλήξατε, καθώς μπορεί να μην φτάνει σε load το Furmark ή το MSI Kombustor, αλλά στο Extreme Preset είναι ιδιαίτερα απαιτητικό. Έπειτα έχετε κατά νου ότι το load των Furmark και MSI Kombustor είναι απλησίαστο ακόμα και στα πιο βαριά games, οπότε είναι αμαρτία να ζορίζετε την VGA σας χωρίς λόγο.
Τα πρώτα δείγματα των ενσωματωμένων GPU μας δείχνουν πως όσον αφορά τα 3D Graphics, οι HD 4600 υπερτερούν έναντι των HD 4000 των IB. Στο άλλο άκρο, ο G3258 δείχνει να ενσωματώνει μια DX11 capable μεν, αλλά αδύναμη GPU.
Luxmark
Compubench
Στα συνθετικά benchmarks η κατάσταση δεν αλλάζει - οι HD 4600 έχουν ξεκάθαρο προβάδισμα έναντι του ανταγωνισμού.
Mediaspresso
Η μετατροπή βίντεο είναι ένα μεγάλο χαρακτηριστικό που έχουν να επιδείξουν όλες οι ενσωματωμένες κάρτες γραφικών. Το Quicksync της Intel μπορεί να μην προσφέρει την βέλτιστη ποιότητα, αλλά δηλώνει ξεκάθαρα πως είναι Τα-χύ-τα-τη! Είναι χαρακτηριστικό πως η μετατροπή με GPU acceleration στους Haswell-E διήρκεσε λιγότερο σε σχέση με τoυς 8 πυρήνες του 5960Χ, ενώ σε όλες τις περιπτώσεις τα αποτελέσματα ήταν σημαντικά βελτιωμένα.
Impressions
Θέλετε μετατροπή βίντεο στο σπίτι; Προτιμήστε προγράμματα που εκμεταλλεύονται το Quicksync και θα δικαιωθείτε. Δεν ασχοληθήκαμε ιδιαίτερα με τις πραγματικές επιδόσεις σε παιχνίδια - καθότι οι περισσότεροι από αυτούς τους επεξεργαστές σχεδιάζονται να συνοδευτούν από κάποια ξεχωριστή κάρτα γραφικών - αλλά θα το απαντήσουμε σε επερχόμενο συγκριτικό.
Productivity Assessment
Μερικές real-life εφαρμογές μας δίνουν απαντήσεις όσον αφορά την χρησιμότητα ενός επεξεργαστή
σε ρεαλιστικά workloads.
Excel Bench
Το Excel benchmark αναλαμβάνει να μετρήσει το πόσο γρήγορα μπορεί ο επεξεργαστής να φέρει εις πέρας πολύπλοκες λειτουργίες διαπραγμάτευσης, παρουσιάζοντας το performance σε 6 Excel/VBA tests κάθε ένα από τα οποία έχει τον δικό του ξεχωριστό ρόλο. Έτσι λοιπόν το Test 1 μετρά τον χρόνο που χρειάζεται ο CPU για να δημιουργήσει 5 στήλες * 65535 γραμμές με τυχαία δεδομένα αλλαγής τιμών, ενώ το Test 2, μετρά τον χρόνο που χρειάζεται η VBA για να λογαριάσει τον δείκτη MACD για τα παραπάνω δεδομένα. Στο test 3 καταμετρείται ο μέγιστος αριθμός ticks (αλλαγές τιμών) που μπορούν να παρουσιαστούν σε 30 δευτερόλεπτα. Να σημειωθεί ότι το test 3 ήταν γρηγορότερο στο Excel 2003 και πιο αργό στα Excel 2007/2010, για αυτό το λόγο ο δημιουργός του benchmark το περιόρισε στα 30 δευτερόλεπτα. Αφού έχουν γίνει 63.000 αλλαγές τιμών, το Test 4 αναλαμβάνει να μετατρέψει τα δεδομένα tick σε δεδομένα OHLC. Το 5ο Test ξεκινά με 5.000 μπάρες OHLC δεδομένων και μία σειρά formula-based δεικτών. Η τελική τιμή αλλάζει στο κελί Ε5000 όσο το δυνατόν πιο γρήγορα, περιμένοντας κατόπιν όλες τις formulas να τελειώσουν τον υπολογισμό σε κάθε αλλαγή τιμής. Ως συνέπεια του προηγουμένου, το αποτέλεσμα του 5ου test αντιπροσωπεύει τον αριθμό των price changes που μπορούν να ολοκληρωθούν με formula recalculations μέσα σε 30 δευτερόλεπτα. Στο Test 6 ακολουθείται η ίδια διαδικασία, μόνο που όλες οι formulas εξαρτώνται άμεσα από το κελί που αλλάζει συνεχώς, το Ε5000. Έτσι δοκιμάζεται σε πραγματικές συνθήκες η Smart Recalculation Engine που προωθεί η Microsoft ως ένα από τα δυνατότερα χαρακτηριστικά του Excel.
Ενδιαφέροντα τα αποτελέσματα στις εφαρμογές γραφείου! Στο Excel ακόμα και στην πιο πρόσφατη έκδοσή του, δεν μπορεί να εκμεταλλευτεί τους πολλούς πυρήνες. Αντίθετα χρειάζεται λίγους αλλά γρήγορους! Δεν πείθεστε; Ρίξτε μια ματιά στις επιδόσεις του G3258 και θα καταλάβετε!
PS Bench
Για πολλά χρόνια, οι απανταχού enthusiasts σύγκριναν τις επιδόσεις των συστημάτων τους χρησιμοποιώντας 2D & 3D μετροπρογράμματα όπως το SuperPi, το PiFast και τα επιτυχημένα 3DMark της Futuremark. Τι γίνεται όμως με τις επιδόσεις των συστημάτων σε πραγματικές εφαρμογές; Προγράμματα που χρησιμοποιούμε στην καθημερινότητα και ζορίζουν το σύστημά μας. Βοηθά άραγε το overclocking σε αυτά; Η απάντηση είναι φυσικά και ναι. Επιλέξαμε να χρησιμοποιήσουμε το Photoshop Bench V3 του HardwareHeaven.com. Το script του είναι πλήρως συμβατό με όλες τις πλατφόρμες, συμπεριλαμβανομένων των Apple Macintosh. Το 11.8MB ZIP αρχείο περιλαμβάνει ένα action ATN file που περνάμε στο photoshop και μία φωτογραφία μεγέθους 12.3MB και ανάλυσης 7000 x 5443 pixels. Η φωτογραφία περνά από διάφορα κύματα μέχρι να τελειώσει το action: Texturizer, CMYK Color Conversion, RGB Color Conversion, Ink Outlines, Dust & Stratches, Watercolor, Texturizer, Stained Glass, Lightning, Mosiac, Extrude, Smart Bluer, Underpainting, Palette και Sponge. Νικητής θα είναι ο επεξεργαστής ή το CPU Frequency με τον μικρότερο συνολικό χρόνο - όσο πιο γρήγορα, τόσο το καλύτερο.
Μια από τα ίδια και στο Photoshop Benchmark, το οποίο αδυνατεί να εκμεταλλευτεί σωστά όλους τους πυρήνες. Μην στέκεστε στα απόλυτα νούμερα, καθότι το Photoshop μπορεί μην δώσει ακριβείς επιδόσεις - το νόημα πάντως είναι αντιληπτό.
Impressions
Οι εφαρμογές γραφείου δεν είναι το δυνατό κομμάτι των πολυπύρηνων επεξεργαστών, και εδώ που τα λέμε δεν θα έπρεπε να είναι. Η επεξεργασία εικόνας και η εφαρμογή φίλτρων δεν είναι κάτι που απασχολεί αρκετούς πυρήνες, αλλά αντίθετα χρειάζεται περισσότερη μνήμη και μια ικανή all-around πλατφόρμα, ενώ οι νεότερες εκδόσεις του Photoshop που αξιοποιούν το GPU acceleration σχεδόν βγάζουν από το παιχνίδι τους κεντρικούς επεξεργαστές μας.
Overall System Assessment
Η πλατφόρμα κρίνεται στο σύνολό της.
PCMark 7, PC Mark 8
PCMark 7:Το PCMark7 (Windows 7 Benchmark test) είναι ό,τι ακριβώς χρειάζεστε για να μετρήσετε εύκολα και με μεγάλη ακρίβεια την απόδοση του υπολογιστή σας, να δείτε τα αδύνατα και τα δυνατά σημεία του. Με το σύνθετο αυτό μετροπρόγραμμα και αφού δείτε τα αποτελέσματα του κάθε test που τρέχετε, έχετε τη δυνατότητα αφού μάθετε που υστερεί το σύστημα να προβείτε σε κατάλληλες αναβαθμίσεις ή ακόμα και σε εντελώς νέο υπολογιστή, αν δείτε ότι το σύστημα που χρησιμοποιείται δεν ικανοποιεί όλες σας τις ανάγκες. Μέσω του PCMark7 suite βλέπετε τις επιδόσεις του συστήματός σας στα εξής tests: Video playback & transcoding, Image manipulation, Web browsing & decryption, Graphics - DirectX 9, Windows Defender, Importing Pictures και Gaming.
PCMark 8: Η συνέχεια του PCMark 7 από την Φινλανδική Futuremark. Το PCMark 8 έχει λάβει τις απαραίτητες "μοντέρνες" προσθήκες που θα συναντήσουμε στους νέους επεξεργαστές μετά το 2013. Hardware Acceleration και Video conference calls είναι μερικά από τα test που περιλαμβάνει για τον πλήρη έλεγχο των επιδόσεων ενός υπολογιστή.
Impressions
Δεν θα σταθούμε πολύ σε ένα "canned" benchmark όπως το PC Mark. Ενδεικτικά πάντως, λαμβάνουμε την εντύπωση πως σαν σύνολο, οι πλατφόρμες διαφέρουν ελάχιστα στις συνολικές επιδόσεις.
System Memory Assessment
Τι γίνεται με τις επιδόσεις του intergrated memory controller;
Aida 64
Το AIDA64 κατασκευάστηκε για να κάνει ευκολότερη την ζωή των home users αφού αποτελεί ένα διαγνωστικό πρόγραμμα με πλούσια σουίτα benchmarks. Η Extreme έκδοσή του περιλαμβάνει μεγάλη γκάμα features που αδιαμφισβήτητα θα βοηθήσουν στο overclocking, την διάγνωση τυχόν λαθών, τον βασανιστικό και συνάμα ενδελεχή έλεγχο σταθερότητας όπως επίσης και το monitoring θερμοκρασιών, memory bandwidth, memory timings και πολλά ακόμα! Ανά πάσα στιγμή θα μπορείτε να γνωρίζετε όλες τις πληροφορίες γύρω από τον επεξεργαστή, την μνήμη του συστήματος και τους σκληρούς δίσκους, ενώ παράλληλα είναι πλήρως συμβατό με 32-bit και 64-bit Microsoft Windows 7/Server 2008 R2 λειτουργικά συστήματα.
Θα ασχοληθούμε με τα Memory Bandwidth Benchmarks, δηλαδή τα Memory Read, Memory Write, Memory Copy και Latency. Ο κώδικας των εν λόγω benchmarks έχει γραφθεί με σωστή μεθοδολογία ώστε να εκμεταλλεύεται τις κατάλληλες x86, MMX, 3DNow!, SSE, SSE3 ή SSE4.1 instructions. Το Latency από την άλλη μετράει την χρονική καθυστέρηση που έχουμε όταν ο επεξεργαστής διαβάζει δεδομένα από την μνήμη του συστήματος. Δηλαδή το χρόνο από την εντολή Read, μέχρι να φτάσουν οι πληροφορίες στις εσωτερικές registers του CPU.
Impressions
Αυτή η δοκιμή είναι περισσότερο μια μάχη μεταξύ DDR3 και DDR4, με την δεύτερη να δείχνει από την αρχή τις δυνατότητές της ακόμα και αν βρίσκεται σε "νηπιακό" στάδιο. Οι επιδόσεις που μπορεί να προσφέρει είναι ξεκάθαρες, αλλά ουσιαστικό νόημα θα βρούμε μόνο σε εφαρμογές που αξιοποιούν τα μεγάλα data transfers, όπως τα rendering & video editing προγράμματα. Κατά τα άλλα, αν και μιλάμε για σχεδόν τις ίδιες DDR3 μνήμες, ο IMC των Haswell έχει να επιδείξει κάτι παραπάνω - αλλά όχι κάτι που μπορεί να διακριθεί όπως η DDR4 πλατφόρμα.
Gaming Assessment
Πόσο χρήσιμος είναι ο επεξεργαστής μας κατά το gaming και πως επηρεάζει τα FPS; Δοκιμάζουμε 3 γνωστούς τίτλους και αξιολογούμε.
Tomb Raider
Crysis 3
Metro Last Light
Impressions
Όπως πολύ σωστά θα καταλάβατε, κατά μέσο όρο όλοι οι επεξεργαστές πλέον αποδίδουν σχεδόν πανομοιότυπα. Ναι είναι γεγονός - σιγά σιγά θα αρχίσουμε να αγνοούμε τον όρο "bottleneck". Πλέον οι περισσότεροι devs έχουν αρχίσει και παραδίδουν περισσότερο optimized τίτλους, ενώ με τα νέα API όπως το Mantle και το DirectΧ 12 όπου στοχεύουν στην -σχεδόν- εξάλειψη του overhead, οι επιδόσεις ενός CPU κατά το gaming θα αρχίσουν να μην έχουν σχεδόν καμία σημασία.
Διαιρώντας τον μέσο όρο των FPS με τις κατά προσέγγιση σημερινές τιμές των επεξεργαστών, καταλήγουμε σε ένα ratio Καρέ ανά Ευρώ - Και η απάντηση είναι ξεκάθαρη: Αν δεν σας ενδιαφέρει κάτι περισσότερο από Gaming, κάντε την επένδυσή σας στην κάρτα γραφικών σας και όχι στον επεξεργαστή. Για gaming συστήνουμε ξεκάθαρα να κινηθείτε προς την s1150 πλατφόρμα, την ίδια στιγμή που η s2011 - Χ79/Χ99 δεν έχει κάτι το παραπάνω να σας προσφέρει.
Thermal & Power Usage Assessment
Πως συμπεριφέρονται τα CPU μας θερμικά αλλά και από άποψης διαχείρισης ενέργειας;
Συνεχίζουμε με ένα απλό τέστ. Πήραμε μερικά από τα δείγματά μας, εφαρμόσαμε την ίδια ακριβώς ψύκτρα (CoolerMaster Nepton 140XL), "κλειδώσαμε" τις τάσεις και ξεκινήσαμε ένα μισάωρο stress testing για κάθε τιμή, ώστε να μπορέσουμε να αξιολογήσουμε την θερμική συμπεριφορά των Devil's Canyon και το τι περισσότερο έχουν να προσφέρουν με τις βελτιωμένες θερμοαγώγιμες πάστες του πακέτου.
Τα αποτελέσματα είναι άκρως ενδιαφέροντα: Συνολικά οι Devil's Canyon καταφέρνουν και αποδεικνύονται πιο "δροσεροί" στα ίδια volts σε σχέση με τους αρχικούς Devil's Canyon. H διαφορά στην θερμική συμπεριφορά είναι αξιόλογη και κυμαίνεται γύρω στους 10 βαθμούς. Κάτι τέτοιο δεν σημαίνει μόνο δροσερότερη λειτουργία, αλλά εξίσου περισσότερο overclocking potential όπου στα ίδια volts και τις ίδιες συχνότητες οι θερμοκρασίες στο μέγιστο φορτίο είναι αρκετά πιο ...άνετες. Παρ' όλα αυτά, φαίνεται πως στα 22nm μετά το 1.26v αρχίζει η κατακόρυφη άνοδος στις θερμοκρασίες, όμως την ίδια στιγμή αυτά τα CPU έχουν χαμηλότερο voltage range με το οποίο λειτουργούν - ρίξτε μια ματιά στον 940 και τον 4960Χ για να διαπιστώσετε πως χρειάζονται περισσότερη τάση για να δουλέψουν, κάτι που σημαίνει και αυξημένες καταναλώσεις.
Την ίδια στιγμή, ρίχνουμε μια "κλεφτή ματιά" στο βατόμετρο που βρίσκεται στην πρίζα, μετρώντας την συνολική κατανάλωση ενός ολοκληρωμένου συστήματος. Εκεί θα διαπιστώσουμε το "ηλίου φαεινότερον" πως οι μεγαλύτερες πλατφόρμες είναι πιο ενεργοβόρες σε σε σχέση με τις Power efficient s1150. Ταυτόχρονα, μπορούμε να ρίξουμε και μια ματιά όσον αφορά τις διαφορές που δίνει το overclocking στην κατανάλωση του συστήματος, ενώ τέλος θα συμπληρώσουμε το πόσο λίγη ισχύ απαιτούν οι s1150 πλατφόρμες, με τις καταστάσεις αδράνειας και χαμηλού φόρτου να κυμαίνονται γύρω στα 60W.
Tέλος, μελετήσαμε τις διαφορές που προσφέρει το overclocking σε σχέση με τα default settings. Κατά μέσο όρο, στους περισσότερους επεξεργαστές θα λάβετε γύρω στο 15% - 20% περισσότερο, αναλόγως την πλατφόρμα την οποία υπερχρονίζετε. Θα εστιάσουμε σε 3 περιπτώσεις: τον 4790Κ που από τις εργοστασιακές ρυθμίσεις του είναι υπερχρονισμένος με το turbo boost να φτάνει τα 4.4GHz, ο 5960Χ που όμως διαθέτει χαμηλό εργοστασιακό ρολόι, ενώ τέλος ο Pentium G3258 μπορεί να προσφέρει επιδόσεις που αγγίζουν ακόμα και το +30%!
Για το τέλος αφήσαμε μια σπέσιαλ δοκιμασία. Πήραμε τον Core i7-4790K, στήσαμε το Cascade μας και ξεκινήσαμε το subzero overclocking!
Στεκόμενοι στην εμπειρία του overclocking, να πούμε πως από εποχής Sandy Bridge τα πράγματα δεν έχουν αλλάξει και ιδιαίτερα - το base clock συνεχίζει να παραμένει κλειδωμένο με ένα range γύρω στο +- 8%, ενώ οι περισσότερες τάσεις του συστήματος συνεχίζουν να παραμένουν ξεκλείδωτες - χαρακτηριστικό που προσφέρει απλόχερα η Z97 πλατφόρμα.
O 4790K μας συνδυάστηκε με μια Asus Maximus VI Formula, 2 DIMMS από τις Corsair Dominator Platinum 2666 MHz, μια τυπική Geforce GT 240 για την έξοδο στην οθόνη καθώς και έναν Corsair Force GS 240GB SSD και ένα Corsair AX1200 τροφοδοτικό.
Έπειτα από αρκετές δοκιμές, καταλήξαμε στα 5700ΜHz, σχεδόν 1 GHz περισσότερο σε σχέση με ότι καταφέραμε με ένα AIO watercooler. Στα ενδότερα, ο πυρήνας μας χρειάστηκε 1,63v, με το cache voltage να ανεβαίνει ελαφρώς στο 1,35v, το Input Voltage στα 2.0v Τέλος οι μνήμες μας έπαιξαν στα 2666MHz με τάση 1,8v και timings 10-12-12-25 1T. Όλα αυτά συνέβησαν σε θερμοκρασίες που άγγιξαν τους -95 βαθμούς Κελσίου!
Τα δυο καλύτερα runs έγιναν στο SuperPi 1M όπου ο χρόνος έπεσε στα 6.349s από τα 8.03s στα 4600MHz, ενώ ένα επίσης όμορφο run έγινε και στο Cinebench R15, όπου καταφέραμε μια συνολική αύξηση κατά 200 πόντους, από τους 900 στους 1113 cinebench points.
Η συνολική εμπειρία ήταν ευχάριστη, αλλά για να καταφέρεις να πετύχεις το μέγιστο δυνατό, χρειάζεται δουλειά. Οι δοκιμές και το tweaking μέχρι να βρεθεί η καλύτερη δυνατή συχνότητα απαιτεί αρκετό χρόνο αλλά και εξοικείωση με το βάθος των ρυθμίσεων που προσφέρονται, γι' αυτό και συνεχίζει να είναι η πλατφόρμα της επιλογής των overclockers.
Haswell-E και Devil's Canyon αντιμετωπίζουν την πραγματικότητα. Τι εννοούσαμε με αυτό; Μαζέψαμε όλα τα mainstream - high end CPU που κυκλοφορούν στην αγορά. Έπειτα από όλες τις μετρήσεις και τις σελίδες της ανάλυσης, ήρθε η ώρα να αναλύσουμε στο τι κάνουν οι νέες κυκλοφορίες από την Intel, με τους i7-5960X, i7-4790K, i5-4690K και τον Pentium G3258. Που στέκονται σε σχέση με τον δυνατό ανταγωνισμό; Υπάρχει τελικά λόγος αναβάθμισης;
Core i7-5960X & X99 Platform
Τι να πούμε για αυτόν τον επεξεργαστή! Ο Core i7-5960X είναι ίσως ότι ταχύτερο έχουμε δει στην consumer αγορά μέχρι στιγμής. Όπως φάνηκε και από τις δοκιμές μας, οι οχτώ Haswell πυρήνες που διαθέτει ο 5960Χ είναι ικανοί να τον «καθηλώσουν» στην κορυφή, πλην ελαχίστων εξαιρέσεων, των αποτελεσμάτων των δοκιμών μας, με σχεδόν 50% παραπάνω απόδοση σε σχέση με τους υπόλοιπους εξαπύρηνους και πολύ κοντά στο 100% σε σχέση με τον 4790Κ και τους υπόλοιπους mainstream quadcores της αγοράς.
Πως μεταφράζεται όμως κάτι τέτοιο στην πραγματικότητα; Ο Core i7-5960X με τις επιδόσεις που προσφέρει φαντάζει ιδανικός για ένα workstation μηχάνημα με εκτενή χρήση σε επαγγελματικές εφαρμογές που απαιτούν πολυπύρηνη επεξεργασία. Σε τέτοιες περιπτώσεις, μια τέτοια επένδυση έχει αρκετό νόημα ενώ ταυτόχρονα έρχεται σε λογικό κόστος, καθώς αν ζητάμε κάτι περισσότερο τότε αυτό θα το βρούμε στην Bussiness-Server κατηγορία, με τους Intel Xeons και τις ECC μνήμες να απαιτούν πολλαπλάσιο κόστος για την αγορά τους.
Ένας επεξεργαστής όμως που έρχεται σε τιμή σχεδόν όσο ένα ολοκληρωμένο High-end Gaming σύστημα, δεν είναι πάντα η «πεμπτουσία» ενός συστήματος. Αυτό φάνηκε κατά το Gaming, όπου όλοι οι επεξεργαστές των δοκιμών μας παρέδωσαν παρόμοιες επιδόσεις, καθιστώντας τον 5960X έναν από τους χειρότερους όσον αφορά την αναλογία απόδοσης/τιμή. Ο 5960Χ θα σας χρειαστεί στο gaming μόνο όταν στο backround εκτελούνται και κάποιες απαιτητικές εφαρμογές. Έτσι, για μια πλήρως οικιακή-μη επαγγελματική χρήση, η απόκτηση του 5960Χ δεν έχει και ιδιαίτερο νόημα.
Αν και είναι καλοδεχούμενη επιτέλους η είσοδος στην αγορά των οκταπύρηνων επεξεργαστών, ελπίζουμε να μην «κολλήσουμε» για αρκετό καιρό όπως κάναμε με τους εξαπύρηνους εδώ και αρκετά χρόνια. Ο Core i7-5960X διατίθεται στην Ελληνική αγορά με κόστος τα 1020?, ενώ ταυτόχρονα θα πρέπει να υπολογίσετε και το αυξημένο κόστος των DDR4 μνημών και μιας X99 μητρικής, αλλά οι υψηλές επιδόσεις και το bleeding-edge έχουν πάντα ένα τίμημα που μεταφέρεται συνήθως στην… τιμή.
Specs: 10.0 / 10
Performance: 10.0 / 10
Overclocking: 9.0 / 10
Price: 8.0 /10
Core i7-4790K & i5-4690K
4790K: Και φτάνουμε στην περίπτωση του 4790Κ. Αυτήν την χρονιά, η Intel επέλεξε να μην εκδώσει μια νέα αρχιτεκτονική στην αγορά – αντʼ αυτού προτίμησε να εστιάσει σε 2 τομείς: Πρώτον, να βελτιώσει την s1150 πλατφόρμα προσφέροντας ένα ανανεωμένο chipset καθώς και μερικά έξτρα χαρακτηριστικά (M.2 και SATA Express) στις προς διάθεση μητρικές. Δεύτερον, πήρε ένα ήδη πετυχημένο επεξεργαστή, τον 4770Κ, και διόρθωσε μερικά αδύναμα σημεία του. Έτσι, ο 4790Κ αποτελεί ένας βελτιωμένος στα σημεία 4770Κ, με εξαιρετικές out of the box επιδόσεις, αρκετά βελτιωμένη θερμική συμπεριφορά η οποία συνεπάγεται και σε αρκετά καλύτερο overclocking potential.
Είχαμε συνηθίσει τα τελευταία χρόνια η Intel να προσθέτει μερικά CPU στο line-up της, όπως ο 2700Κ. Μόνο που αυτήν την φορά δεν πρόκειται για ένα απλό rebrand και ένα ανεβασμένο ρολόι κατά 100MHz – αντίθετα, ένα χρόνο μετά το launch των Haswell, παίρνουμε ένα πιο ώριμο yield με βελτιωμένο «πακέτο».
Το νυν flagship μοντέλο της s1150 πλατφόρμας συνεχίζει να είναι ένα από τα καλύτερα all-around CPU που κυκλοφορούν στην αγορά, και μπορούν να ικανοποιήσουν ακόμα και τον πιο απαιτητικό χρήστη. Από άποψης απόδοσης, συνεχίζει να στέκεται υψηλότερα σε σχέση με τις προηγούμενες γενιές, όμως οι διαφορές που προσφέρει κατά την γνώμη μας δεν αρκούν για να δικαιολογήσουν πλήρως την αναβάθμιση από έναν αντίστοιχο Sandy /Ivy Bridge. Επιπλέον, είναι καλοδεχούμενη η δυνατή άνοδος στους default χρονισμούς του, μόνο που ένα καλό υπερχρονισμένο «κομμάτι» 4770Κ μπορεί να παραδώσει πανομοιότυπα αποτελέσματα.
Η τιμή για τον κορυφαίο quadcore Haswell ανέρχεται στα 320?. Αν και συνεχίζει να αποτελεί ένα fair-deal μεταξύ απόδοσης και τιμής, αυτό που μένει στο πίσω μέρος του μυαλού μας είναι πως έναν χρόνο μετά την κυκλοφορία των Haswell, συνεχίζουμε να παίρνουμε Haswell στην ίδια τιμή.
Specs: 9.0 / 10
Performance: 9.0 / 10
Overclocking: 9.5 / 10
Price: 8.5 /10
4690Κ: Δεν θα σταθούμε ιδιαίτερα στο δεύτερο κατά σειρά CPU του line-up της Intel. Ο 4690Κ συνεχίζει να είναι το τυπικό all-around quadcore, με την λιγότερη cache και το απενεργοποιημένο Hyper Threading να τον κάνουν να στερείται από τα top of the line parts. Ο 4690Κ βελτιώθηκε και αυτός σε ορισμένα σημεία, με την βελτιωμένη θερμοαγώγιμη κάτω από το heatspreader να του δίνει μια καλύτερη θερμική συμπεριφορά και λίγο καλύτερο OC potential.
Από την άλλη, δεν μπορούμε να δούμε περισσότερες αισθητές διαφορές σε σχέση με τον περσινό 4670Κ, ούτε καν στους εργοστασιακούς χρονισμούς. Θα μας άρεσε και σε αυτήν την περίπτωση να βλέπαμε ένα default clock στα 4 GHz, όπως συνέβη στην περίπτωση του 4790Κ.
Τα 220? της τιμής του αποτελούν ένα τίμιο trade-off για την λιγότερη cache και το «κομμένο» HT έναντι του 4790Κ, καθώς και ένα εξαιρετικό επεξεργαστή για οικιακή χρήση και gaming.
Specs: 9.0 / 10
Performance: 8.5 / 10
Overclocking: 9.0 / 10
Price: 9.0 /10
The Pentium G3258 Story
Ας υποθέσουμε ότι ένας υποψήφιος low-budget system builder έχει τις εξής απαιτήσεις: Gaming δυνατότητες, overclocking σε ένα σύνολο που δεν πρέπει να υπερβαίνει τα 100?. Πολύ απλά, η Intel σε αυτόν τον αγοραστή «έριχνε» πόρτα και του έλεγε πολύ απλά «πήγαινε στην AMD». Ήρθε η ώρα να αλλάξει αυτό και η Intel να «απλώσει τα δίχτυα της» και στο entry-level / low budget κομμάτι της αγοράς.
Ο Pentium G3258, αν και σχεδόν μονίμως βρισκόταν στην τελευταία θέση των αποτελεσμάτων, αποτελεί την «επιτομή» του τι μπορεί να κάνει ένας ξεκλείδωτος διπύρηνος, παρέχοντας υψηλούς δείκτες σε κύρια σημεία, διακρίνοντας το εξαιρετικό performance / value σε εφαρμογές γραφείου αλλά και στο gaming, κάνοντας αρκετά από τα πιο ακριβά CPU να χάνουν το νόημά τους.
Παρʼ όλα αυτά, αποδεικνύεται αρκετά αδύναμος, ακόμα και overclocked σε heavy workload σενάρια. Συνεπώς, μόνο εάν σας ενδιαφέρει να παίζετε κάποιο παιχνίδι και τίποτα περισσότερο να μην συμβαίνει στο παρασκήνιο, ο G3258 είναι από τα πιο τίμια CPU που έχουμε δει.
Παράλληλα, θα δώσουμε ειδική μνεία στις ξεκλείδωτες δυνατότητές του. Επιτέλους, παίρνουμε overclocking σε entry level διπύρηνο CPU, κάτι που αγνοούσαμε σε αυτήν την κατηγορία για τουλάχιστον μια 5ετία. Η Intel επιτέλους δίνει το κίνητρο για overclocking χωρίς να απαιτούνται τα τουλάχιστον 200? που ζητά ο πρώτος “K series” επεξεργαστής της! Αν και το overclocking δεν εκτοξεύει τις επιδόσεις του μικρού Pentium, είναι ευχάριστη η αύξηση των επιδόσεων για οποιονδήποτε είναι διατεθειμένος να το ψάξει.
Τα 60? της τελικής τιμής του αποτελούν ένα από τα καλύτερα value for money προϊόντα που έχουμε δει.
Specs: 8.0 / 10
Performance: 8.0 / 10
Overclocking: 9.0 / 10
Price: 10.0 /10
Honorable mentions
Λίγο πριν το κλείσιμο, θα σταθούμε και στους υπόλοιπους επεξεργαστές που ανταγωνίστηκαν σε αυτήν την παρουσίαση. Εν αρχή, οι Ivy Bridge –E με τους 6 πυρήνες τους συνεχίζουν να παραμένουν ικανοί για μεγάλα workloads, και μόνο αν απαιτείται ακόμα περισσότερη ταχύτητα είναι λογική η αναβάθμιση στον 5960Χ.
Οι Sandy Bridge και οι Ivy Bridge μας έδειξαν πως αν και αποτελούν την προηγούμενη γενιά της Intel, προσφέρουν επιδόσεις που είναι μόλις… «ένα κλικ» χαμηλότερες από αυτές των αντίστοιχων Haswell, συνεπώς χάνονται αρκετά από τα επιχειρήματα των Haswell όσον αφορά τους λόγους αναβάθμισης.
Αν και κλείνει σχεδόν 5 χρόνια ζωής, ο Nehalem Core i7 940 έδειξε πως είναι ακόμα σχετικός όσον αφορά τις επιδόσεις του. Ακόμα και 4 γενιές μπροστά, το IPC των Haswell δεν έχει καταφέρει να κάνει έναν διπύρηνο να συμπεριφέρεται ταχύτερα από έναν τετραπύρηνο. Είναι ακόμα ζωντανός; Ναι, αλλά από άποψης επιδόσεων έχει πέσει στα επίπεδα που προσφέρουν οι 2500Κ – 3570Κ, με μειονέκτημα το πιο περίπλοκο overclocking του αλλά και τα χαμηλότερα clock speeds που προσφέρει.
Bottom Line: ...mixed emotions
Ανάμεικτα συναισθήματα για το τέλος! 4 γενιές επεξεργαστών τέθηκαν σε δοκιμή, παρʼ όλα αυτά οι εντυπώσεις που μας άφησαν ανήκουν στο μεγαλύτερο κλίμα που κυριαρχεί με τις τελευταίες γενιές επεξεργαστών – κάθε γενιά προσφέρει μόλις ένα μικρό άλμα στις επιδόσεις αλλά λίγο καλύτερο efficiency.
Το θέμα είναι το κατά πόσο είναι αυτό αποδεκτό εκ μέρους μας. Βλέποντας το trend της βιομηχανίας τόσο από μεριάς hardware όσο και software, πως τα πάντα κινούνται γύρω από το efficiency, δυσκολευόμαστε προς το παρόν να δούμε περισσότερη πρόοδο στις επιδόσεις σε σχέση με το παρελθούσες γενιές.
Κάτι τέτοιο έχει δημιουργήσει το εξής κλίμα στην αγορά: Οτιδήποτε κυκλοφορεί είναι… good enough για τις περισσότερες διεργασίες που μπορεί να απαιτήσει ένας αγοραστής από το CPU του. Από εκεί και πέρα ο χρήστης θα πρέπει να δώσει βάση και στα υπόλοιπα υποσυστήματά του – αν επιθυμεί gaming να επενδύσει στην κάρτα γραφικών του, αν θέλει σβελτάδα να αγοράσει έναν SSD, και ούτω καθεξής. Και εδώ εισέρχεται το πώς όταν σκεφτόμαστε την αναβάθμιση, θα πρέπει να κοιτάμε τι έχει να προσφέρει η πλατφόρμα στο σύνολό της (πχ UEFI BIOS με fast boot, περισσότερες PCI-e 3.0 θύρες, εγγενές USB 3.0, περισσότερες SATA 6Gbps κλπ) και όχι μόνο αυστηρά τις επιδόσεις των προς σύγκριση συστημάτων. Και η αλήθεια είναι πως οι νεότερες πλατφόρμες έχουν μερικά σημεία παραπάνω να επιδείξουν, παρά τα ίδια τα CPU που έχουν στην διάθεσή τους.
Για τον enthusiast που θέλει να έχει στην διάθεσή του ότι ταχύτερο κυκλοφορεί, τόσο η X99 πλατφόρμα όσο και οι high end Devilʼs Canyon συνεχίζουν να προσφέρουν τις καλύτερες δυνατές επιδόσεις στα χρήματά τους, προσφέροντας και ελευθερία στο Oveclocking για όποιον επιθυμεί κάτι το ακόμα περισσότερο γιʼ αυτό που πλήρωσε. Η εμπειρία του overclocking έχει φτάσει πλέον σε πολύ πιο worry-free καταστάσεις, αν και φυσικά πάντα είναι απαραίτητες οι γνώσεις που θα σας βοηθήσουν να tweak-άρετε και να φέρετε στα μέτρα το σύστημά σας, και εδώ τόσο οι Devilʼs Canyon όσο και οι Haswell-E σας προσφέρουν απλόχερα τις επιλογές. Για τους Overclockers δε, τα πράγματα είναι πιο απλά. Κάθε νέο κομμάτι που κυκλοφορεί στην αγορά, οποιαδήποτε μικρή βελτίωση σημαίνει αυτομάτως ένα νέο παγκόσμιο ρεκόρ – και οι Devilʼs Canyon και Haswell-E ήδη αμέσως μετά την κυκλοφορία τους έθεσαν τον πήχη ακόμα πιο ψηλά.
Με όλα τα θετικά τους και τα αρνητικά τους, οι Haswell-E και οι Devilʼs Canyon μας άφησαν θετικές εντυπώσεις, αλλά την προβλεπόμενη και αναμενόμενη πρόοδο. Πάντα θα δυσκολευόμαστε να δικαιολογήσουμε την αναβάθμιση βασιζόμενοι μόνο στα απόλυτα νούμερα - αλλά αν τα κέρδη πιστεύετε πως σας ικανοποιούν και ταυτόχρονα η τιμή είναι σε λογικά επίπεδα, τότε και μόνο τότε η αναβάθμιση αξίζει τον κόπο.
Ευχαριστίες
Ευχαριστούμε θερμά τους:
- Intel Hellas
- Gigabyte
- Asrock
- Καθώς και όλα τα μέλη που εργάστηκαν είτε άμεσα είτε έμμεσα για το παρόν review.
Stay HwBoxed!