Intel Nehalem-EX vs IBM POWER7: Ο πόλεμος των μεγαθήριων ξεκίνησε!
Πολλά έχουν ακουστεί τον τελευταίο καιρό σχετικά με το επερχόμενο θηρίο της IBM που ακούει στο όνομα POWER7. Πόσα όμως από αυτά είναι πραγματικότητα; Μήπως η IBM έχει κρύψει "έναν άσσο στο μανίκι της"; Θα μπορέσει άραγε μία εταιρεία σαν την IBM να εκθρονίσει την βασίλισσα των X86 επεξεργαστών - έναν κολοσσό σαν την Intel; Διαβάστε το άρθρο μας για να σας λυθούν όλες οι απορίες. Πολλά έχουν ακουστεί τον τελευταίο καιρό σχετικά με το επερχόμενο θηρίο της IBM που ακούει στο όνομα POWER7. Πόσα όμως από αυτά είναι πραγματικότητα; Μήπως η IBM έχει κρύψει "έναν άσσο στο μανίκι της"; Θα μπορέσει άραγε μία εταιρεία σαν την IBM να εκθρονίσει την βασίλισσα των X86 επεξεργαστών - έναν κολοσσό σαν την Intel; Διαβάστε το άρθρο μας για να σας λυθούν όλες οι απορίες.
IBM POWER7: Πρόκειται για τον δεύτερο οκταπύρηνο επεξεργαστή (μετά τον Nehalem-EX της Intel), του οποίου το shipping θα ξεκινήσει επίσημα το 2010. Θα μου πείτε "και τι γίνεται με τον Niagara της εταιρείας Sun και τους ultralight πυρήνες του;" Αυτός δεν είναι general purpose επεξεργαστής που απευθύνεται σε ευρύ αγοραστικό κοινό, οπότε μένει εκτός συναγωνισμού.
Ακριβώς όπως ο ultra high-end server της Intel έτσι και ο POWER7, η ναυαρχίδα επεξεργαστών της IBM που αναμένεται πως και πως το 2010, είναι ένα τεράστιο die, με τερατώδη cache και τρομακτικές επιδόσεις. Την ίδια στιγμή δύναται να εκτελέσει και καθήκοντα σε ένα καλοστημένο multiprocessor σύστημα. Για να καταλάβουμε όμως καλύτερα τον λόγο για τον οποίο γράφτηκε το άρθρο αυτό, ας συγκρίνουμε τους δύο επεξεργαστές. Και οι δύο είναι κατασκευασμένοι με βάση την λιθογραφική μέθοδο 45nm, έχουν 8 πυρήνες σε κάθε die, κάθε ένας από αυτούς εκτελεί τις δικές του διεργασίες, υπάρχουν στοιχεία που υποδηλώνουν φυσικά την ύπαρξη εσωτερικού multithreading. Συνεχίζοντας με τα τεχνικά χαρακτηριστικά, ο Nehalem-EX αναμένεται να έχει 8 πυρήνες με 2 threads ανά πυρήνα (16 threads συνολικά), συχνότητα λειτουργίας που ανέρχεται στα 2.66 - 3GHz. Απ'την άλλη όψη του νομίσματος έχουμε τον POWER7: 8 πυρήνες με 4 threads ανά πυρήνα (32 threads συνολικά), συχνότητα λειτουργίας μέχρι και στα 4GHz. Σύμφωνα λοιπόν με τα επισήμως ανακοινωθέντα τεχνικά χαρακτηριστικά, η Intel χάνει (κατά πολύ μάλιστα) στο παιχνίδι των features... Ήταν όμως δυνατόν να αφήσει οτιδήποτε στην τύχη; Δεν το νομίζω. Ενώ ο Nehalem-EX θα κυκλοφορήσει μέσα σε 4 μήνες από τώρα, ο POWER7 θα κάνει το ντεμπούτο του στην αγορά στα μέσα του 2010...
Με μια πιο κοντινή ματιά σε κάθε πυρήνα, ο Nehalem-EX core έχει την δυνατότητα να επεξεργαστεί μέχρι και 4 instructions (μερικές απλές, μερικές πολύπλοκες), όπως επίσης και 4 floating-point (FP) λειτουργίες ανά κάθε κύκλο του ρολογιού. Καθόλου άσχημα, ιδιαίτερα αν αναλογιστεί κανείς ότι μιλάμε για τον δυνατότερο x86 CPU που κυκλοφορεί στην αγορά (μάλλον, που θα κυκλοφορήσει). Ο POWER7 μπορεί να επεξεργαστεί μέχρι και 6 απλές instructions ανά κάθε κύκλο του ρολογιού και μέχρι 8 FP λειτουργίες. Για ακόμα μια φορά, η "ωμή" δύναμη του POWER7 ξεχωρίζει. Όμως, τα ίδια έκανε και η IBM με τον POWER6 και τελικά... απέτυχε παταγωδώς σε όλα τα benchmarks. Το θέμα δεν είναι μόνο τα χαρακτηριστικά, αλλά και η αρχιτεκτονική, κάτι στο οποίο η IBM δεν έδωσε βάση στο παρελθόν. Αν καταφέρει να ταυτίσει τα εξαιρετικά αυτά features με εξαίσιες επιδόσεις, τότε μιλάμε για απροσδόκητη επιτυχία.
Τι γίνεται με τις caches των επεξεργαστών; Και οι δύο αρκετά πλούσιοι στον τομέα αυτό. Ο οχταπύρηνος Nehalem-EX διαθέτει shared pool 24MB L3 SRAM cache με γρήγορο kilobit-wide ringbus ανάμεσα στις διαφορετικές cahce segments. Ρόλος του ringbus είναι να επιταχύνει την πρόσβαση στις cache segments. O POWER7 έχει 32MB L3 eDRAM cache για τους 8 πυρήνες του. Και οι δύο επεξεργαστές, έρχονται με 256KB L2 ιδιωτική low-latency cache ανά πυρήνα επεξεργασίας.
Με τις μνήμες; Ο Nehalem-EX έχει 4 buffered DDR3 channels per chip, κάθε channel απ'τα οποία χωρίζεται σε δύο πραγματικά 64-bit DDR3-1333 DRAM paths. Αυτό γίνεται με την βοήθεια των on-board buffers. Αν τα buffers είχαν δυνατότητες όπως αυτές που περιλαμβάνονται στα FBD AMD (Advanced Memory Buffers), θα μπορούσατε να κάνετε ταυτόχρονα και read και write transactions σε κάθε κανάλι, διπλασιάζοντας έτσι το bandwidth. Όπως και να 'χει το πράγμα, θα έχετε μπροστά σας 50Gbps memory bandwidth ανά CPU chip ! O POWER7 έχει υπό την κατοχή του 2 4-channel DDR3 memory controllers, δηλαδή συνολικά 8 κανάλια μνήμης. H IBM μάλιστα ισχυρίζεται ότι το συνολικό εύρος μνήμης ανέρχεται στα 100Gbps !
Νιώθω όμως ότι κάτι ξεφεύγει στην IBM. Όλα αυτά ανήκουν στην θεωρία και μόνο. Θεωρητικά, αν το Nehalem-EX 4-channel QPI Interconnect έτρεχε στα 6.4GTps (full speed δηλαδή) θα έδινε πάνω από 100Gbps bandwidth στους 4 γειτονικούς επεξεργαστές. H IBM μίλησε για 360GBps, δηλαδή 3 φορές περισσότερο από αυτά ενός Nehalem-EX, κάνοντάς τον να μοιάζει απίστευτα αργό. Όμως στην πραγματικότητα, μόνο αργός δεν είναι. Συγχαρητήρια λοιπόν στην IBM τα features του POWER7 μοιάζουν ακατανίκητα. Τι instructions set architecture χρησιμοποιεί όμως ο επεξεργαστής της;
Το ξεπερασμένο POWER ISA achitecture path, συμπεριλαμβανομένων των PowerPC-specific Altivec extensions που είχε ο POWER6. Ξεχνώντας λοιπόν το PowerMac, η IBM ενδιαφέρεται για την αγορά των mainframes, minicomputers και servers / clusters. O Nehalem-EX ακολουθεί την απλότητα, που πολλές φορές όσο και αν ακούγεται περίεργο αυτό που θα πω, στον κόσμο της τεχνολογίας υπερισχύει. 64-bit X86. Καθαρότατη νίκη για την Intel στον τομέα αυτό, χιλιάδες υποστηριζόμενα chipsets, περιφερειακά, software, drivers, εφαρμογές αλλά σημαντικότερο όλων, όλα τα λειτουργικά συστήματα που κυκλοφορούν εκτός από τα AIX και VMS. Ε και τι έγινε, μεγάλο το κακό δηλαδή... Μην ξεχνάτε και την δυνατότητα να δημιουργήσετε τα δικά σας extreme workstations με δύο επεξεργαστές, στα οποία θα υπάρχει ακόμα και περιθώριο για μικρό overclocking potential. Μιλάμε για απεριόριστες δυνατότητες. Φανταστείτε δύο "Beckton" Nehal-EX CPUs σε ένα 16πύρηνο Skulltrail τερατώδες setup. Ποιος φανατικός gamer δεν θα ερωτευόταν ένα τέτοιο μηχάνημα και ποιος engineer δεν θα ήθελε να επιταχύνει ακόμα περισσότερα τα περίπλοκα visualisations. Ορισμένα από αυτά τα συστήματα θα είναι upgrade-able έτσι ένα χρόνο και κάτι μήνες αργότερα να υπάρχει δυνατότητα τοποθέτησης "Eagleton" 12πύρηνων 32nm chips με 36MB cache.
Η πικρή αλήθεια είναι ότι, δεν νομίζω να δούμε POWER7 workstation ποτέ, δυστυχώς. Στην αγορά τέτοιων συστημάτων είναι εξαιρετικά κρίσιμο το να υπάρχει πρόσβαση σε μία καλοδουλεμένη αρχιτεκτονική πάνω στην οποία δουλεύουν πολλοί developers, γιατί μόνο έτσι ο κώδικας θα είναι πλήρως ρυθμισμένος και τροποποιημένος. Ανεξαρτήτως των "ωμών" διαφορών που είδαμε υπέρ του POWER7 στα νούμερα, η πραγματικότητα βρίσκεται πολύ πολύ μακριά... Πάντοτε οι εταιρείες θα δείχνουν μεγαλύτερο ενδιαφέρον για X86 CPUs, στα οποία το tuning και το optimization βρίσκονται έτη φωτός μπροστά.
Intel's Kennedy Brown and IBM's Kevin Powell show you a sneak peek of an 8 socket, 64 core, 128 thread IBM server based on Intel's Nehalem-EX processor
[youtube]http://www.youtube.com/watch?v=BQ4shSQJTd0&eurl=http%3A%2F%2Fwww.intel.com%2Fpressroom%2Farchive%2Freleases%2F20090526comp.htm&feature=player_embedded#t=145[/youtube]
.
IBM POWER7: Πρόκειται για τον δεύτερο οκταπύρηνο επεξεργαστή (μετά τον Nehalem-EX της Intel), του οποίου το shipping θα ξεκινήσει επίσημα το 2010. Θα μου πείτε "και τι γίνεται με τον Niagara της εταιρείας Sun και τους ultralight πυρήνες του;" Αυτός δεν είναι general purpose επεξεργαστής που απευθύνεται σε ευρύ αγοραστικό κοινό, οπότε μένει εκτός συναγωνισμού.
Ακριβώς όπως ο ultra high-end server της Intel έτσι και ο POWER7, η ναυαρχίδα επεξεργαστών της IBM που αναμένεται πως και πως το 2010, είναι ένα τεράστιο die, με τερατώδη cache και τρομακτικές επιδόσεις. Την ίδια στιγμή δύναται να εκτελέσει και καθήκοντα σε ένα καλοστημένο multiprocessor σύστημα. Για να καταλάβουμε όμως καλύτερα τον λόγο για τον οποίο γράφτηκε το άρθρο αυτό, ας συγκρίνουμε τους δύο επεξεργαστές. Και οι δύο είναι κατασκευασμένοι με βάση την λιθογραφική μέθοδο 45nm, έχουν 8 πυρήνες σε κάθε die, κάθε ένας από αυτούς εκτελεί τις δικές του διεργασίες, υπάρχουν στοιχεία που υποδηλώνουν φυσικά την ύπαρξη εσωτερικού multithreading. Συνεχίζοντας με τα τεχνικά χαρακτηριστικά, ο Nehalem-EX αναμένεται να έχει 8 πυρήνες με 2 threads ανά πυρήνα (16 threads συνολικά), συχνότητα λειτουργίας που ανέρχεται στα 2.66 - 3GHz. Απ'την άλλη όψη του νομίσματος έχουμε τον POWER7: 8 πυρήνες με 4 threads ανά πυρήνα (32 threads συνολικά), συχνότητα λειτουργίας μέχρι και στα 4GHz. Σύμφωνα λοιπόν με τα επισήμως ανακοινωθέντα τεχνικά χαρακτηριστικά, η Intel χάνει (κατά πολύ μάλιστα) στο παιχνίδι των features... Ήταν όμως δυνατόν να αφήσει οτιδήποτε στην τύχη; Δεν το νομίζω. Ενώ ο Nehalem-EX θα κυκλοφορήσει μέσα σε 4 μήνες από τώρα, ο POWER7 θα κάνει το ντεμπούτο του στην αγορά στα μέσα του 2010...
Με μια πιο κοντινή ματιά σε κάθε πυρήνα, ο Nehalem-EX core έχει την δυνατότητα να επεξεργαστεί μέχρι και 4 instructions (μερικές απλές, μερικές πολύπλοκες), όπως επίσης και 4 floating-point (FP) λειτουργίες ανά κάθε κύκλο του ρολογιού. Καθόλου άσχημα, ιδιαίτερα αν αναλογιστεί κανείς ότι μιλάμε για τον δυνατότερο x86 CPU που κυκλοφορεί στην αγορά (μάλλον, που θα κυκλοφορήσει). Ο POWER7 μπορεί να επεξεργαστεί μέχρι και 6 απλές instructions ανά κάθε κύκλο του ρολογιού και μέχρι 8 FP λειτουργίες. Για ακόμα μια φορά, η "ωμή" δύναμη του POWER7 ξεχωρίζει. Όμως, τα ίδια έκανε και η IBM με τον POWER6 και τελικά... απέτυχε παταγωδώς σε όλα τα benchmarks. Το θέμα δεν είναι μόνο τα χαρακτηριστικά, αλλά και η αρχιτεκτονική, κάτι στο οποίο η IBM δεν έδωσε βάση στο παρελθόν. Αν καταφέρει να ταυτίσει τα εξαιρετικά αυτά features με εξαίσιες επιδόσεις, τότε μιλάμε για απροσδόκητη επιτυχία.
Παρουσίαση του Nehalem-EX
IBM POWER6 - ο προκάτοχος του POWER7, παρόμοια αρχιτεκτονική ακολουθήθηκε και στους δύο
IBM POWER6 - ο προκάτοχος του POWER7, παρόμοια αρχιτεκτονική ακολουθήθηκε και στους δύο
Τι γίνεται με τις caches των επεξεργαστών; Και οι δύο αρκετά πλούσιοι στον τομέα αυτό. Ο οχταπύρηνος Nehalem-EX διαθέτει shared pool 24MB L3 SRAM cache με γρήγορο kilobit-wide ringbus ανάμεσα στις διαφορετικές cahce segments. Ρόλος του ringbus είναι να επιταχύνει την πρόσβαση στις cache segments. O POWER7 έχει 32MB L3 eDRAM cache για τους 8 πυρήνες του. Και οι δύο επεξεργαστές, έρχονται με 256KB L2 ιδιωτική low-latency cache ανά πυρήνα επεξεργασίας.
Με τις μνήμες; Ο Nehalem-EX έχει 4 buffered DDR3 channels per chip, κάθε channel απ'τα οποία χωρίζεται σε δύο πραγματικά 64-bit DDR3-1333 DRAM paths. Αυτό γίνεται με την βοήθεια των on-board buffers. Αν τα buffers είχαν δυνατότητες όπως αυτές που περιλαμβάνονται στα FBD AMD (Advanced Memory Buffers), θα μπορούσατε να κάνετε ταυτόχρονα και read και write transactions σε κάθε κανάλι, διπλασιάζοντας έτσι το bandwidth. Όπως και να 'χει το πράγμα, θα έχετε μπροστά σας 50Gbps memory bandwidth ανά CPU chip ! O POWER7 έχει υπό την κατοχή του 2 4-channel DDR3 memory controllers, δηλαδή συνολικά 8 κανάλια μνήμης. H IBM μάλιστα ισχυρίζεται ότι το συνολικό εύρος μνήμης ανέρχεται στα 100Gbps !
Νιώθω όμως ότι κάτι ξεφεύγει στην IBM. Όλα αυτά ανήκουν στην θεωρία και μόνο. Θεωρητικά, αν το Nehalem-EX 4-channel QPI Interconnect έτρεχε στα 6.4GTps (full speed δηλαδή) θα έδινε πάνω από 100Gbps bandwidth στους 4 γειτονικούς επεξεργαστές. H IBM μίλησε για 360GBps, δηλαδή 3 φορές περισσότερο από αυτά ενός Nehalem-EX, κάνοντάς τον να μοιάζει απίστευτα αργό. Όμως στην πραγματικότητα, μόνο αργός δεν είναι. Συγχαρητήρια λοιπόν στην IBM τα features του POWER7 μοιάζουν ακατανίκητα. Τι instructions set architecture χρησιμοποιεί όμως ο επεξεργαστής της;
Intel Nehalem-EX architecture and waffer
Το ξεπερασμένο POWER ISA achitecture path, συμπεριλαμβανομένων των PowerPC-specific Altivec extensions που είχε ο POWER6. Ξεχνώντας λοιπόν το PowerMac, η IBM ενδιαφέρεται για την αγορά των mainframes, minicomputers και servers / clusters. O Nehalem-EX ακολουθεί την απλότητα, που πολλές φορές όσο και αν ακούγεται περίεργο αυτό που θα πω, στον κόσμο της τεχνολογίας υπερισχύει. 64-bit X86. Καθαρότατη νίκη για την Intel στον τομέα αυτό, χιλιάδες υποστηριζόμενα chipsets, περιφερειακά, software, drivers, εφαρμογές αλλά σημαντικότερο όλων, όλα τα λειτουργικά συστήματα που κυκλοφορούν εκτός από τα AIX και VMS. Ε και τι έγινε, μεγάλο το κακό δηλαδή... Μην ξεχνάτε και την δυνατότητα να δημιουργήσετε τα δικά σας extreme workstations με δύο επεξεργαστές, στα οποία θα υπάρχει ακόμα και περιθώριο για μικρό overclocking potential. Μιλάμε για απεριόριστες δυνατότητες. Φανταστείτε δύο "Beckton" Nehal-EX CPUs σε ένα 16πύρηνο Skulltrail τερατώδες setup. Ποιος φανατικός gamer δεν θα ερωτευόταν ένα τέτοιο μηχάνημα και ποιος engineer δεν θα ήθελε να επιταχύνει ακόμα περισσότερα τα περίπλοκα visualisations. Ορισμένα από αυτά τα συστήματα θα είναι upgrade-able έτσι ένα χρόνο και κάτι μήνες αργότερα να υπάρχει δυνατότητα τοποθέτησης "Eagleton" 12πύρηνων 32nm chips με 36MB cache.
4 x Nehalem-EX σε ένα μόνο σύστημα... 32 πυρήνες επεξεργασίας, 64 threads εν δράση !
IBM POWER7 πάνω σε πλατφόρμα της AMD
IBM POWER7 πάνω σε πλατφόρμα της AMD
Η πικρή αλήθεια είναι ότι, δεν νομίζω να δούμε POWER7 workstation ποτέ, δυστυχώς. Στην αγορά τέτοιων συστημάτων είναι εξαιρετικά κρίσιμο το να υπάρχει πρόσβαση σε μία καλοδουλεμένη αρχιτεκτονική πάνω στην οποία δουλεύουν πολλοί developers, γιατί μόνο έτσι ο κώδικας θα είναι πλήρως ρυθμισμένος και τροποποιημένος. Ανεξαρτήτως των "ωμών" διαφορών που είδαμε υπέρ του POWER7 στα νούμερα, η πραγματικότητα βρίσκεται πολύ πολύ μακριά... Πάντοτε οι εταιρείες θα δείχνουν μεγαλύτερο ενδιαφέρον για X86 CPUs, στα οποία το tuning και το optimization βρίσκονται έτη φωτός μπροστά.
Intel's Kennedy Brown and IBM's Kevin Powell show you a sneak peek of an 8 socket, 64 core, 128 thread IBM server based on Intel's Nehalem-EX processor
[youtube]http://www.youtube.com/watch?v=BQ4shSQJTd0&eurl=http%3A%2F%2Fwww.intel.com%2Fpressroom%2Farchive%2Freleases%2F20090526comp.htm&feature=player_embedded#t=145[/youtube]
.