Intel Nehalem Early Overclocking Guide !
Πρίν μεταφράσουμε και αναδημοσιέυσουμε το παρακάτω θέμα, θα ήθελα να πώ πώς έχουμε την εγκριση του ίδιου του συγγραφέα του aka saaya απο το xtremesystems.com . Το παρακάτω θέμα αναλύει τα βασικά στοιχεία για το overclocking των nehalem. Πώς θα λειτουργούν, τι ιδιαιτερότητες έχουν καθώς και το τι θα πρέπει να προσέχουμε κατά την διάρκεια του υπερχρονισμού τους !
Πρίν μεταφράσουμε και αναδημοσιέυσουμε το παρακάτω θέμα, θα ήθελα να πώ πώς έχουμε την εγκριση του ίδιου του συγγραφέα του aka saaya απο το xtremesystems.com . Το παρακάτω θέμα αναλύει τα βασικά στοιχεία για το overclocking των nehalem. Πώς θα λειτουργούν, τι ιδιαιτερότητες έχουν καθώς και το τι θα πρέπει να προσέχουμε κατά την διάρκεια του υπερχρονισμού τους !
Όπως θα ξέρετε, οι Nehalem δεν θα έχουν το FSB που είχαν μέχρι τώρα όλοι οι επεξεργαστές της Intel, αλλά ένα reference clock [Bclock] το οποίο και θα είναι χρονισμένο στα 133Mhz.Το Bclock θα είναι αυτό που θα πολλαπλασιάζεται με όλα τα υπόλοιπα στοιχεία του επεξεργαστή και θα δίνει όλα τα εσωτερικα "ρολόγια" του όπως ακολουθούν :
Bclock x CPU Multiplier = CPU Clock (12-256)
Bclock x QPI Multiplier = QPI Clock (18, 24)
Bclock x Uncore Multiplier = Uncore Clock (10-30)
Uncore clock / Memory Divider = Memory clock
Άμα διαθέτετε κάποιον Core i7 965 XE η υπόθεση είναι έυκολη. Αλλάζετε τον multiplier και ανεβάινουν τα MHz του εεξεργαστή. Αν διαθέτετε κάποιον άλλον κλειδωμένο επεξεργαστή, το μόνο πράγμα που μπορείτε να κάνετε έιναι να αυξάνετε το bclock. Μαζί με αυτόν όμως ανεβαίνουν και τα υπόλοιπα "ρολόγια" του επεξεργαστή όπως τα QPI, Uncore και ο memory controller/memory. Οπότε ίσως συναντήσετε περισσότερα προβλήματα με τα limitations που θα υπάρχουν.
Στην πραγμαατικότητα το να υπερχονίσετε το QPI δεν θα έχει σχεδόν κανένα αποτέλεσμα. Εϊναι όπως το AMD Hypertransport το οποιο και είναι πολύ δυνατό για Desktop συστήματα και ίσως χρήσιμο μόνο για εφαρμογή σε servers.
Τις περισσότερες φορές το QPI "τερματίζει" γύρω στα 8GT/s που σε MHz αυτό σημαίνει 4GHz. Όπως θα είδατε και παραπάνω, οι QPI Multiplier είναι δύο (18 & 24) πράγμα ο ποίο σημαίνει πώς όλοι οι χρήστες με Core i7 920 & 940 θα έχουν limit στο bclock γύρω στο 222 ( 18 x 222 = ~4000 ) .
Τι είναι το Uncore? Uncore ονομάζεται η L3 Cache και ο Memory Controller(ότι δηλαδή δεν είναι ο πυρήνας).
To Uncore, ενσωματωμένο πλέον μέσα στον επεξεργαστή, δεν τροφοδοτείται
απο το Vcore αλλά απο το VTT. Στις περισσότερες απο τις νέες X58 μητρικές το VTT πάιρνει ρέυμα απο ένα, δύο ή ακόμα και τέσσερα Phases. Ενώ το VTT σε Core 2 Duo/Quad είχε κατανάλωση 10W με 15W, στους nehalem θα έχει σχεδόν τα διπλά φτάνοντας τα 30W και αυτό θα το κάνει να υπερχονίζεται πιο πολύ απο την φύση του !
Όπως είπαμε και πιο πάνω, ο Memory Controller είναι μέσα στο "Uncore" και θα πρέπει να τρέχει 2 φορές την ταχύτητα του BUS ή και περισσότερο.
Παράδειγμα : Άμα έχουμε DDR3 στα 1066 με 533MHz memory Clock θα πρέπει το Uncore να τρέχει στα 2133MHz ή ακόμα παραπάνω.
Θα υπάρχουν διαφορετικοί Memory Dividers για να μπορεί ο κάθε χρήστης να χρονίζει την μνήμη του χαμηλότερα απο το μισό του memory controller/uncore. Σύμφωνα με την Intel, όλοι οι επεξεργαστές θα έχουν όλους τους dividers ξεκλείδωτους όπως επίσης και όλα τα Uncore Ratios ξεκλείδωτα, πράγμα που σημαίνει πώς ο καθένας θα μπορεί να τρέξει στο σύστημα του ακόμα και τις πιο γρήγορες μνήμες της αγοράς άσχετα με το CPU του !
Εφόσον το μεγαλύτερο ratio του Uncore θα είναι το 30, τότε σε default καταστάσεις του bclock, ένα CPU θα μπορεί να τρέχει στα 30x133=4000Mhz /2=2000Mhz(Uncore Speed)
Άμα έχετε μνήμες ταχύτερες των 2GHz (1ghz memory clock) θα πρέπει να υπερχονίσετε το reference clock. Η υψηλότερη θεωρητική ταχύτητα μνημών με το υψηλότερο bclock να είναι τα 222MHz θα μπορεί να είναι το 30x200=6000Mhz /2=3000Mhz, πράγμα που σημαίνει πώς στο μέλλον οι DDR3 στα 3000MHz θα είναι το "ταβάνι" για τους Nehalem και τις μητρικές τους !
Memory Kits πάνω απο 2GHz όπως τα Corsair 2133 ή τα περίφημα DDR3 2400MHz
που ακούγονται ολο'ένα και περισσότερο δεν θα μπορούν να τρέξουν σε αυτές τις ταχύτητες χωρίς να κάνουμε overclock τον επεξεργαστή.
Παρ'όλα αυτά φαίνεται πώς το X48 μπορεί να υπερχρονίσει πιο ψηλά τις μνήμες μας , αλλά το 3ple Channel πάνω στο X58 φαίνεται πώς απο θέμα επιδώσεων "ισωπεδώνει" τα πάντα στο πέρασμα του, όπως το X48 με υψηλότερες ταχύτητες σε μνήμες.
Τέλος, το να υπερχονίζουμε το Uncore, θα είναι πολύ χρήσιμο άσχετα αν δεν θέλουμε νε τρέχουμε σε πολύ μεγάλες συχνότητες τις μνήμες. Ποιος είναι ο λόγος?
Το Uncore όπως είπαμε πιο πάνω έχει μέσα του και την L3 Cache, οπότε υπερχρονίζοντάς το, θα μειώνει τα latencies της L3 και όλοι ξέρουμε πώς όσο πιο ψηλά είναι χρονισμένος ο Memory Controller, τόσο πιο αποτελεσματικά δουλέυει και τόσο πιο μεγάλο bandwidth δίνει, ακόμα και όταν οι μνήμες τρέχουν στις default τους ταχύτητες.
Παρακάτω παραθέτουμε κάποιο προτινόμενα Settings απο κάποιον Intel Guy που δεν ήθελε να αποκαλύψει τον ευατό του αλλά βοήθησε τον sayaa στο να γράψει αυτόν τον οδηγό :
Αυξάνουμε το Bclock καθώς και την τάση στο VTT και QPI για να πάρουμε το μέγιστο δυνατό bclock. Το maximum 100% ασφαλές VTT είναι το 1.65v !
Αυξάνουμε το Bclock, αυξάνουμε την τάση του VTT και του Vdimm για να πάρουμε το μέγιστο δυνατό memory clock. Παραπάνω Vdimm & VTT απο 1.65 ίσως να μην είναι ασφαλές . Παρ'όλα αυτά, το Vdimm μέχρι και 1.8V φαίνεται πώς είναι 100% ok!
Μειώνουμε το Bclock και εν συνεχεία αυξάνουμε ένα πρός ένα το CPU Multiplier.Ανεβάζουμε το Vcore για να έιμαστε σταθερότεροι στις μέγιστες συχνότητες.
max Bclock
CPU Multiplier 15x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
High Memory Divider for low memory clock
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
Αυξάνουμε τα CPU multipliers βήμα πρός βήμα, ανεβάζουμε το Vcore για να έιμαστε σταθερότεροι στις μέγιστες συχνότητες. Άμα δεν είμαστε σταθεροί σε έναν multiplier, μειώνουμε σκαλί σκαλί το bclock μέχρι να γίνουμε σταθεροι. Το maximum bclock για τα μεγάλα multipliers είναι ελάχιστα χαμηλότερο απο αυτό των μικρών multiplier.
Clockspeeds
Όπως θα ξέρετε, οι Nehalem δεν θα έχουν το FSB που είχαν μέχρι τώρα όλοι οι επεξεργαστές της Intel, αλλά ένα reference clock [Bclock] το οποίο και θα είναι χρονισμένο στα 133Mhz.Το Bclock θα είναι αυτό που θα πολλαπλασιάζεται με όλα τα υπόλοιπα στοιχεία του επεξεργαστή και θα δίνει όλα τα εσωτερικα "ρολόγια" του όπως ακολουθούν :
Bclock x CPU Multiplier = CPU Clock (12-256)
Bclock x QPI Multiplier = QPI Clock (18, 24)
Bclock x Uncore Multiplier = Uncore Clock (10-30)
Uncore clock / Memory Divider = Memory clock
Overclocking
Άμα διαθέτετε κάποιον Core i7 965 XE η υπόθεση είναι έυκολη. Αλλάζετε τον multiplier και ανεβάινουν τα MHz του εεξεργαστή. Αν διαθέτετε κάποιον άλλον κλειδωμένο επεξεργαστή, το μόνο πράγμα που μπορείτε να κάνετε έιναι να αυξάνετε το bclock. Μαζί με αυτόν όμως ανεβαίνουν και τα υπόλοιπα "ρολόγια" του επεξεργαστή όπως τα QPI, Uncore και ο memory controller/memory. Οπότε ίσως συναντήσετε περισσότερα προβλήματα με τα limitations που θα υπάρχουν.
QPI
Στην πραγμαατικότητα το να υπερχονίσετε το QPI δεν θα έχει σχεδόν κανένα αποτέλεσμα. Εϊναι όπως το AMD Hypertransport το οποιο και είναι πολύ δυνατό για Desktop συστήματα και ίσως χρήσιμο μόνο για εφαρμογή σε servers.
Τις περισσότερες φορές το QPI "τερματίζει" γύρω στα 8GT/s που σε MHz αυτό σημαίνει 4GHz. Όπως θα είδατε και παραπάνω, οι QPI Multiplier είναι δύο (18 & 24) πράγμα ο ποίο σημαίνει πώς όλοι οι χρήστες με Core i7 920 & 940 θα έχουν limit στο bclock γύρω στο 222 ( 18 x 222 = ~4000 ) .
Uncore
Τι είναι το Uncore? Uncore ονομάζεται η L3 Cache και ο Memory Controller(ότι δηλαδή δεν είναι ο πυρήνας).
To Uncore, ενσωματωμένο πλέον μέσα στον επεξεργαστή, δεν τροφοδοτείται
απο το Vcore αλλά απο το VTT. Στις περισσότερες απο τις νέες X58 μητρικές το VTT πάιρνει ρέυμα απο ένα, δύο ή ακόμα και τέσσερα Phases. Ενώ το VTT σε Core 2 Duo/Quad είχε κατανάλωση 10W με 15W, στους nehalem θα έχει σχεδόν τα διπλά φτάνοντας τα 30W και αυτό θα το κάνει να υπερχονίζεται πιο πολύ απο την φύση του !
3ple Channel Memories
Όπως είπαμε και πιο πάνω, ο Memory Controller είναι μέσα στο "Uncore" και θα πρέπει να τρέχει 2 φορές την ταχύτητα του BUS ή και περισσότερο.
Παράδειγμα : Άμα έχουμε DDR3 στα 1066 με 533MHz memory Clock θα πρέπει το Uncore να τρέχει στα 2133MHz ή ακόμα παραπάνω.
Θα υπάρχουν διαφορετικοί Memory Dividers για να μπορεί ο κάθε χρήστης να χρονίζει την μνήμη του χαμηλότερα απο το μισό του memory controller/uncore. Σύμφωνα με την Intel, όλοι οι επεξεργαστές θα έχουν όλους τους dividers ξεκλείδωτους όπως επίσης και όλα τα Uncore Ratios ξεκλείδωτα, πράγμα που σημαίνει πώς ο καθένας θα μπορεί να τρέξει στο σύστημα του ακόμα και τις πιο γρήγορες μνήμες της αγοράς άσχετα με το CPU του !
Εφόσον το μεγαλύτερο ratio του Uncore θα είναι το 30, τότε σε default καταστάσεις του bclock, ένα CPU θα μπορεί να τρέχει στα 30x133=4000Mhz /2=2000Mhz(Uncore Speed)
Άμα έχετε μνήμες ταχύτερες των 2GHz (1ghz memory clock) θα πρέπει να υπερχονίσετε το reference clock. Η υψηλότερη θεωρητική ταχύτητα μνημών με το υψηλότερο bclock να είναι τα 222MHz θα μπορεί να είναι το 30x200=6000Mhz /2=3000Mhz, πράγμα που σημαίνει πώς στο μέλλον οι DDR3 στα 3000MHz θα είναι το "ταβάνι" για τους Nehalem και τις μητρικές τους !
Memory Kits πάνω απο 2GHz όπως τα Corsair 2133 ή τα περίφημα DDR3 2400MHz
που ακούγονται ολο'ένα και περισσότερο δεν θα μπορούν να τρέξουν σε αυτές τις ταχύτητες χωρίς να κάνουμε overclock τον επεξεργαστή.
Παρ'όλα αυτά φαίνεται πώς το X48 μπορεί να υπερχρονίσει πιο ψηλά τις μνήμες μας , αλλά το 3ple Channel πάνω στο X58 φαίνεται πώς απο θέμα επιδώσεων "ισωπεδώνει" τα πάντα στο πέρασμα του, όπως το X48 με υψηλότερες ταχύτητες σε μνήμες.
Τέλος, το να υπερχονίζουμε το Uncore, θα είναι πολύ χρήσιμο άσχετα αν δεν θέλουμε νε τρέχουμε σε πολύ μεγάλες συχνότητες τις μνήμες. Ποιος είναι ο λόγος?
Το Uncore όπως είπαμε πιο πάνω έχει μέσα του και την L3 Cache, οπότε υπερχρονίζοντάς το, θα μειώνει τα latencies της L3 και όλοι ξέρουμε πώς όσο πιο ψηλά είναι χρονισμένος ο Memory Controller, τόσο πιο αποτελεσματικά δουλέυει και τόσο πιο μεγάλο bandwidth δίνει, ακόμα και όταν οι μνήμες τρέχουν στις default τους ταχύτητες.
Παρακάτω παραθέτουμε κάποιο προτινόμενα Settings απο κάποιον Intel Guy που δεν ήθελε να αποκαλύψει τον ευατό του αλλά βοήθησε τον sayaa στο να γράψει αυτόν τον οδηγό :
How to find max Bclock:
Bclock 133Mhz
CPU Multiplier 12x/14x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
High memory Divider for low memory clock
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
CPU Multiplier 12x/14x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
High memory Divider for low memory clock
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
Αυξάνουμε το Bclock καθώς και την τάση στο VTT και QPI για να πάρουμε το μέγιστο δυνατό bclock. Το maximum 100% ασφαλές VTT είναι το 1.65v !
How to find max Mem clock:
Bclock 133Mhz
CPU Multiplier 12x/14x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
Chose Memory Divider and Timings
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
CPU Multiplier 12x/14x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
Chose Memory Divider and Timings
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
Αυξάνουμε το Bclock, αυξάνουμε την τάση του VTT και του Vdimm για να πάρουμε το μέγιστο δυνατό memory clock. Παραπάνω Vdimm & VTT απο 1.65 ίσως να μην είναι ασφαλές . Παρ'όλα αυτά, το Vdimm μέχρι και 1.8V φαίνεται πώς είναι 100% ok!
How to find max CPU Clocks on i7-965:
Bclock 133Mhz or lower
CPU Multiplier 24x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
High Memory Divider for low memory clock
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
CPU Multiplier 24x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
High Memory Divider for low memory clock
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
Μειώνουμε το Bclock και εν συνεχεία αυξάνουμε ένα πρός ένα το CPU Multiplier.Ανεβάζουμε το Vcore για να έιμαστε σταθερότεροι στις μέγιστες συχνότητες.
How to find max CPU Clocks on i7-940/i7-920:
max Bclock
CPU Multiplier 15x
Uncore Multiplier 2x memory speed or higher
QPI Multiplier 18x
High Memory Divider for low memory clock
Vcore 1.25v
VTT 1.45v
Vdimm 1.65v
Αυξάνουμε τα CPU multipliers βήμα πρός βήμα, ανεβάζουμε το Vcore για να έιμαστε σταθερότεροι στις μέγιστες συχνότητες. Άμα δεν είμαστε σταθεροί σε έναν multiplier, μειώνουμε σκαλί σκαλί το bclock μέχρι να γίνουμε σταθεροι. Το maximum bclock για τα μεγάλα multipliers είναι ελάχιστα χαμηλότερο απο αυτό των μικρών multiplier.
Αυτά για την ώρα και μέχρι να κυκλοφορήσουν retail nehalem έτσι ώστε να δούμε και απο μόνοι μας τι ισχύει !