رفتن به مطلب
انجمن تایم کد

Recommended Posts

بررسي تخصصي پردازنده Haswell اينتل : نسل جديد پردازنده هاي اينتل چگونه عمل مي کنند؟

مدتی است که در فهرست مشخصات لپ‌تاپ‌ها، دسکتاپ‌ها و اولترابوک‌های جدید نام پردازنده‌های جدید اینتل یعنی نسل چهارم خانواده‌ی Core با عنوان Haswell را می‌بینیم و طبق معمول این سوال مهم مطرح می‌شود که تفاوت نسل جدید با نسل سوم یا آیوی بریج چیست؟ در این مطلب می‌خواهیم نگاهی اجمالی به هسول‌ها داشته باشیم و از آن مهم‌تر، نتیجه‌ی بهینه‌سازی‌های اینتل را در تست‌ها، بازی‌ها و بنچمارک‌ها ببینیم.

 

اینتل مدعی است که کارایی نسل جدید با سرعت کلاک مساوی، 5 الی 15 درصد نسبت به آیوی بریجی‌ها یا به عبارت دیگر، نسل سوم خانواده‌ی Core افزایش نشان می‌دهد. مصرف انرژی، افزایش خاصی نداشته و در مجموع عملکرد اینتل در طراحی نسل جدید به نظر راضی‌کننده ‌می‌رسد، اما انقلابی نیست.

تغییرات اعمال شده در هسول

هسول هم مثل نسل قبلی از لیتوگرافی 22 نانومتری استفاده می‌کند. از نظر معماری، موتور اجرایی اینتل مثل همیشه بهبود یافته است. اندازه‌ی بافر بیشتر شده و ساختار اطلاعات در هسته‌های پردازنده بهتر شده است. اجرای خارج از نوبت دستورات (یا OoOE) پیشرفت کرده و لذا اجرای دستورات به صورت موازی، باز هم بهتر از قبل است. بخش بعد از کانال اطلاعات یا به عبارتی پایپ‌لاین، بهتر از قبل پیش‌بینی می‌کند و دستورات را تقسیم می‌نماید.

در هسول دو درگاه اجرایی جدید اضافه شده است، در واقع بعد از اختراع اولین خانواده‌ی پردازنده‌های Core در سال 2006 همواره از 6 درگاه اجرایی استفاده می‌شد تا اینکه اینتل بالاخره این تعداد را به 8 عدد افزایش داده است.

از نظر مجموعه دستورات پشتیبانی شده، AVX2 ( مخفف Advanced Vector Extensions یا نسخه‌ی دوم اکستنشن‌های پیشرفته‌ی برداری) اضافه شده که شامل یک عمل FMA (مخف Fused Multiply-Add به معنی عمل ترکیبی ممیز شناوری جمع و ضرب) است، این عمل خروجی محاسبات ممیز شناوری را تا حد قابل توجهی افزایش می‌دهد. با دو برابر شدن خروجی ممیز شناوری، کش سطح L1 نیز دارای پهنای باند دو برابر شده تا اطلاعات کافی را به غول‌های جدید پردازشی اینتل برساند. در برخی مدل‌های هسول از دستورات تراکنشی حافظه یا TSX نیز پشتیبانی می‌شود.

در هسول تأخیر بیشتری در دسترسی به حافظه وجود دارد، البته در تمام مدل‌ها و تمام محدوده‌ی حافظه این وضعیت قابل مشاهده نیست:

1.jpg

کش L3 نقشه‌ی جداگانه‌ای برای انرژی مصرفی و فرکانس کاری خود دارد و به نظر می‌رسد که آرام‌تر از قبل مشغول فعالیت است. در واقع دسترسی به آن با تأخیری در حد 2 تا 3 سیکل انجام می‌شود که حاصل جدا کردن کش L3 است.

هسول و توان مصرفی کمتر

هسول‌ها در مجموع مصرف انرژی کمتری دارند. به خصوص هسول‌های سری U و Y که برای اولترابوک‌ها و تبلت‌ها در نظر گرفته شده‌اند.

سوییچ بین حالات مختلف مصرف انرژی چیپ‌ست و هسته‌های پردازنده، حدود 25 درصد سریع‌تر از آیوی بریج است. بنابراین مدیریت مصرف انرژی بهتر از قبل صورت می‌گیرد و انتخاب حالات کم‌مصرف با سرعتی بالاتری انجام می‌شود. در حالت بی‌کار نیز انرژی مصرفی پلتفرم کاهش زیادی داشته است.

در نمودار زیر انرژی مصرف پردازنده‌های هسول و آیوی بریج در کنار مادربوردهای Z77 Deluxe و Z87 Deluxe ایسوس نمایش داده شده است:

2.jpg

البته این تنها به پردازنده‌ی اینتل مربوط نمی‌شود، ایسوس هم برای ارائه‌ی محصول بهتر و فروش بیشتر، تلاش خود را کرده است اما به هر حال ادعای اینتل مبنی بر اینکه نوت‌بوک‌ها و اولترابوک‌های هسولی 50 درصد کم‌مصرف‌تر بوده و تا 9 یا 10 ساعت با شارژ باتری روشن می‌مانند، بی‌اساس نیست.

مصرف انرژی هسول در بار سنگین پردازشی بیشتر از آیوی بریج است، مثلاً بار پردازشی اینکودر ویدیویی x264 که با استفاده از تمام هسته‌ها، ویدیو را تبدیل می‌کند.

بنابراین اگر از نوت‌بوک هسولی در بار پردازشی سنگین استفاده شود، مصرف انرژی آن کم و بیش مشابه مدل‌های آیوی بریجی خواهد بود.

Core i7-4770K نسبت به پرچم‌دار نسل قبل یعنی Core i7-3770K حدود 11 درصد بیشتر مصرف کرده و 13 درصد کارایی بالاتری دارد. لذا کارایی به ازای هر وات برق مصرفی، افزایش کوچکی داشته است.

هسول و کنترلر حافظه‌ی بهتر، اورکلاک ساده‌تر

در هسول کنترلر حافظه پیشرفت خوبی داشته است. البته آیوی بریج هم بسیار عالی است اما هسول دیو قدرتمندی در زمینه‌ی اورکلاک کردن حافظه‌ به حساب می‌آید.

3.jpg

هسول و درگاه‌ها و اتصالات جانبی کامل‌تر

در چیپ‌ست‌های سری 8 اینتل از سوکت 1150 پینی پردازنده استفاده شده است و لذا نمی‌توان پردازنده‌های جدید را در مادربوردهای سری 7 قرار داد. شاید علت این تغییر شدید، تغییرات اساسی به وجود آمده در رابطه با انتقال توان مصرفی است.

در چیپ‌ست سری 8 نهایتاً 6 درگاه SATA 6 Gb/s وجود دارد، چیزی که در 7 به 2 عدد محدود شده بود. 4 درگاه یو‌اس‌بی 3 نیز پشتیبانی شده است.

4.jpg

5.jpg

اورکلاک کردن یک هسول

در هسول از رگولاتور ولتاژ کاملاً یکپارچه با پردازنده یا به اختصار FIVR استفاده شده است، بنابراین توان مصرفی از 77 واتی که در آیوی بریج دیده بودیم، به 84 وات افزایش یافته است چرا که مدیریت توان مصرفی پیشرفته‌تر شده است.

محدودیت‌های اورکلاکی که با معرفی سندی بریج شروع شد و در آیوی بریج هم ادامه داشت، باز هم وجود دارد. بنابراین تمام مدل‌های معمولی از نظر فرکانسی قفل هستند یا به عبارت بهتر، نمی‌توان ضریب کلاک پایه را به صورت دلخواه انتخاب نمود. اما در مدل‌های سری K باز هم مثل قبل همه چیز کاملاً آنلاک شده است. یکی از تغییرات مهم این است که می‌توان برای کلاک پایه یا BCLK سه حالت انتخاب کرد، 100، 125و 167 مگاهرتز. بنابراین هسول در اورکلاک کردن، انعطاف بیشتری از خود نشان می‌دهد.

6.jpg

7.jpg

در هسول با ولتاژ 1.2 الی 1.35 ولت می‌توان به سرعت کلاکی بین 4.3 تا 7 گیگاهرتز دست یافت. البته با استفاده از خنک‌کاری با هوا و در نظر گرفتن این موضوع که در سرعت‌های بالای 5 گیگاهرتز، خنک‌کاری سیستم باید کارایی بالایی داشته باشد.

روند معرفی پردازنده‌های جدید

امسال اینتل از پردازنده‌های قدرتمند 4 هسته‌ای شروع می‌کند و تدریجاً 2 هسته‌ای‌ها و مدل‌های ویژه اولترابوک‌ها و نوت‌بوک‌های سبک را روانه‌ی بازار خواهد کرد. خانواده‌ی جدیدی از محصولات با پسوند R نیز در راه هستند که دارای سوکت معمولی نمی‌باشند. منظور از سوکت BGA یا Ball Grid Array در این تراشه‌ها این است که سطح زیرین با شبکه‌ای از کره‌های لحیم پوشانده شده و مستقیماً روی برد مدار چاپی مادربورد، لحیم می‌شوند. Core i7-4770R یکی از این مدل‌هاست که از گرافیک قدرتمند و جدید Iris Pro 5200 استفاده می‌کند. باقی مدل‌ها از گرافیک GT2 یا HD 4600 بهره می‌برند که 20 واحد اجرایی دارد و نسبت به HD 4000 با 16 واحد اجرایی، سریع‌تر است. GT3e آیریس پرو 5200 دارای 40 واحد پردازشی و حافظه‌ی داخلی DRAM است و در ادامه بیشتر به آن می‌پردازیم. کش L3 مدل Core i7-4770R نیز به 6 مگابایت تقلیل یافته است.

8.jpg

تمام Core i7ها دارای تکنولوژی هایپرتردینگ هستند و به عبارت دیگر 4 هسته‌ی واقعی و 4 هسته‌ی مجازی دارند تا عملکرد بالاتری داشته باشند. مدل‌هایی با پسوند S نسبت به مدل‌های معمولی، کمتر در فرکانس توربوبوست فعالیت می‌کنند و این به علت مصرف انرژی کمتر است. مدل‌هایی با پسوند T توان مصرفی پایین‌تری دارند و لذا مدت زمان کمتری در فرکانس کاری ماکسیمم کار می‌کنند. پشتیبانی از AVX2، Quick Sync، AES-NI، PCIe 3.0 و تکنولوژی مجازی‌سازی اینتل در تمام مدل‌ها وجود دارد. در 4770K و 4770R از vPro، TXT، VT-d و SIPP نیز پشتیبانی می‌شوند.

پردازنده‌های Core i5 با قیمت دو سوم، کارایی بسیار بالایی دارند که اغلب اوقات به مدل‌های Core i7 نزدیک است. در این محصولات هایپرتردینگ و به عبارتی هسته‌های مجازی وجود ندارد. تمام مدل‌ها از گرافیک HD 4600 استفاده می‌کنند. هیچ یک از مدل‌ها از vPro، TXT و VT-d پشتیبانی نمی‌کند.

9.jpg

فعلاً خبری از مدل‌های 2 هسته‌ای و مدل‌های Core i3 نشده است. شاید فصل آتی مشخصات این مدل‌ها منتشر شود.

مساحت و تعداد ترانزیستور

امسال مطابق معمول تعداد ترانزیستور در پردازنده‌های اینتل افزایش داشته است. مساحت روند نزولی که از سندی بریج تا آیوی بریج دیده میشد را طی نکرده و در بیشتر مدل‌ها، سطح قالب تراشه افزایش داشته است.

10.jpg

11.jpg

در مدل‌هایی که از گرافیک قدرتمند GT3 استفاده می‌کنند، مساحت 87 میلی‌متر مربع بیش از مدل‌هایی است که از GT2 بهره می‌گیرند. بنابراین مدل‌هایی که از 40 واحد پردازش گرافیکی استفاده می‌کنند احتمالاً افزایش دوبرابری در مساحت دارند یعنی 174 میلی‌متر مربع بزرگ‌تر هستند. جالب است که در یک پردازنده‌ی 4 هسته‌ای هسول با گرافیک GT3 حدود 65 درصد سطح قالب به پردازنده‌ی گرافیکی اختصاص می‌یابد. این رقم در مورد تراشه‌هایی با گرافیک GT2، تنها 33 درصد است. 128 مگابایت حافظه‌ی eDRAM نیز 84 میلی‌متر مربع به بسته‌ی کلی تراشه اضافه می‌کند.

اما به یک نکته‌ی جالب توجه کنید. یک هسول 4 هسته‌ای با گرافیک GT2 و 1.4 بیلیون ترانزیستور مساحت تراشه برابر با 177 میلی‌متر مربع است. در یک آیوی بریج با 1.2 بیلیون ترانزیستور و گرافیک GT2، مساحت تراشه 160 میلی‌متر مربع بود. بنابراین نتیجه می‌گیریم که هسول با 17 درصد ترانزیستور بیشتر تنها 11 درصد بزرگ‌تر است. علاوه بر ترانزیستورهای بیشتر، شامل پردازنده‌ی گرافیکی بزرگ‌تر و قابلیت‌های دیگری نیز هست. بنابراین به این نتیجه می‌رسیم که اینتل معماری جدید خود را کوچک‌تر از آیوی بریجی که خود یک تراشه‌ی فوق‌العاده کوچک بود، طراحی کرده است.

کارایی پردازنده

هوسل نسبت به آیوی بریج بین 1 الی 19 درصد سریع‌تر است و میانگین 8.3 درصدی افزایش سرعت پردازش، یک رکورد خوب است. نسبت به سندی بریج نیز بین 7 تا 26 درصد افزایش سرعت وجود دارد. البته با توجه به نتیجه‌ی بنچ‌مارک Kraken می‌توان گفت که افزایش 7.8 درصدی سرعت محاسبات، نشانگر این است که هسول هنوز هم جای بهینه‌سازی دارد.

اولین بنچ‌مارک که سرعت پردازنده را در انجام محاسبات تک‌تردی و چند تردی نشان می‌دهد، Cinebench 11.5 است. نتیجه را در نمودارهای زیر ببینید:

12.jpg

13.jpg

مشاهده می‌کنید که فقدان هایپرتردینگ در مدل Core i5 هسول، عملکرد چند تردی آن را نسبت به رقبای نسل‌های قبلی که دارای هایپرتردینگ و به عبارتی هسته‌های مجازی هستند، تا چه حد پایین آورده است.

تست بعدی نرم‌افزار معروف فشرده‌سازی فایل یعنی 7-zip می‌باشد، این بار هم عملکرد به صورت تک تردی و چند هسته‌ای مورد مقایسه قرار می‌گیرد:

14.jpg

15.jpg

بنچ‌مارک جاوااسکریپت در مرورگر کروم:

16.jpg

بنچ‌مارک تبدیل فایل ویدیویی با اینکدر معروف x264:

17.jpg

18.jpg

بنچ‌مارک رمزگذاری TrueCrypt:

19.jpg

تست کامپایل کردن موزیلا فایرفاکس در ویژوآل استودیوی 2012:

20.jpg

جالب است که هسول در کامپایل کردن 15 درصد سریع‌تر از آیوی بریج عمل کرده، آن هم با فرکانس کاری یکسان. این تست نشان می‌دهد که بهینه شدن هسول از نظر تعداد دستوراتی که در یک سیکل کلاک انجام می‌شود، یا به عبارتی بهبود IPC چه تأثیری در کاربردهای روزمره‌ی یک برنامه‌نویس دارد.

نگاهی عمیق‌تر و دقیق‌تر به پیشرفت اینتل در بهینه کردن پردازنده‌ها برای محاسبات تک‌تردی داشته باشیم:

21.jpg

کارایی در بازی‌ها

هسول در اجرای بازی با استفاده از یک کارت گرافیک HD 7970 در رزولوشن 1440p کمی بهتر از نسل قبلی عمل کرده است، دو بازی Civilization V و Dirt 3 را به عنوان نمونه مقایسه می‌کنیم:

22.jpg

23.jpg

کارایی Quick Sync

اینتل مدعی است که تمرکز خود را روی بهبود کیفیت تبدیل ویدیو از طریق Quick Sync گذاشته است. اما متأسفانه کیفیت ویدیو تقلیل کمی داشته ولیکن عملکرد آن افزایش یافته است. علت اصلی افزایش سرعت، افزایش تعداد واحدهای اجرایی در پردازنده‌ی گرافیکی است. مخصوصاً در مورد هسول‌هایی با پردازنده‌ی گرافیکی قوی‌تر و 128 مگابایت حافظه‌ی کش سطح 4 که Core i7-4950HQ یکی از این مدل‌هاست.

توجه داشته باشید که برتری 4770K در نمودار زیر به علت سرعت کلاک بالاتر است، چیزی که در 4950HQ با به کارگیری 128 مگابایت کش L4 و پردازنده‌ی گرافیکی برتر، جبران می‌شود:

24.jpg

بررسی کارایی پردازنده‌ی گرافیکی مجتمع جدید اینتل

HD 4000 اینتل را کم و بیش می‌شناسیم. یک پردازنده‌ی گرافیکی مجتمع با 16 واحد پردازشی یا EU که در آیوی بریج استفاده می‌شد. نام این پردازنده GT1 است.

در هسول GT2، GT3 و GT3e نیز وارد میدان رقابت شده‌اند. GT2 یا مدل‌های HD 4200، HD 4400 و HD 4600 دارای 20 واحد پردازشی هستند. نسخه‌ی مخصوص این پردازنده برای سرورها و ایستگاه‌های کاری نیز P4600 و P4700 می‌باشد.

برادر بزرگ‌تر این خانواده GT3 است که 40 واحد پردازشی دارد و فرکانس کاری آن کمتر از 1.1 گیگاهرتز است. اگر فرکانس کاری GT3 به رقم 1.3 گیگاهرتز برسد، نام آن از HD 5000 به Iris 5100 تغییر می‌کند. بله، این بار اینتل هم مثل رقبای خود یعنی انویدیا و ای‌ام‌دی، برای پردازنده‌های گرافیکی خود اسم انتخاب کرده است. البته هنوز به مرحله‌ای نرسیده که برای تک‌تک مدل‌ها، اسامی هیجان‌انگیز و جالب انتخاب کند. آیریس پرو 5200 یا GT3e نیز قدرتمندترین گرافیک مجتمع اینتل است که علاوه بر 40 واحد پردازشی و سرعت کلاک بالا، دارای 128 مگابایت حافظه‌ی eDRAM یا حافظه‌ی داخلی DRAM است.

25.jpg

قدرت پردازش خام این پردازنده‌ها بسیار متفاوت است. اما در بهترین حالت 3 برابر از نسل قبلی سریع‌تر هستند و رکورد 832 گیگافلاپسی از خود به جای می‌گذارند. این رقم در مقایسه با تایتان انویدیا و نپتون ای‌ام‌دی که بیش از 3 ترافلاپس قدرت دارند، بسیار کمتر است اما با توجه به توان مصرفی و قیمت تمام شده، برای مشتریانی که بودجه‌ی کافی ندارند، بسیار عالی است. علاوه بر این توجه داشته باشید که آیریس پرو 5200 بیشتر از کارت گرافیک مخصوص وسایل همراه GT 650M و حتی GT 750M قدرت دارد. جالب است که A6X پردازنده‌ی آیپد 4 اپل که یکی از بهترین پردازنده‌های گرافیکی به کار رفته در تبلت‌هاست، در مقابل آیریس پرو 5200 هیچ شانسی ندارد:

26.jpg

حتی APUهای نسل قبلی ای‌ام‌دی هم شانسی برای رقابت با آیریس پرو 5200 ندارند گرچه نسل جدید تراشه‌های ای‌ام‌دی نیز پیشرفت قابل توجهی داشته است:

27.jpg

توان مصرفی GT3 تنها 28 وات است، اما ببینیم با این توان مصرفی پایین در اجرای بازی‌های امروزی چطور ظاهر می‌شود؟ همه‌چیز را در اجرای چند بازی سنگین خلاصه می‌کنیم. بازی‌های تومب رِیدر، کرایسیس 3، بتل‌فیلد 3 و بایوشاک اینفینیت را به عنوان نمونه انتخاب کردیم:

28.jpg

29.jpg

30.jpg

31.jpg

جمع‌بندی

هسول از نظر اجرای دستورات پردازشی به صورت تک‌هسته‌ای یا چند هسته‌ای پیشرفت نسبتاً خوبی نسبت به آیوی بریج داشته است. اما تمرکز اصلی اینتل بر معرفی تراشه‌های کم‌مصرف که پردازنده‌ی گرافیکی بهتری دارند بوده و نتایج تست‌ها و بنچ‌مارک‌ها نیز موید این مطلب است.

هسول‌هایی با گرافیک آیریس و آیریس پرو 5200 نسبت به کارت گرافیک‌های جداگانه، عملکرد بسیار خوب و رضایت‌بخشی دارند. علاوه بر این مصرف انرژی پردازنده‌ی اصلی و پردازنده‌ی گرافیکی در مجموع، بسیار پایین است به طوری که در اولترابوک‌ها و لپ‌تاپ‌های سبکی که در آینده رونمایی می‌شوند، بیش از پیش شاهد استفاده از تراشه‌های هسول بدون کارت گرافیک جداگانه خواهیم بود.

این بار اینتل در رقابت با APUهای ارزان‌قیمت ای‌ام‌دی که دارای گرافیک مجتمع HD 7660D و HD 7660G و مدل‌های ضعیف‌تر هستند، عملکرد خوبی داشته و در تست‌ها بالاخره از پس این محصولات ارزان‌قیمت برآمده است. اگر در زمینه‌ی قیمت‌گذاری هم موفق باشد، موفقیت بیشتری کسب خواهد کرد اما باید ببینیم نسل جدید تراشه‌های ای‌ام‌دی چطور از پس اینتل بر می‌آیند.

نظر شما در مورد هسول چیست؟ به نظر شما برای بازی‌ها می‌توان از آن استفاده کرد و کارت گرافیک جداگانه را کنار گذاشت؟ در مورد دسکتاپ چطور؟ آیا بر کارت گرافیک‌های رده پایین دسکتاپ غلبه خواهد کرد و مشتریان را به سمت خود خواهد کشید؟ برای دسکتاپ و همچنین نوت‌بوک، شما کدام را انتخاب می‌کنید، گرافیک مجتمعی از ای‌ام‌دی یا اینتل و یا به کلی سراغ کارت گرافیک جداگانه‌ای از انویدیا یا ای‌ام‌دی می‌روید؟

 

برای حفظ و احترام به سایت منبع لینک منبع رو میزارم تا حق کپی رایت رعایت بشه

 

به اشتراک گذاری این پست


لینک به پست
به اشتراک گذاری در سایت های دیگر

برای ارسال نظر یک حساب کاربری ایجاد کنید یا وارد حساب خود شوید

برای اینکه بتوانید نظر ارسال کنید نیاز دارید که کاربر سایت شوید

ایجاد یک حساب کاربری

برای حساب کاربری جدید در انجمن ما ثبت نام کنید. عضویت خیلی ساده است !

ثبت نام یک حساب کاربری جدید

ورود به حساب کاربری

دارای حساب کاربری هستید؟ از اینجا وارد شوید

ورود به حساب کاربری


×