處理器發展的趨勢從提高時脈到一定極限後,朝向多核心 的模式來提高運算的效能,逸奇科技剛好從台灣美商英特爾借到一台雙四核心的伺服器,進行計算效能以及Intel軟體的測試,讓讀者能夠了解如何發揮多核心 平行計算效能,以及Intel軟體對於效能上的影響,第一部分先介紹硬體與軟體的環境。

Part1軟硬體環境介紹
這次測試的機器特色在於安裝了,Intel最新款的四核心處理器,也就是在一個處理器裡封裝了四個核心(Core),每個核心各自有L1快取記憶體,以及 SSE延伸指令集,每兩個核心共享一組4MB的L2快取記憶體,在執行單一程式時可以使用到4MB的L2快取記憶體,若是同時8個核心執行運算,每個核心 可以分配到2MB的L2快取記憶體,由於處理器存取記憶體的延遲時間,L2快取記憶體的速度比主記憶體快了十幾倍以上,所以L2快取記憶體的空間越大,可 以大幅提升計算效能。

測試機器是由Supermicro組裝的,主機板型號為X7DB8,可以安裝兩顆四核心或是雙核心的Xeon處理器,具有16個記憶體插槽支援到64GB的記憶體。原廠網址

硬體外觀

內部散熱
這款伺服器特別的地方在於散熱的設計,使用透明壓克力將兩個四核心的處理器罩起來,如下圖處理器上安裝了兩個銅質熱導管,前後各加上兩個風扇,一邊吸一邊抽,可以快速的將處理器產生的熱氣帶出機殼。

軟體環境
作業系統共安裝Windows Server 2003 x64以及Enterprise Linux 4.0,來進行軟體測試,測試機器共安裝4GB的記憶體,請參考下圖系統屬性。

安裝的處理器代碼為Clovertown,請參考下圖透過CPU-Z畫面,此處理器的運算效能相當強悍,有興趣的讀者可以參考Intel網頁的介紹,上面也有官方的效能測試數據

如 果想在Windows環境下編譯程式可以參考下面的安裝指引,首先當然是先安裝好Windows 64位元的版本,之後需要先到Microsoft網頁上下載Platform SDK進行安裝,之後就可以安裝Intel Fortran Compiler for EM64T的版本。

請先下載
Platform SDK
執行畫面如下。

安裝過程中可以只選擇安裝Core部分,減少下載的時間。

接著是安裝Intel Fortran Compiler 9.1,安裝過程如下。

選擇Intel的License file,才能繼續安裝。

安裝時一定要選擇Extended Memory 64 Technology Edition的選項。

安裝好編譯器後可以從程式集裡打開Intel Fortran提供的終端機視窗。

啟動編譯用的視窗畫面如下,會顯示EM64T的字樣才能編譯出支援64位元的程式。

編譯簡單的測試例子如下。

執行前記得要設定使用幾個執行緒,方式如下
set OMP_NUM_THREADS=8
執行結果如下,可以看到八個核心都在運算。

同樣在Enterprise Linux 4.0的環境下,執行ifort –V的指令就可以出現版本細節,同樣也要確定是有安裝EM64T的版本。

編譯測試程式如下。

執行前同樣記得要設定使用幾個執行緒,方式如下
export OMP_NUM_THREADS=8
執行過程畫面如下,同樣可以透過top指令看到八個核心同時計算的結果,因為這個範例使用static link所以會出現八個執行程序,而這八個程序實際上是分享同樣的記憶體區段,透過平行計算加快運算速度。

測試的效能結果請點選下面的連結
Part 2 基本效能測試