企業(yè)空間 > 案例應(yīng)用 > 正文

如何創(chuàng)建及諧調(diào)支持多核的LabVIEW x86客戶DLL
發(fā)布時(shí)間：修改時(shí)間：2009/5/20 10:57:45 瀏覽次數(shù)：1702

　　作者:
　　Stephen Blair-Chappell，技術(shù)支持工程師 - Intel (英國), working in partnership with Hitex UK Ltd.
　　產(chǎn)品:
　　軟件
　　挑戰(zhàn):
　　對(duì)NI LabVIEW軟件自動(dòng)生成的外部代碼進(jìn)行最優(yōu)化，在x86構(gòu)架下獲得最大性能，進(jìn)而測(cè)量目標(biāo)系統(tǒng)中DLL性能。
　　解決方案:
　　在不修改源代碼的條件下，通過Intel C++ 編譯器在單核PC上實(shí)現(xiàn)2.5 倍提速，通過編譯器中的各類最優(yōu)化選項(xiàng)在雙核PC 上實(shí)現(xiàn)超過4.5 倍提速。
　　"VTune能夠監(jiān)測(cè)許多不同種類的構(gòu)架事件。VTune調(diào)諧助手能夠給出如何更好使用這些事件的建議。"
　　本應(yīng)用包括了兩個(gè)組件——用于計(jì)算Pi 值的DLL、調(diào)用DLL 庫函數(shù)的LabVIEW 應(yīng)用，可將結(jié)果顯示在圖形用戶界面中。
　　為計(jì)算Pi 值，我們采用了近似綜合技術(shù)，需要在單個(gè)循環(huán)中完成數(shù)百萬次浮點(diǎn)計(jì)算。選擇該范例是因?yàn)樗荂PU 密集型的，并且是可優(yōu)化的應(yīng)用。如下所示為外部代碼的主循環(huán)結(jié)構(gòu)，CPU的主要計(jì)算量是處理CalcSum 函數(shù)。
　　for（i=0; i<num_steps; i++）
　　｛
　　sum = CalcSum（i, sum, step）;
　　｝
　　我們的目標(biāo)是通過編譯器中的優(yōu)化選項(xiàng)以最快速度完成上述計(jì)算。
　　應(yīng)用中有4 個(gè)函數(shù)，均包含于獨(dú)立源文件中。我們采用不同優(yōu)化開關(guān)來編譯每個(gè)源文件。如圖1 所示。

表1.應(yīng)用中的函數(shù)

　　“即插即用”的Intel C++ 編譯器
　　我們采用即插即用的Intel C++ 來代替Microsoft 編譯器，它可以輕松地集成到現(xiàn)有Microsoft Visual Studio DLL 工程中。更多關(guān)于Intel 編譯器，請(qǐng)?jiān)L問intel.com/software。
　　默認(rèn)設(shè)置
　　測(cè)量首先以/O2選項(xiàng)創(chuàng)建應(yīng)用，許多優(yōu)化都是在這個(gè)層面上進(jìn)行的。本文在此不討論其細(xì)節(jié)問題。表2顯示了/O2選項(xiàng)集成的各個(gè)優(yōu)化設(shè)置。

表2./O2 選項(xiàng)中集成的最優(yōu)化列表

　　自動(dòng)向量化
　　自動(dòng)向量化得益于新一代CPU 中集成的復(fù)雜指令集。多數(shù)現(xiàn)代CPU構(gòu)架可擴(kuò)展支持?jǐn)?shù)據(jù)操作及多數(shù)據(jù)計(jì)算。擴(kuò)展包括支持以單一指令實(shí)現(xiàn)多重計(jì)算（單指令多數(shù)據(jù)流，或稱SIMD）。Intel 編譯器能夠分析代碼，并通過SIMD 指令顯著提高代碼的效率。
　　本范例中，編譯器通過\QT 選項(xiàng)生成適合Core 2 構(gòu)架的代碼，編譯器報(bào)告以下創(chuàng)建時(shí)間信息：
　　注釋：循環(huán)未作向量化處理
　　反匯編生成代碼后可看到編譯器插入了SIMD擴(kuò)展指令集（SSE）。該指令集的使用直接提升了應(yīng)用的運(yùn)行性能，代碼運(yùn)行速度提高了2倍。
　　這類優(yōu)化可應(yīng)用于目前大多數(shù)CPU 上，這里我們?cè)贑ore 2 處理器上運(yùn)行，當(dāng)然您也可以在單核或早期CPU 上應(yīng)用。
　　自動(dòng)并行化
　　因?yàn)椴捎枚嗪薖C，我們會(huì)更感興趣如何通過\QParallel 選項(xiàng)，讓代碼在兩核上同時(shí)運(yùn)行，以獲得進(jìn)一步提速。該選項(xiàng)在編譯目標(biāo)中插入了庫調(diào)用。庫調(diào)用提供了運(yùn)行時(shí)所需的控制，使應(yīng)用中的組件得以并行。
　　在首次運(yùn)行中，編譯器并未顯著提高運(yùn)行性能。通過開啟編譯器的報(bào)告功能，可以看到它并未進(jìn)行優(yōu)化。
　　注釋：循環(huán)未作并行化處理，循環(huán)無需并行化
　　Intel編譯器要對(duì)一段代碼進(jìn)行自動(dòng)并行化時(shí)，首先決定是否有值得進(jìn)行并行化的代碼部分。在我們的代碼中由一個(gè)主循環(huán)完成所有工作。編譯器不能確定循環(huán)的重復(fù)次數(shù)，循環(huán)計(jì)數(shù)值只有在運(yùn)行時(shí)得到。于是編譯器采取謹(jǐn)慎選擇，不對(duì)循環(huán)進(jìn)行并行化處理。
　　我們可以通過在命令行輸入/Qpar-threshold:n 來進(jìn)行試探優(yōu)化，這里n 是介于0（總是并行處理）到100（不進(jìn)行并行處理）的數(shù)，這個(gè)值決定了試探優(yōu)化的程度。
　　輸入/Qpar-threshold:0 后，編譯器對(duì)代碼并行化，并輸出報(bào)告：
　　注釋：循環(huán)已作自動(dòng)并行化處理
　　使用該優(yōu)化后，程序的運(yùn)行速度比默認(rèn)設(shè)置下提高了近2 倍。
　　其它優(yōu)化選項(xiàng)
　　本范例中，我們關(guān)注自動(dòng)向量化及自動(dòng)并行化。Intel C++ 編譯器利用一系列其它優(yōu)化技術(shù)，包括高層優(yōu)化、交叉過程優(yōu)化、配置向?qū)?yōu)化、速度優(yōu)化、代碼大小優(yōu)化、快速浮點(diǎn)處理等。
　　Intel 編譯器同時(shí)支持OpenMP 這個(gè)基于pragma 的標(biāo)準(zhǔn)，用于實(shí)現(xiàn)應(yīng)用代碼的并行化。
　　測(cè)量性能
　　本范例中我們采用Win32 API 的定時(shí)函數(shù)，并將定時(shí)計(jì)算嵌入外部代碼。計(jì)算時(shí)間在LabVIEW 應(yīng)用GUI 中顯示。
　　作為備選，我們還可采用LabVIEW的定時(shí)工具，或采用外部工具，如Intel VTune 性能分析器。
　　VTune能夠監(jiān)測(cè)許多不同種類的構(gòu)架事件。VTune調(diào)諧助手能夠給出如何更好使用這些事件的建議。
　　結(jié)論
　　不同開關(guān)的優(yōu)化結(jié)果在表3 中列出。我們?cè)陔p核PC 上運(yùn)行，并通過默認(rèn)優(yōu)化（/O2）作為基準(zhǔn)來計(jì)算提速。

表3.不同優(yōu)化方式下的速度提高

　　在應(yīng)用自動(dòng)向量化時(shí)可達(dá)到2.5倍速，該優(yōu)化專用于非多核處理器，可用于目前多數(shù)CPU。
　　在應(yīng)用自動(dòng)并行化后可實(shí)現(xiàn)接近2 倍的提速。結(jié)合兩種優(yōu)化更可達(dá)到4.6 倍。
　　以上結(jié)果是在不修改源代碼的前提下實(shí)現(xiàn)的。盡管我們選擇了模擬應(yīng)用（計(jì)算Pi值），但這類優(yōu)化技術(shù)能夠用于各類實(shí)際應(yīng)用。從Intel編譯器用戶反饋中了解到，使用這些優(yōu)化方式可顯著提高代碼執(zhí)行速度。

企業(yè)介紹

30多年來，美國國家儀器公司(NI)幫助測(cè)試、控制、設(shè)計(jì)領(lǐng)域的工程師與科學(xué)家解決了從設(shè)計(jì)、原型到發(fā)布過程中所遇到的種種挑戰(zhàn)。通過現(xiàn)成可用的軟件，如LabVIEW, 以及高性價(jià)比的模塊化硬件，NI幫助各領(lǐng)域的工程師不斷創(chuàng)新，在縮短產(chǎn)品問世時(shí)間的同… 更多>>

產(chǎn)品分類

該公司暫未設(shè)置產(chǎn)品類別

聯(lián)系方式

美國國家儀器(NI)有限公司

聯(lián)系人：NI

地址：上海浦東張江集電港二期張東路1387號(hào)第45幢

郵編：201203

電話：021-50509800

傳真：021-65556244

公司網(wǎng)址：http://ni.com/china

該空間手機(jī)版

掃描此二維碼即可訪問該空間手機(jī)版

在線反饋

1.我有以下需求：
得到貴公司產(chǎn)品詳細(xì)資料得到貴公司產(chǎn)品的價(jià)格信息貴公司產(chǎn)品銷售人員聯(lián)系我貴公司技術(shù)支持人員聯(lián)系我
2.詳細(xì)的需求：
*
姓名:	*
單位:
電話:	*
郵件:	*

您還沒有登錄,請(qǐng)登陸, 如果您還沒有注冊(cè),點(diǎn)擊這里注冊(cè).

網(wǎng)友反饋

夏琳在2024/12/23 14:49:00留言
留言類型：我想得到貴公司產(chǎn)品的價(jià)格信息,
詳細(xì)留言：PXI-1000-14機(jī)箱

陳女士 在2024/12/13 15:43:00留言
留言類型：我讓貴公司技術(shù)支持人員聯(lián)系我,
詳細(xì)留言：我想了解Labview支持哪些國內(nèi)操作系統(tǒng)

黃先生 在2024/11/18 13:57:00留言
留言類型：我讓貴公司技術(shù)支持人員聯(lián)系我,
詳細(xì)留言：GPIB-232CT-A安裝驅(qū)動(dòng)軟件

李孟釗 在2024/10/10 15:54:00留言
留言類型：貴公司技術(shù)支持人員聯(lián)系我,
詳細(xì)留言：在貴公司購買了數(shù)據(jù)采集卡需要通過配套軟件使用但因?yàn)殡娔X變動(dòng) 現(xiàn)在需要重新安裝一遍NI DAQExpress軟件

于紅在2024/8/5 12:46:00留言
留言類型：貴公司產(chǎn)品銷售人員聯(lián)系我,
詳細(xì)留言：NI PCI-5114

更多請(qǐng)進(jìn)入空間管理中心查看

日本福利一区_最近中文高清在线观看_免费黄色电影在线观看_亚洲天堂成人在线 - 91人人

美國國家儀器(NI)有限公司