MATLAB 板


LINE

我想要利用matlab MEX file來加速 我遇到了一個問題是 MEX的速度應該會比matlab快上幾倍 而且Eigen應該會比matlab快上10~30倍 但是我的matlab跑一次是0.1707 sec 我的mex跑一次是 0.667856 sec 為什麼我的mex可以那麼慢,有大大可以指導我一下嗎? 附上我完整的code #include "mex.h" #include "Eigen/Dense" #include "Eigen/Core" #include <iostream> using namespace Eigen; using namespace std; typedef Map<MatrixXd> MexMat; void mexFunction(int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[]) { ptrdiff_t n_de = mxGetM(prhs[0]), n_basis = mxGetN(prhs[0]); ptrdiff_t n_nu = mxGetM(prhs[1]); ptrdiff_t n_w = mxGetN(prhs[2]) , n_p = mxGetN(prhs[3]); ptrdiff_t n_min = min(n_de, n_nu); MexMat diff_SQ_de ( mxGetPr(prhs[0]), n_de, n_basis); MexMat diff_SQ_nu ( mxGetPr(prhs[1]), n_nu, n_basis); MexMat width_candidates ( mxGetPr(prhs[2]), 1, n_w); MexMat panelty_candidates ( mxGetPr(prhs[3]), 1, n_p); MatrixXd ker_de_tr(n_de, n_basis), ker_nu_tr(n_nu, n_basis); MatrixXd H_hat(n_basis, n_basis), h_hat(n_basis, n_basis); MatrixXd ker_de_tr2(n_min, n_basis), ker_nu_tr2(n_min, n_basis); MatrixXd B(n_basis, n_basis), Beta(n_basis, 1), B_de(n_basis, n_min); MatrixXd tmp(1, n_min), B0(n_basis, n_min), B1(n_basis, n_min); MatrixXd A(n_basis, n_min), r_de(n_min,1), r_nu(n_min,1); MatrixXd CV_score (n_w, n_p), width(1,1), panelty(1,1); for (int width_run = 0; width_run < n_w; width_run++){ width(0,0) = width_candidates(0, width_run); ker_de_tr = (diff_SQ_de.array() / (-2) / pow(width(0,0),2)).array().exp(); ker_nu_tr = (diff_SQ_nu.array() / (-2) / pow(width(0,0),2)).array().exp(); H_hat = ker_de_tr.transpose() * ker_de_tr / n_de; h_hat = ((ker_nu_tr / n_nu).colwise().sum()).transpose(); ker_de_tr2 = (ker_de_tr.block(0,0,n_min,n_basis)).transpose(); ker_nu_tr2 = (ker_nu_tr.block(0,0,n_min,n_basis)).transpose(); for (int panelty_run = 0; panelty_run < n_p; panelty_run++){ panelty(0,0) = panelty_candidates(0, panelty_run); H_hat.diagonal() = (H_hat.diagonal()).array() + panelty(0,0)*(n_de-1)/n_de; B = H_hat.inverse(); Beta = B * h_hat; B_de = B * ker_de_tr2; tmp = ((ker_de_tr2.cwiseProduct(B_de)).colwise().sum()).array() * (-1) + n_de; B0 = (Beta.replicate(1, n_min) + (((Beta.transpose() * ker_de_tr2) .cwiseQuotient(tmp)).replicate(n_basis, 1).cwiseProduct(B_de))) * n_nu; B1 = B*ker_nu_tr2 + B_de.cwiseProduct(((((ker_nu_tr2.cwiseProduct( B_de)).colwise().sum()).cwiseQuotient(tmp)).replicate(n_basis,1))); A = ((B0-B1) * (n_de-1)/(n_de*(n_nu-1))).cwiseMax(MatrixXd::Zero(n_basis ,n_min)); r_de = (ker_de_tr2.cwiseProduct(A)).colwise().sum(); r_nu = (ker_nu_tr2.cwiseProduct(A)).colwise().sum(); CV_score(width_run, panelty_run) = (r_de.array().pow(2)/n_de).sum()/2 - (r_nu / n_nu).sum(); } } int loc_w, loc_p; MatrixXd min_cv_score; CV_score.minCoeff(&loc_p, &loc_w); MatrixXd O1(1,1), O2(1,1); O1(0,0) = width_candidates(0,loc_w); O2(0,0) = panelty_candidates(0,loc_p); plhs[0] = mxCreateDoubleMatrix(1, 1, mxREAL); plhs[1] = mxCreateDoubleMatrix(1, 1, mxREAL); MexMat Output1 ( mxGetPr(plhs[0]), 1, 1 ); MexMat Output2 ( mxGetPr(plhs[1]), 1, 1 ); Output1 = O1; Output2 = O2; } 我在猜想是不是每次取代這麼多東西造成記憶體不斷再複製,而拖慢 希望有人可以幫我找到我哪裏寫得不好導致matlab比較快。 最後補上我的系統資訊 file (include test.m): http://myweb.ncku.edu.tw/~r26014014/uLSIF.rar Platform OS: windows 7 SP1 64bit Matlab version: 2013b compiler: VS 2012 compile command: mex -v -largeArrayDims -IC:\Eigen mex_file.cpp COMPFLAGS="/Ox $COMPFLAGS" 另外,我有google到這篇:http://tinyurl.com/mzhajo6 最後,如果解決問題需要我全部的程式碼,可以寄站內信。 --



※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.152.221
1F:→ forloricever:optimization flag 傳給 compiler 了嗎? 12/22 04:45
我google之後,加上/Ox之後,還是要0.6678 sec
2F:推 forloricever:看起來像在做 least squares, K1 不用做出來吧 12/22 04:47
3F:→ forloricever:http://0rz.tw/5Ahkd 12/22 04:51
我的case更加複雜,K1還會用在其他地方.... 此外這裡有L2 panelty term
4F:推 forloricever:L2 penalty term 也不用乘出來 12/23 08:07
5F:→ forloricever:大概是 K2 下補 0, K1 下加上diagonal sqrt penalty 12/23 08:13
大大可以給我一點實際例子嗎? 因為我run出來不是LS... 我自己去run了一個test A is 3 by 3 matrix. b is 3 by 1 matrix A.colPivHouseholderQr.solve(b) is equal to A.lu().solve(b) not the inv(A'A)*b test code: #include <iostream> #include <Eigen/Dense> #include <Eigen/Core> using namespace Eigen; using namespace std; typedef Map<MatrixXd> MexMat; int main() { double mat[9] = {-1.0,-2.0,-3.0,4.0, 5.5, 6.5, -7.7, -8.0, 11.0}; double mat2[3] = {1.0,1.0,3.0}; MexMat EiMat (mat, 3, 3); MexMat EiMat2 (mat2, 3, 1); cout << EiMat.colPivHouseholderQr().solve(EiMat2) << endl; cout << EiMat.lu().solve(EiMat2) << endl; } Result: 1.11111 0.765432 0.123457 1.11111 0.765432 0.123457 ※ 編輯: celestialgod 來自: 36.238.92.7 (12/24 01:59)
6F:推 forloricever:不是 inv(A'A)A'b ? 12/24 11:47







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:WOW站內搜尋

TOP