當(dāng)我們使用R進(jìn)行論文模擬時,通常會涉及到許多的循環(huán)。一般比較容易的提速方法是將我們的for循環(huán)
改寫為apply族
的方法進(jìn)行向量化運(yùn)算,但這個方法速度提升的有限,在真實(shí)模擬時,如果要與其他算法進(jìn)行速度的比較,除非自己的算法非常出色,否則還是很難與一些成熟包中的算法相庭抗禮。
這時想要再次進(jìn)行提速,有多種方法,常見的幾種是將代碼改寫為Fortran
代碼,改寫為C++
代碼抑或改寫為C
代碼。由于Rcpp
包的存在,改寫為C++
代碼相對簡單,所以后面將介紹幾種常用的方法進(jìn)行改寫,并在R中進(jìn)行調(diào)用。
在RStudio中創(chuàng)建C++文件
這里默認(rèn)大家都安裝了RStudio
,我們都從里面創(chuàng)建一個C++文件,從這里創(chuàng)建有個好處,就是它直接會顯示一段示例代碼,我們只需在上面稍作改動即可。
首先我們在RStudio
中選擇:文件
——新文件
——C++文件
,創(chuàng)建完一個新文件,里面是如下的內(nèi)容(這里要在R中安裝Rcpp
包,沒安裝的話,點(diǎn)到這里RStudio
會自動幫忙進(jìn)行安裝):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
#include <Rcpp.h> using namespace Rcpp; // This is a simple example of exporting a C ++ function to R . You can // source this function into an R session using the Rcpp: :sourceCpp // function ( or via the Source button on the editor toolbar). Learn // more about Rcpp at: // // http://www.rcpp.org/ // http://adv-r.had.co.nz/Rcpp.html // http://gallery.rcpp.org/ // // [[Rcpp: :export ]] NumericVector timesTwo(NumericVector x) { return x * 2 ; } // You can include R code blocks in C ++ files processed with sourceCpp // (useful for testing and development). The R code will be automatically // run after the compilation. // /*** R timesTwo( 42 ) */ |
我們按照上面的英文說明一行一行來進(jìn)行理解。
詳細(xì)說明
1
2
|
#include <Rcpp.h> using namespace Rcpp; |
這個是頭文件,以及使用Rcpp
命名空間。正常的一個C++代碼開頭兩行其實(shí)也是這樣,這其實(shí)非常像我們R中的library
以及Python中的import
,有了這個,我們就可以在代碼中命名向量、矩陣、數(shù)據(jù)框等一些R中才有的對象形式,以便于R與C++中的一些內(nèi)容的相互傳遞。
示例文件中的代碼其實(shí)就是命名了一個輸入與輸出對象均為數(shù)值向量的函數(shù)。這個函數(shù)也非常簡單:一個將向量乘以2的運(yùn)算。
如果我們想在R中使用在C++文件中定義好的函數(shù),需要在C++里面函數(shù)的上方加上// [[Rcpp::export]]
。需要注意的是,一個cpp文件可以在里面定義多個函數(shù),但只能傳出一個函數(shù)。
然后我們再點(diǎn)擊文件右上方的Source
,即可將我們的函數(shù)載入進(jìn)變量空間,或直接在另一個R腳本文件中運(yùn)行下述命令:
1
|
Rcpp: :sourceCpp ( 'Desktop/myfun.cpp' ) |
在示例文件中還有另一個trick,就是直接在我們的cpp
文件中加上了下面這句命令:
1
2
3
|
/*** R timesTwo( 42 ) */ |
加上這句之后,我們Source
這個文件后,可以直接測試剛剛定義的函數(shù),看看timesTwo(42)
的運(yùn)行結(jié)果,平時在測試的時候可以多多使用。
更多內(nèi)容
關(guān)于Rcpp里面的一些常用數(shù)據(jù)類型與常用函數(shù),可以參考博客:R語言學(xué)習(xí)Rcpp基礎(chǔ)知識全面整理,里面講的很好。這里搬運(yùn)一些內(nèi)容過來:
數(shù)據(jù)類型 | 描述 |
---|---|
int | 整數(shù)型 |
double | 數(shù)值型 |
bool | 布爾型(TRUE, FALSE) |
String | 字符型 |
IntegerVector | 整型向量 |
NumericVector | 數(shù)值型向量(元素的類型為double) |
ComplexVector | 復(fù)數(shù)向量 |
LogicalVector | 邏輯型向量; R的邏輯型變量可以取三種值:TRUE, FALSE, NA; 而C++布爾值只有兩個,true or false。如果將R的NA轉(zhuǎn)化為C++中的布爾值,則會返回true。 |
CharacterVector | 字符型向量 |
IntegerMatrix | 整型矩陣 |
NumericMatrix | 數(shù)值型矩陣(元素的類型為double) |
LogicalMatrix | 邏輯型矩陣 |
CharacterMatrix | 字符矩陣 |
List | 列表;lists;類似于R中列表,其元素可以使任何數(shù)據(jù)類型 |
DataFrame | 數(shù)據(jù)框;data frames;在Rcpp內(nèi)部,數(shù)據(jù)框其實(shí)是通過列表實(shí)現(xiàn)的 |
Function | 函數(shù)型 |
Environment | 環(huán)境型;可用于引用R環(huán)境中的函數(shù)、其他R包中的函數(shù)、操作R環(huán)境中的變量 |
RObject | 可以被R識別的類型 |
關(guān)于對矩陣以及數(shù)據(jù)框的一些基礎(chǔ)操作與常用函數(shù):
操作 | 描述 |
---|---|
[n] | 對于向量類型或者列表,訪問第n個元素。對于矩陣類型,首先把矩陣的下一列接到上一列之下,從而構(gòu)成一個長列向量,并訪問第n個元素。不同于R,n從0開始。 |
(i,j) | 對于矩陣類型,訪問第(i,j)個元素。不同于R,i和j從0開始。不同于向量,此處用圓括號。 |
List[“name1”] | 訪問List中名為name1的元素。 |
DataFrame[“name2”] | 訪問DataFrame中,名為name2的列。 |
X.size() | 返回X的長度;適用于向量或者矩陣,如果是矩陣,則先向量化 |
X.push_back(a) | 將a添加進(jìn)X的末尾;適用于向量 |
X.push_front(b) | 將b添加進(jìn)X的開頭;適用于向量 |
X.ncol() | 返回X的列數(shù) |
X.nrow() | 返回X的行數(shù) |
總結(jié)
到這里,一些關(guān)于Rcpp基礎(chǔ)使用的相關(guān)內(nèi)容就介紹的差不多了。
還有另外兩個網(wǎng)址也非常推薦:
http://adv-r.had.co.nz/Rcpp.html
前者里面有很多基礎(chǔ)操作的代碼,包括:向量->向量;向量->矩陣;標(biāo)量->矩陣等等,里面都有示例函數(shù)及相關(guān)代碼,復(fù)制到自己的cpp
文件中運(yùn)行并理解就很容易上手。
后者相當(dāng)于一個搜索庫,要使用Rcpp進(jìn)行矩陣運(yùn)算、并行計算、常用算法等操作,直接在里面進(jìn)行搜索,就可以看到大神寫的一些相應(yīng)代碼,同時知道該調(diào)用哪些庫中的函數(shù)。
后面的博客中我們將介紹:RcppEigen進(jìn)行矩陣運(yùn)算
以上就是Rcpp入門R代碼提速方法過程的詳細(xì)內(nèi)容,更多關(guān)于Rcpp入門R代碼提速的資料請關(guān)注服務(wù)器之家其它相關(guān)文章!
原文鏈接:https://blog.csdn.net/weixin_41929524/article/details/81975484