例如,某數據庫如下,需要把第二個變量里面的ID號碼(格式為T-20-252-02)提取出來作為一個新變量。
命令如下:
b=readWorksheetFromFile(temp[11],sheet=1)
讀入excel數據,命名為數據庫b,這里temp[11]是讀入temp中第11個文件名對應的文件
attach(b)
attach數據庫,之后即可直接用變量名file, 否則要用b$file
b$id=substr(File,regexpr("T",File),regexpr("T",File)+10)
在數據庫b中生成一個新變量id,其等于從File變量中提取字符,從T所在位置開始,到T位置后10位置結束
結果如下所示:
補充:R語言提取字符串的一部分substring函數
語法
這個函數提取字符串的一部分。
substring()函數的基本語法是:
substring(x,first,last)
x - 是字符向量輸入。
first - 是第一個字符要被提取的位置。
last - 是最后一個字符要被提取的位置。
示例
# Extract characters from 5th to 7th position. substring("Extract", 5, 7) > [1] "act"
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持服務器之家。如有錯誤或未考慮完全的地方,望不吝賜教。
原文鏈接:https://blog.csdn.net/u013084616/article/details/72802090