主頁 > 移動端開發 > 將匹配元素作為串列回傳的快速方法

將匹配元素作為串列回傳的快速方法

2022-10-18 04:07:15 移動端開發

我有兩個向量:

set.seed(1)

a <- sample(1:100,200, replace=T)

b <- sample(1:100,40, replace=F)

我想找到該a匹配中元素的位置b

sapply(b, function(x) which(a %in% x))

這可以完成作業,但需要很長時間

有沒有辦法將結果存盤在一個實際上很快的串列中?

所需的輸出如下所示:

sapply(b, function(x) which(a %in% x))
[[1]]
integer(0)

[[2]]
integer(0)

[[3]]
[1] 107 142 199

[[4]]
[1] 109 126

[[5]]
[1] 136 167

[[6]]
integer(0)

[[7]]
integer(0)

[[8]]
[1]  73  91 176

[[9]]
[1]  51 146 181

uj5u.com熱心網友回復:

這是解決您的問題的另一種方法。我還添加了@GKi、@ThomasIsCoding 和我提出的解決方案的基準。

res  = rep_len(list(integer(0)), length(b))
comm = intersect(b, a)                            # do not flip the order of elements
res[match(comm, b)] = lapply(comm, function(x) which(a==x))

[[1]]
integer(0)

[[2]]
integer(0)

[[3]]
[1] 107 142 199

[[4]]
[1] 109 126

[[5]]
[1] 136 167

[[6]]
integer(0)

[[7]]
integer(0)

[[8]]
[1]  73  91 176

[[9]]
[1]  51 146 181

...

基準

f1_kamgang = function() {
  res  = rep_len(list(integer(0)), length(b))
  comm = intersect(b, a)                               # do not flip the order of elements
  res[match(comm, b)] = lapply(comm, function(x) which(a==x))
  res
}

f2_Thomas = function() {
  unname(by(seq_along(a), a, list)[as.character(b)])
}

f3_GKi = function() {
  sapply(b, function(x) which(a == x))     
}

f4_original = function() {
  sapply(b, function(x) which(a %in% x))     
}



microbenchmark::microbenchmark(
  f1_kamgang(),
  f2_Thomas(),
  f3_GKi(),
  f4_original(),
  times=5L
)

Unit: microseconds
          expr    min     lq    mean median     uq    max neval cld
  f1_kamgang()  191.2  194.8  209.70  214.3  216.5  231.7     5 a  
   f2_Thomas() 2105.4 2130.0 2240.76 2267.9 2308.8 2391.7     5   c
      f3_GKi()  223.5  231.0  242.72  242.6  253.9  262.6     5 a  
 f4_original()  365.5  366.3  393.10  376.9  399.6  457.2     5  b 

uj5u.com熱心網友回復:

我們可以玩一個技巧并通過但是,我想說這個選項很有趣但不快by)來索引串列,例如,as.character(b)

> unname(by(seq_along(a), a, list)[as.character(b)])
[[1]]
NULL

[[2]]
NULL

[[3]]
[1] 107 142 199

[[4]]
[1] 109 126

[[5]]
[1] 136 167

[[6]]
NULL

[[7]]
NULL

[[8]]
[1]  73  91 176

[[9]]
[1]  51 146 181

[[10]]
[1] 191

[[11]]
[1]  55 118

[[12]]
[1] 192

[[13]]
[1]  40  64 110 165

[[14]]
[1]  20  22 122 175

[[15]]
[1] 137 189

[[16]]
[1] 134

[[17]]
[1] 128

[[18]]
[1]  17  81 184

[[19]]
NULL

[[20]]
[1] 188 194

[[21]]
[1]  98 180

[[22]]
[1]  62 145

[[23]]
[1] 33

[[24]]
NULL

[[25]]
[1] 47

[[26]]
NULL

[[27]]
[1]  29 114 159

[[28]]
[1]  18  26 171

[[29]]
[1]  28  69 186 200

[[30]]
[1] 42

[[31]]
[1]  79 158 190

[[32]]
[1]  5 38 58 82

[[33]]
[1]  35  74 121

[[34]]
[1] 150

[[35]]
[1]  34  36 139

[[36]]
[1]  70 100 117 195

[[37]]
NULL

[[38]]
[1]  32  46 102

[[39]]
[1]  89 133

[[40]]
[1] 127 129 160

uj5u.com熱心網友回復:

您可以使用from%==%的更快版本(快 3 倍)。另一個可能派上用場的折疊功能是. whichcollapsewhichvlapplysapply

library(collapse)
lapply(b, function(x) a %==% x)
lapply(b, function(x) whichv(a, x))

identical(sapply(b, function(x) a %==% x),
          sapply(b, function(x) which(a %in% x)))
#[1] TRUE

基準

bench::mark(
  by = unname(by(seq_along(a), a, list)[as.character(b)]),
  original = sapply(b, function(x) which(a %in% x)),
  "==" = sapply(b, function(x) which(a == x)),
  collapse_s = sapply(b, function(x) collapse::whichv(a, x)),
  collapse_l = lapply(b, function(x) collapse::whichv(a, x)),
  "%==%" = lapply(b, function(x) a %==% x),
  time_unit = "ms",
  check = FALSE
)

# expression    min median `itr/sec` mem_a…1 gc/se…2 n_itr  n_gc total…3 result
# by         1.56   1.74        545.  27.1KB    15.6   244     7    448. <NULL>
# original   0.189  0.221      3770. 140.9KB    11.4  1659     5    440. <NULL>
# ==         0.103  0.118      7657.  74.8KB    13.8  3319     6    433. <NULL>
# collapse_s 0.0838 0.0917     9884.  39.8KB    15.8  4389     7    444. <NULL>
# collapse_l 0.0722 0.0794    11379.  38.9KB    13.5  4217     5    371. <NULL>
# %==%       0.0591 0.0648    13852.  38.8KB    15.5  6239     7    450. <NULL>

uj5u.com熱心網友回復:

這是一種有效的矢量化方法:

f <- function(x, y) {
  m <- y[match(x, y)]
  idx <- !is.na(m)
  unname(split(which(idx), factor(match(m[idx], b), levels = seq.int(length(y)))))
}

f(a, b)

[[1]]
integer(0)

[[2]]
integer(0)

[[3]]
[1] 107 142 199

[[4]]
[1] 109 126

[[5]]
[1] 136 167

[[6]]
integer(0)

[[7]]
integer(0)

[[8]]
[1]  73  91 176

[[9]]
[1]  51 146 181

[[10]]
[1] 191

...

uj5u.com熱心網友回復:

您可以使用==而不是%in%.

lapply(b, function(x) which(a == x))

另一種方法是C 使用rcpp.

Rcpp::cppFunction("
Rcpp::List getIdx(const Rcpp::IntegerVector& a,
                  const Rcpp::IntegerVector& b) {
  std::map<int, std::vector<int> > m;
  for(auto const& i : b) m[i].clear();
  for(int i=0; i<=a.size();   i) {
    auto j = m.find(a[i]);
    if(j != m.end()) j->second.push_back(i 1);
  }
  std::vector< std::vector<int> > res;
  for(auto const& i : b) res.push_back(m[i]);
  return wrap( res );
}")
getIdx(a, b)

基準

set.seed(1)
a <- sample(1:100,200, replace=T)
b <- sample(1:100,40, replace=F)

bench::mark(
         origninal = sapply(b, function(x) which(a %in% x)),
         "==" = lapply(b, function(x) which(a == x)),
         rcpp = getIdx(a, b)
       )
#  expression      min   median `itr/sec` mem_alloc `gc/sec` n_itr  n_gc total_…1
#  <bch:expr> <bch:tm> <bch:tm>     <dbl> <bch:byt>    <dbl> <int> <dbl> <bch:tm>
#1 origninal  111.19μs 124.11μs     7090.   140.9KB     27.6  2824    11  398.3ms
#2 ==          66.77μs  72.78μs    12478.   73.83KB     26.9  5560    12  445.6ms
#3 rcpp         7.05μs   8.66μs   111343.    2.85KB     11.1  9999     1   89.8ms

rcpp 版本比原始版本快約 15 倍。

uj5u.com熱心網友回復:

如果您對長度為零的元素感到滿意,NA則可以將向量強制為 list 和replace.

replace(as.list(a), !a %in% b, NA)

轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/516182.html

標籤:r表现向量

上一篇:根據單獨表中規定的順序獲取SQL中任意字串的范圍

下一篇:使用cmake時避免被傳遞依賴阻塞

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【從零開始擼一個App】Dagger2

    Dagger2是一個IOC框架,一般用于Android平臺,第一次接觸的朋友,一定會被搞得暈頭轉向。它延續了Java平臺Spring框架代碼碎片化,注解滿天飛的傳統。嘗試將各處代碼片段串聯起來,理清思緒,真不是件容易的事。更不用說還有各版本細微的差別。 與Spring不同的是,Spring是通過反射 ......

    uj5u.com 2020-09-10 06:57:59 more
  • Flutter Weekly Issue 66

    新聞 Flutter 季度調研結果分享 教程 Flutter+FaaS一體化任務編排的思考與設計 詳解Dart中如何通過注解生成代碼 GitHub 用對了嗎?Flutter 團隊分享如何管理大型開源專案 插件 flutter-bubble-tab-indicator A Flutter librar ......

    uj5u.com 2020-09-10 06:58:52 more
  • Proguard 常用規則

    介紹 Proguard 入口,如何查看輸出,如何使用 keep 設定入口以及使用實體,如何配置壓縮,混淆,校驗等規則。

    ......

    uj5u.com 2020-09-10 06:59:00 more
  • Android 開發技術周報 Issue#292

    新聞 Android即將獲得類AirDrop功能:可向附近設備快速分享檔案 谷歌為安卓檔案管理應用引入可安全隱藏資料的Safe Folder功能 Android TV新主界面將顯示電影、電視節目和應用推薦內容 泄露的Android檔案暗示了傳說中的谷歌Pixel 5a與折疊屏新機 谷歌發布Andro ......

    uj5u.com 2020-09-10 07:00:37 more
  • AutoFitTextureView Error inflating class

    報錯: Binary XML file line #0: Binary XML file line #0: Error inflating class xxx.AutoFitTextureView 解決: <com.example.testy2.AutoFitTextureView android: ......

    uj5u.com 2020-09-10 07:00:41 more
  • 根據Uri,Cursor沒有獲取到對應的屬性

    Android: 背景:呼叫攝像頭,拍攝視頻,指定保存的地址,但是回傳的Cursor檔案,只有名稱和大小的屬性,沒有其他諸如時長,連ID屬性都沒有 使用 cursor.getInt(cursor.getColumnIndexOrThrow(MediaStore.Video.Media.DURATIO ......

    uj5u.com 2020-09-10 07:00:44 more
  • Android連載29-持久化技術

    一、持久化技術 我們平時所使用的APP產生的資料,在記憶體中都是瞬時的,會隨著斷電、關機等丟失資料,因此android系統采用了持久化技術,用于存盤這些“瞬時”資料 持久化技術包括:檔案存盤、SharedPreference存盤以及資料庫存盤,還有更復雜的SD卡記憶體儲。 二、檔案存盤 最基本存盤方式, ......

    uj5u.com 2020-09-10 07:00:47 more
  • Android Camera2Video整合到自己專案里

    背景: Android專案里呼叫攝像頭拍攝視頻,原本使用的 MediaStore.ACTION_VIDEO_CAPTURE, 后來因專案需要,改成了camera2 1.Camera2Video 官方demo有點問題,下載后,不能直接整合到專案 問題1.多次拍攝視頻崩潰 問題2.雙擊record按鈕, ......

    uj5u.com 2020-09-10 07:00:50 more
  • Android 開發技術周報 Issue#293

    新聞 谷歌為Android TV開發者提供多種新功能 Android 11將自動填表功能整合到鍵盤輸入建議中 谷歌宣布Android Auto即將支持更多的導航和數字停車應用 谷歌Pixel 5只有XL版本 搭載驍龍765G且將比Pixel 4更便宜 [圖]Wear OS將迎來重磅更新:應用啟動時間 ......

    uj5u.com 2020-09-10 07:01:38 more
  • 海豚星空掃碼投屏 Android 接收端 SDK 集成 六步驟

    掃碼投屏,開放網路,獨占設備,不需要額外下載軟體,微信掃碼,發現設備。支持標準DLNA協議,支持倍速播放。視頻,音頻,圖片投屏。好點意思。還支持自定義基于 DLNA 擴展的操作動作。好像要收費,沒體驗。 這里簡單記錄一下集成程序。 一 跟目錄的build.gradle添加私有mevan倉庫 mave ......

    uj5u.com 2020-09-10 07:01:43 more
最新发布
  • 歡迎頁輪播影片

    如圖,引導開始,球從上落下,同時淡入文字,然后文字開始輪播,最后一頁時停止,點擊進入首頁。 在來看看效果圖。 重力球先不講,主要歡迎輪播簡單實作 首先新建一個類 TextTranslationXGuideView,用于影片展示 文本是類似的,最后會有個圖片箭頭影片,布局很簡單,就是一個 TextVi ......

    uj5u.com 2023-04-20 08:40:31 more
  • 【FAQ】關于華為推送服務因營銷訊息頻次管控導致服務通訊類訊息

    一. 問題描述 使用華為推送服務下發IM訊息時,下發訊息請求成功且code碼為80000000,但是手機總是收不到訊息; 在華為推送自助分析(Beta)平臺查看發現,訊息發送觸發了頻控。 二. 問題原因及背景 2023年1月05日起,華為推送服務對咨詢營銷類訊息做了單個設備每日推送數量上限管理,具體 ......

    uj5u.com 2023-04-20 08:40:11 more
  • 歡迎頁輪播影片

    如圖,引導開始,球從上落下,同時淡入文字,然后文字開始輪播,最后一頁時停止,點擊進入首頁。 在來看看效果圖。 重力球先不講,主要歡迎輪播簡單實作 首先新建一個類 TextTranslationXGuideView,用于影片展示 文本是類似的,最后會有個圖片箭頭影片,布局很簡單,就是一個 TextVi ......

    uj5u.com 2023-04-20 08:39:36 more
  • 【FAQ】關于華為推送服務因營銷訊息頻次管控導致服務通訊類訊息

    一. 問題描述 使用華為推送服務下發IM訊息時,下發訊息請求成功且code碼為80000000,但是手機總是收不到訊息; 在華為推送自助分析(Beta)平臺查看發現,訊息發送觸發了頻控。 二. 問題原因及背景 2023年1月05日起,華為推送服務對咨詢營銷類訊息做了單個設備每日推送數量上限管理,具體 ......

    uj5u.com 2023-04-20 08:39:13 more
  • iOS從UI記憶體地址到讀取成員變數(oc/swift)

    開發除錯時,我們發現bug時常首先是從UI顯示發現例外,下一步才會去定位UI相關連的資料的。XCode有給我們提供一系列debug工具,但是很多人可能還沒有形成一套穩定的除錯流程,因此本文嘗試解決這個問題,順便提出一個暴論:UI顯示例外問題只需要兩個步驟就能完成定位作業的80%: 定位例外 UI 組 ......

    uj5u.com 2023-04-19 09:16:23 more
  • FIDE重磅更新!性能飛躍!體驗有禮!

    FIDE 開發者工具重構升級啦!實作500%性能提升,誠邀體驗! 一直以來不少開發者朋友在社區反饋,在使用 FIDE 工具的程序中,時常會遇到諸如加載不及時、代碼預覽/渲染性能不如意的情況,十分影響開發體驗。 作為技術團隊,我們深知一件趁手的開發工具對開發者的重要性,因此,在2023年開年,FinC ......

    uj5u.com 2023-04-19 09:16:15 more
  • 游戲內嵌社區服務開放,助力開發者提升玩家互動與留存

    華為 HMS Core 游戲內嵌社區服務提供快速訪問華為游戲中心論壇能力,支持玩家直接在游戲內瀏覽帖子和交流互動,助力開發者擴展內容生產和觸達的場景。 一、為什么要游戲內嵌社區? 二、游戲內嵌社區的典型使用場景 1、游戲內打開論壇 您可以在游戲內繪制論壇入口,為玩家提供沉浸式發帖、瀏覽、點贊、回帖、 ......

    uj5u.com 2023-04-19 09:15:46 more
  • iOS從UI記憶體地址到讀取成員變數(oc/swift)

    開發除錯時,我們發現bug時常首先是從UI顯示發現例外,下一步才會去定位UI相關連的資料的。XCode有給我們提供一系列debug工具,但是很多人可能還沒有形成一套穩定的除錯流程,因此本文嘗試解決這個問題,順便提出一個暴論:UI顯示例外問題只需要兩個步驟就能完成定位作業的80%: 定位例外 UI 組 ......

    uj5u.com 2023-04-19 09:14:53 more
  • FIDE重磅更新!性能飛躍!體驗有禮!

    FIDE 開發者工具重構升級啦!實作500%性能提升,誠邀體驗! 一直以來不少開發者朋友在社區反饋,在使用 FIDE 工具的程序中,時常會遇到諸如加載不及時、代碼預覽/渲染性能不如意的情況,十分影響開發體驗。 作為技術團隊,我們深知一件趁手的開發工具對開發者的重要性,因此,在2023年開年,FinC ......

    uj5u.com 2023-04-19 09:14:08 more
  • 游戲內嵌社區服務開放,助力開發者提升玩家互動與留存

    華為 HMS Core 游戲內嵌社區服務提供快速訪問華為游戲中心論壇能力,支持玩家直接在游戲內瀏覽帖子和交流互動,助力開發者擴展內容生產和觸達的場景。 一、為什么要游戲內嵌社區? 二、游戲內嵌社區的典型使用場景 1、游戲內打開論壇 您可以在游戲內繪制論壇入口,為玩家提供沉浸式發帖、瀏覽、點贊、回帖、 ......

    uj5u.com 2023-04-19 09:08:34 more