我希望為任意非標準距離函式創建一個距離矩陣。
我可以按照以下緩慢的方式執行此操作:
set.seed(1000)
DF <- data.frame(x=rnorm(10),y=rnorm(10)) # ten random points on the x y plane
L <- dim(DF)[1] # length of DF
F <- function(P1,P2,y){sqrt((P2$x-P1$x)^2 (P2$y-P1$y)^2 1)}
# Almost the euclidean distance but with an added 1 to make it nonstandard
M <- matrix(nrow=L,ncol=L)
# Find the distances between every point in DF and every other point in DF
for(i in 1:L){
for(j in 1:L){
M[i,j] <- F(DF[i,],DF[j,])
}
}
M
這使:
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] 1.000000 1.326971 1.566994 1.708761 1.114078 1.527042 1.514868 1.836636 1.521510 1.813663
[2,] 1.326971 1.000000 1.735444 2.143117 1.336652 1.482555 1.427014 2.245816 2.153173 1.271712
[3,] 1.566994 1.735444 1.000000 1.190212 1.951701 1.088288 1.126241 1.212367 2.388228 1.734505
[4,] 1.708761 2.143117 1.190212 1.000000 2.123664 1.461169 1.523137 1.013764 2.267420 2.271950
[5,] 1.114078 1.336652 1.951701 2.123664 1.000000 1.851806 1.822077 2.263007 1.447333 1.934958
[6,] 1.527042 1.482555 1.088288 1.461169 1.851806 1.000000 1.004188 1.497537 2.459305 1.406153
[7,] 1.514868 1.427014 1.126241 1.523137 1.822077 1.004188 1.000000 1.564111 2.460997 1.344779
[8,] 1.836636 2.245816 1.212367 1.013764 2.263007 1.497537 1.564111 1.000000 2.415824 2.327128
[9,] 1.521510 2.153173 2.388228 2.267420 1.447333 2.459305 2.460997 2.415824 1.000000 2.818048
[10,] 1.813663 1.271712 1.734505 2.271950 1.934958 1.406153 1.344779 2.327128 2.818048 1.000000
顯然,在 R 中有 2 個嵌套的 for 回圈,這對于任何大小的資料集都會非常慢。mapply()我想通過使用or之類的功能來加快速度,outer()但我不確定如何去做。
我已經很好地尋找了類似的問題,但我找不到一個給出不涉及 rcpp 的足夠答案的問題。
使用并行化在 R 中創建距離矩陣
在 R 中創建自定義距離矩陣函式
加快距離計算
嘗試下面這個鏈接中給出的建議給了我:
與串列的所有向量成對比較
outer(DF,DF,FUN=Vectorize(F))
Error: $ operator is invalid for atomic vectors
或者
outer(DF,DF,FUN=F)
Error in dim(robj) <- c(dX, dY) :
dims [product 4] do not match the length of object [10]
uj5u.com熱心網友回復:
以下是如何使用outer來替換嵌套回圈并使用自定義距離函式
set.seed(1000)
DF <- data.frame(x=rnorm(10),y=rnorm(10))
L <- dim(DF)[1]
F <- function(P1,P2){sqrt((P2$x-P1$x)^2 (P2$y-P1$y)^2 1)}
M <- matrix(nrow=L,ncol=L)
outer(1:L, 1:L, FUN=function(x, y) F(DF[x,], DF[y,]))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] 1.000000 1.326971 1.566994 1.708761 1.114078 1.527042 1.514868 1.836636 1.521510 1.813663 [2,] 1.326971 1.000000 1.735444 2.143117 1.336652 1.482555 1.427014 2.245816 2.153173 1.271712 [3,] 1.566994 1.735444 1.000000 1.190212 1.951701 1.088288 1.126241 1.212367 2.388228 1.734505 [4,] 1.708761 2.143117 1.190212 1.000000 2.123664 1.461169 1.523137 1.013764 2.267420 2.271950 [5,] 1.114078 1.336652 1.951701 2.123664 1.000000 1.851806 1.822077 2.263007 1.447333 1.934958 [6,] 1.527042 1.482555 1.088288 1.461169 1.851806 1.000000 1.004188 1.497537 2.459305 1.406153 [7,] 1.514868 1.427014 1.126241 1.523137 1.822077 1.004188 1.000000 1.564111 2.460997 1.344779 [8,] 1.836636 2.245816 1.212367 1.013764 2.263007 1.497537 1.564111 1.000000 2.415824 2.327128 [9,] 1.521510 2.153173 2.388228 2.267420 1.447333 2.459305 2.460997 2.415824 1.000000 2.818048 [10,] 1.813663 1.271712 1.734505 2.271950 1.934958 1.406153 1.344779 2.327128 2.818048 1.000000
DF <- data.frame(x=rnorm(100),y=rnorm(100))以100x100為基準
Unit: milliseconds
expr min lq mean median uq max neval
loop 647.080268 681.283754 720.842738 695.972994 728.078378 1057.16015 100
outer 7.892903 8.145765 8.661221 8.307392 8.710785 14.07253 100
uj5u.com熱心網友回復:
您可以使用基本 R 中包含的一個很好的簡單方法來計算點資料幀中的距離(2D 或 3D)
dist(DF, method = "euclidean", diag =TRUE, upper = TRUE)
如果您只想省略下三角形upper=TRUE,并且不想在三角形集上看到對角線的零值diag=FALSE
這個函式也可以到 manhattan、minkowski 和 canabera 距離為好。超級簡單
了解您現在想要的,有一個名為 usedist 的 R 包,它提供了一些用于定義矩陣和函式以應用距離測量的方法。
它有一個函式`dist_make(),它將一個函式應用于矩陣中的每一對行(不是資料框)
您將需要弄清楚如何重新調整函式以對齊資料矩陣
這是檔案
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/513598.html
標籤:r表现映射距离矩阵
上一篇:使用pow運算子了解Java17Vector的緩慢性和性能
下一篇:車頂線模型的優化方法
