主頁 > 企業開發 > 在另一個執行緒對其進行變異時從串列中獲取隨機元素

在另一個執行緒對其進行變異時從串列中獲取隨機元素

2022-01-02 22:30:58 企業開發

我正在嘗試創建一個并發資料結構,它允許一個執行緒在另一個執行緒寫入它時從中輪詢隨機元素。

public class SomeList<E> extends CopyOnWriteArrayList<E> {
    private final Random random = new Random();

    public E pollRandom() {
        if (size() == 0) {
            throw new NoSuchElementException();
        }
        return remove(random.nextInt(size()));
    }
}

我擔心的是:在極端情況下,例如,在執行緒 A 呼叫size()(in pollRandom()) 之后,執行緒 B 洗掉最后一個元素。不幸的是,隨機索引恰好是最后一個元素(已被洗掉)的索引。因此,remove()呼叫將拋出一個未捕獲的IndexOutOfBoundsException. 這是我沒想到的 -pollRandom()呼叫失敗,即使此串列中仍有元素。

所以我想問:我的擔心是真的嗎?也許我誤解了CopyOnWriteArrayList(或任何其他型別的并發串列)實際上是做什么的?如果我的擔憂是真實的,有沒有辦法解決問題?我不想添加synchronized到所有方法中,因為添加synchronized會使性能變得更糟。

如果有人愿意回答這個問題,我會很高興。我的英語不好,如果我的表達聽起來含糊或不禮貌,請告訴我,謝謝:)

PS:我知道CopyOnWriteArrayList所有可變操作都很慢,因為它每次都需要完整的副本,感謝@Boris the Spider。它可以是任何型別的并發串列。這里只是一個例子。

uj5u.com熱心網友回復:

COW 串列的作業原理如下:

  • 它有一個相關欄位,即Object[],包含串列中的元素。
  • 任何呼叫變異(所以clearaddaddAllremove,等等)將復制內部陣列,突變適用于復制,然后將其領域這一新的陣列。鑒于 java 的作業方式,“舊”陣列仍然存在,該欄位只是一個指標。
  • 值得注意的是,任何迭代器(for (Foo f : theCowList)是制作一個迭代器的一種方式)都復制了“指標”,這意味著任何現有的迭代器都會繼續運行。他們不會涵蓋您添加的任何內容。它們將涵蓋您洗掉的任何內容 - 由 cowList 制作的迭代器將遍歷所有元素,就像您制作迭代器時一樣,無論您之后執行任何更改。這就是 COWList 的“點”如果您不需要該功能,則 COWList 不太可能是適合您的型別。

COWList 本質上是原子的,對于任何單個呼叫都是安全的。然而,你的操作是三個電話:size()然后indexOfsize()試。這里不能保證原子性。你的擔心是有道理的

一般心態更新

您正在做的是所謂的“檢查然后行動”:您檢查物件的狀態(它是否為空?),然后您決定如何行動。

在并發領域這是錯誤的做法正確的模型是先行動再檢查:假設天氣晴朗,執行行動,然后對無效狀態做出反應。這也意味著它需要的“行為”的一部分做檢查本質。如果沒有這樣的內部操作可用,則兩種模型都不起作用,這就是重點:在這種情況下,您必須找到一種方法來注入同步,否則該操作不可能在并發操作中安全地進行。示例:“如果元素不在串列中,則添加該元素”在普通 jane 中以并發方式不可能的ArrayList

處理并發時的第二個重要認識是,如果您想將并發檢查轉移到物件本身,那么與該物件進行互動的唯一安全方法就是單次呼叫。您正在撥打 3 個電話。不好。你只得到一個。

這是一個可以在這里作業的不同操作的示例:假設您有一個方法從串列中洗掉第一項,NSElemEx如果串列為空則拋出

你的“風格”會這樣寫:

public E pollFirst() {
  // This code is wrong! do not use!
  if (isEmpty()) throw new NoSuchElementException();
  return remove(0);
}

這是錯誤的 - 您混淆了 2 個電話。你只能得到一個。這是正確的方法:

public E pollFirst() {
  try {
    return remove(0);
  } catch (ArrayIndexOutOfBoundsException e) {
    throw new NoSuchElementException();
  }
}

注意我們首先是如何做的,假設天氣晴朗:我們只是洗掉第 0 個元素,一開始不知道是否有這樣的元素。如果失敗,我們對失敗做出反應(如果你呼叫remove(0)一個空的 COWList,一個 ArrayIndexOutOfBoundsException 出現,我們在這里做出反應)。

那么我們該怎么做呢?

不幸的答案是,不可能- COWList 沒有一個可以執行您想要的操作的呼叫,因此,您已經死在水中了。COWList承諾一定的并發安全性;要做到這一點,它有一個名為lock. 諸如remove(int index)獲取此鎖之類的操作將導致任何執行緒(例如)也呼叫remove凍結,直到第一個執行緒完成。

您不能使用此鎖這會導致各種問題。我們只是停留在這一點上,我們需要首先回傳并糾正您犯下的一系列樣式錯誤。

優先組合而不是繼承

您已決定擴展 COWList。這意味著您是說物件的任何實體在所有方面都像 COWList 一樣,并在此基礎上提供其他功能。問題是, COWList 和你想要的不一致。特別是,為了符合“你是一個 COWList 與額外的螺栓”的想法,你需要復制它的鎖定行為:你抓取隨機元素的操作需要鎖定其他執行緒,因為 COWList 作為一個 impl 根本不不提供您需要在沒有鎖的情況下執行此操作的 API,但您實際上看不到鎖,這意味著您無法執行此操作。

The real problem, though, is that you really do not want to be 'a COWList with additional functionality'. That as a concept is rarely a good idea: COWList is already a complex beast, thus anything that is by definition 'a COWList with addons' is even more complicated. Forget COWList, what you want is much simpler: A datastructure to which you can add things concurrently and grab (concurrency-safe) random elements from it. That's all you want. Why bring COWList's rules into it? You're using COWlist here because it's convenient - most of the work is done for you. That's great, but, don't 'expose' that. Keep implementation details internalized. Thus, write it like so:

public class SomeList<E> extends AbstractList<E> {
  private final CopyOnWriteArrayList<E> list = new CopyOnWriteArrayList<E>();
}

Here you just adopt the rules of List itself, but given that your type is named SomeList, I assume you intentionally want that. The mental 'load' of what AbstractList enforces is vastly simpler than what COWList enforces. Now you merely implement all methods you need to, usually as one-liners that just farm out the work to your COWList.

Now we're at least closer to doing it right: You can now make your own lock object or just define in the docs that all operations synchronize on the SomeList instance itself (which means you just add the synchronized keyword to every method - that's shorthand for wrapping the entire method body in synchronized (this) { body-goes-here }.

Sticking a field in a class and implementing many methods as one-liners that just invoke a similar method on said field is called composition, vs adding an extends clause and letting it serve as implementation for most of the methods you intend to expose, which is called inheritance. Prefer composition over inheritance.

Now that you're taking care of the synchronizing on your own, there is absolutely no need for COWList anymore. That inner list can just become a plain jane ArrayList. Much more efficient.

Efficiency

"Just synchronize on all the things" is a bit of a cop-out. synchronized (x) { ... } simply means that only one thread can be in such a block for any given x. Just 'blocking' threads is the easy way out. A really cool datastructure would do some or all of the work without holding the lock. Separately, 'remove item from the middle of a large arraylist' is a slow operation (because all elements that follow must be copied over to one slot earlier; arraylist fundamentally works as a continuous set of elements, hence why removing one in the middle is so pricey).

Thus, even the 'fixed' case of using composition over inheritance is quite inefficient: It uses locks (ouch), and removes elements from the middle of arraylists (double ouch).

Making concurrency-safe data structures that are still fast require three things:

[1] It is quite an artform. You need to come up with very creative ideas.

[2] It's trade-offs, so be sure to be very specific in what you data structure can and cannot do. You often end up with datastructures that take up (way) more space in memory in order to allow lock-free access. Also often seemingly simple operations such as 'how many elements are in you' are impossible to efficiently answer, so don't offer that functionality. There's a reason the java.util.concurrent package has so many classes in it: There is no god-class that can do it all and do it efficiently in both memory, CPU, and lock aspects.

[3] Be clear in the difference between 'trends' and 'guarantees'. For example, it's much easier to write a fast, efficient system that can give you (and remove) a random element from a humongous list of elements that 'trends towards' picking fairly from the bunch, vs. one that guarantees that it is exactly uniformly randomly chosen every time.

Part of the art is to know when you can make do with a trend instead of a guarantee, usually orders-of-magnitude speedups lie in such realizations.

Here are some ideas on how to make hypothetically really fast ones:

Do you add everything, and then you 'switch the mode' and never add another element again, instead only removing from there on out?

If that's the case, a much faster idea:

Have one object that is 'modal'. It starts out with just having an add method (and possibly addAll). Nothing else. Not even .get (don't add API you don't need, it only limits your flexibility when trying to optimize things!). It doesn't even promise concurrency-safe behaviour (calling add from 2 threads simultaneously will fail disastrously at times). When 'done', you call a build() method. This returns a new object that ONLY has poll() method that returns an arbitrary element in a concurrency-safe fashion.

If that's your API you can write it very efficiency and entirely lock free!

Your builder is just a really simple class that contains a plain jane arraylist and fills it:

class RandomPollerBuilder<E> {
  private final ArrayList<E> data = new ArrayList<E>();
  private boolean open = true;

  public void add(E elem) {
    if (!open) throw new IllegalStateException();
    data.add(elem);
  }

  public RandomPoller<E> build() {
    open = false;
    data.trimToSize();
    Collection.shuffle(data);
    return new RandomPoller<E>(data);
  }
}

隨機輪詢器看起來像:

public class RandomPoller<E> {
  private final AtomicInteger pos;
  private final List<E> input;

  RandomPoller<E>(List<E> input) {
    this.input = input;
    this.pos = new AtomicInteger(input.size());
  }

  public E poll() {
    int idx = pos.decrementAndGet();
    if (idx >= 0) return input.get(idx);
    pos.incrementAndGet();
    throw new NoSuchElementException();
  }

  public int size() {
    return Math.max(0, pos.get());
  }
}

在這里,我們結合了大量屬性:

  • 我們根本不洗掉。去除往往很慢,如果我們可以避免它,為什么不呢?
  • 我們依賴 AtomicInteger,它為我們提供了一種在并發環境中以比鎖快得多的方式保證嚴格和完整排序的方法。
  • 我們將實作減少到您真正需要的部分。每種方法寫起來都很痛苦。我包含了一個size()方法來說明這一點:poll演算法的作業方式是它將 0 遞增到 -1 甚至更糟(如果多個執行緒同時嘗試poll()使用空輪詢器,則原子整數可以低于 -1,但最終它會回傳到 0,所以沒有“翻轉”我們的原子整數的風險,因為沒有系統會有 20 億個執行緒)。我們需要在我們的size()方法中防范這種情況
  • 這也意味著:如果你不是特別需要效率,那么不要理會這些,并制作全域鎖定資料結構。逃避很容易并且有效(只是效率不高)。測驗并發性是非常困難的(因為事情只是在正確的情況下可能會出錯,他們不能保證。在測驗中,您希望損壞的代碼實際上失敗,這就是問題所在。這實際上是不可能的!) - 所以不要除非您完全清楚自己在做什么并且確定需要它,否則不要去那里。

轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/401114.html

標籤:爪哇 多线程 表现 并发

上一篇:如何控制在tkinter中點擊按鈕的事件

下一篇:MySQLNOTIN(array[])vsPHPin_array(array[])?

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • IEEE1588PTP在數字化變電站時鐘同步方面的應用

    IEEE1588ptp在數字化變電站時鐘同步方面的應用 京準電子科技官微——ahjzsz 一、電力系統時間同步基本概況 隨著對IEC 61850標準研究的不斷深入,國內外學者提出基于IEC61850通信標準體系建設數字化變電站的發展思路。數字化變電站與常規變電站的顯著區別在于程序層傳統的電流/電壓互 ......

    uj5u.com 2020-09-10 03:51:52 more
  • HTTP request smuggling CL.TE

    CL.TE 簡介 前端通過Content-Length處理請求,通過反向代理或者負載均衡將請求轉發到后端,后端Transfer-Encoding優先級較高,以TE處理請求造成安全問題。 檢測 發送如下資料包 POST / HTTP/1.1 Host: ac391f7e1e9af821806e890 ......

    uj5u.com 2020-09-10 03:52:11 more
  • 網路滲透資料大全單——漏洞庫篇

    網路滲透資料大全單——漏洞庫篇漏洞庫 NVD ——美國國家漏洞庫 →http://nvd.nist.gov/。 CERT ——美國國家應急回應中心 →https://www.us-cert.gov/ OSVDB ——開源漏洞庫 →http://osvdb.org Bugtraq ——賽門鐵克 →ht ......

    uj5u.com 2020-09-10 03:52:15 more
  • 京準講述NTP時鐘服務器應用及原理

    京準講述NTP時鐘服務器應用及原理京準講述NTP時鐘服務器應用及原理 安徽京準電子科技官微——ahjzsz 北斗授時原理 授時是指接識訓通過某種方式獲得本地時間與北斗標準時間的鐘差,然后調整本地時鐘使時差控制在一定的精度范圍內。 衛星導航系統通常由三部分組成:導航授時衛星、地面檢測校正維護系統和用戶 ......

    uj5u.com 2020-09-10 03:52:25 more
  • 利用北斗衛星系統設計NTP網路時間服務器

    利用北斗衛星系統設計NTP網路時間服務器 利用北斗衛星系統設計NTP網路時間服務器 安徽京準電子科技官微——ahjzsz 概述 NTP網路時間服務器是一款支持NTP和SNTP網路時間同步協議,高精度、大容量、高品質的高科技時鐘產品。 NTP網路時間服務器設備采用冗余架構設計,高精度時鐘直接來源于北斗 ......

    uj5u.com 2020-09-10 03:52:35 more
  • 詳細解讀電力系統各種對時方式

    詳細解讀電力系統各種對時方式 詳細解讀電力系統各種對時方式 安徽京準電子科技官微——ahjzsz,更多資料請添加VX 衛星同步時鐘是我京準公司開發研制的應用衛星授時時技術的標準時間顯示和發送的裝置,該裝置以M國全球定位系統(GLOBAL POSITIONING SYSTEM,縮寫為GPS)或者我國北 ......

    uj5u.com 2020-09-10 03:52:45 more
  • 如何保證外包團隊接入企業內網安全

    不管企業規模的大小,只要企業想省錢,那么企業的某些服務就一定會采用外包的形式,然而看似美好又經濟的策略,其實也有不好的一面。下面我通過安全的角度來聊聊使用外包團的安全隱患問題。 先看看什么服務會使用外包的,最常見的就是話務/客服這種需要大量重復性、無技術性的服務,或者是一些銷售外包、特殊的職能外包等 ......

    uj5u.com 2020-09-10 03:52:57 more
  • PHP漏洞之【整型數字型SQL注入】

    0x01 什么是SQL注入 SQL是一種注入攻擊,通過前端帶入后端資料庫進行惡意的SQL陳述句查詢。 0x02 SQL整型注入原理 SQL注入一般發生在動態網站URL地址里,當然也會發生在其它地發,如登錄框等等也會存在注入,只要是和資料庫打交道的地方都有可能存在。 如這里http://192.168. ......

    uj5u.com 2020-09-10 03:55:40 more
  • [GXYCTF2019]禁止套娃

    git泄露獲取原始碼 使用GET傳參,引數為exp 經過三層過濾執行 第一層過濾偽協議,第二層過濾帶引數的函式,第三層過濾一些函式 preg_replace('/[a-z,_]+\((?R)?\)/', NULL, $_GET['exp'] (?R)參考當前正則運算式,相當于匹配函式里的引數 因此傳遞 ......

    uj5u.com 2020-09-10 03:56:07 more
  • 等保2.0實施流程

    流程 結論 ......

    uj5u.com 2020-09-10 03:56:16 more
最新发布
  • 使用Django Rest framework搭建Blog

    在前面的Blog例子中我們使用的是GraphQL, 雖然GraphQL的使用處于上升趨勢,但是Rest API還是使用的更廣泛一些. 所以還是決定回到傳統的rest api framework上來, Django rest framework的官網上給了一個很好用的QuickStart, 我參考Qu ......

    uj5u.com 2023-04-20 08:17:54 more
  • 記錄-new Date() 我忍你很久了!

    這里給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 大家平時在開發的時候有沒被new Date()折磨過?就是它的諸多怪異的設定讓你每每用的時候,都可能不小心踩坑。造成程式意外出錯,卻一下子找不到問題出處,那叫一個煩透了…… 下面,我就列舉它的“四宗罪”及應用思考 可惡的四宗罪 1. Sa ......

    uj5u.com 2023-04-20 08:17:47 more
  • 使用Vue.js實作文字跑馬燈效果

    實作文字跑馬燈效果,首先用到 substring()截取 和 setInterval計時器 clearInterval()清除計時器 效果如下: 實作代碼如下: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta ......

    uj5u.com 2023-04-20 08:12:31 more
  • JavaScript 運算子

    JavaScript 運算子/運算子 在 JavaScript 中,有一些運算子可以使代碼更簡潔、易讀和高效。以下是一些常見的運算子: 1、可選鏈運算子(optional chaining operator) ?.是可選鏈運算子(optional chaining operator)。?. 可選鏈操 ......

    uj5u.com 2023-04-20 08:02:25 more
  • CSS—相對單位rem

    一、概述 rem是一個相對長度單位,它的單位長度取決于根標簽html的字體尺寸。rem即root em的意思,中文翻譯為根em。瀏覽器的文本尺寸一般默認為16px,即默認情況下: 1rem = 16px rem布局原理:根據CSS媒體查詢功能,更改根標簽的字體尺寸,實作rem單位隨螢屏尺寸的變化,如 ......

    uj5u.com 2023-04-20 08:02:21 more
  • 我的第一個NPM包:panghu-planebattle-esm(胖虎飛機大戰)使用說明

    好家伙,我的包終于開發完啦 歡迎使用胖虎的飛機大戰包!! 為你的主頁添加色彩 這是一個有趣的網頁小游戲包,使用canvas和js開發 使用ES6模塊化開發 效果圖如下: (覺得圖片太sb的可以自己改) 代碼已開源!! Git: https://gitee.com/tang-and-han-dynas ......

    uj5u.com 2023-04-20 08:01:50 more
  • 如何在 vue3 中使用 jsx/tsx?

    我們都知道,通常情況下我們使用 vue 大多都是用的 SFC(Signle File Component)單檔案組件模式,即一個組件就是一個檔案,但其實 Vue 也是支持使用 JSX 來撰寫組件的。這里不討論 SFC 和 JSX 的好壞,這個仁者見仁智者見智。本篇文章旨在帶領大家快速了解和使用 Vu ......

    uj5u.com 2023-04-20 08:01:37 more
  • 【Vue2.x原始碼系列06】計算屬性computed原理

    本章目標:計算屬性是如何實作的?計算屬性快取原理以及洋蔥模型的應用?在初始化Vue實體時,我們會給每個計算屬性都創建一個對應watcher,我們稱之為計算屬性watcher ......

    uj5u.com 2023-04-20 08:01:31 more
  • http1.1與http2.0

    一、http是什么 通俗來講,http就是計算機通過網路進行通信的規則,是一個基于請求與回應,無狀態的,應用層協議。常用于TCP/IP協議傳輸資料。目前任何終端之間任何一種通信方式都必須按Http協議進行,否則無法連接。tcp(三次握手,四次揮手)。 請求與回應:客戶端請求、服務端回應資料。 無狀態 ......

    uj5u.com 2023-04-20 08:01:10 more
  • http1.1與http2.0

    一、http是什么 通俗來講,http就是計算機通過網路進行通信的規則,是一個基于請求與回應,無狀態的,應用層協議。常用于TCP/IP協議傳輸資料。目前任何終端之間任何一種通信方式都必須按Http協議進行,否則無法連接。tcp(三次握手,四次揮手)。 請求與回應:客戶端請求、服務端回應資料。 無狀態 ......

    uj5u.com 2023-04-20 08:00:32 more