JDK 8 新特性之函式式編程 → Stream API-有解無憂

開心一刻

　　今天和朋友們去K歌，看著這群年輕人一個個唱的賊嗨，不禁感慨道：年輕真好啊！

　　想到自己年輕的時候，那也是拿著麥克風不放的人

　　現在的我沒那激情了，只喜歡坐在角落里，默默的聽著他們唱，就連旁邊的妹子都勸我說：大哥別摸了，唱首歌吧

Stream 初體驗

　　很多時候，我們往往會選擇在資料庫層面進行資料的過濾、匯聚，這就導致我們對 JDK8 的 Stream 應用的特別少，對它也就特別陌生了

　　但有時候，我們可以將原始資料加載到記憶體，在記憶體中進行資料的過濾和匯聚，這樣可以減少資料庫操作，提高查詢效率（非絕對，資料量不大或走索引的情況下，資料庫查詢也是很快的）

　　假設我們在記憶體中進行資料的過濾、匯聚，在 JDK8 之前（或不用 JDK8 的 Stream），我們會如何處理？多次 for 回圈結合 if ，并創建多個集合來存放中間結果，最后對中間結果進行匯聚，代碼量會非常大；如果想牛逼一點，用多執行緒來處理，那就更復雜了（執行緒池、并發等問題），Stream 就解決了這些痛點，如果你的 JDK 版本是 8（或更高），你還在用 for 回圈進行資料的過濾和匯聚，那就有點這味了

　　那 Stream 到底是何方神圣，讓樓主如此推崇，我們往下看（再不講重點，樓主怕是要收刀片了！）

　　先聞其聲

　　　　我們先來看看她媽是怎么介紹她的： A sequence of elements supporting sequential and parallel aggregate operations.

　　　　我們能從中獲取到兩個資訊：

　　　　　　1、Stream 是元素的集合（有點類似 Iterator）

　　　　　　2、對原 Stream 支持順序或并行的匯聚操作

　　　　這她媽的介紹還是比較抽象，我們需要從 Stream 自身下手，慢慢去了解她

　　　　常見的 Stream 介面繼承關系如下

　　　　IntStream, LongStream, DoubleStream 對應的是三種基本型別（int, long, double，不是包裝型別），Stream 對應所有剩余型別

　　　　為什么不是這樣

　　　　或者取消掉 IntStream, LongStream, DoubleStream，由 Stream 對應所有型別？

　　　　我們知道基本型別與包裝型別之前的裝箱與拆箱是有性能消耗的，頻繁的轉換會有比較嚴重的性能損耗，所以為不同資料型別設定不同stream介面，可以提高性能，也可以增加特定介面

　　一睹芳容

　　　　上面說了那么多，卻始終未一睹 Stream 的芳容，心里著急呀！我們先來瞟一眼

List<Integer> nums = Arrays.asList(1, 8, 0, 5, 3, 2);
// 統計大于 3 的元素個數
long count = nums.stream().filter(e -> e > 3).count();

　　　　是不是很美？千萬不要以為 Stream 就這？這還只是她的一條腿，她渾身上下都是寶

　　　　通過上面的簡單示例，我們可以剖析出 Stream 的通用語法

　　　　也就是說使用 Stream 基本分三步：創建 Steam、轉換Stream、匯聚，下面我們就從這三步詳細介紹 Stream

創建 Stream

　　Stream 的創建方式有很多，我們只講最常用的兩種

　　基于陣列： Stream<String> arrayStream = Arrays.stream(new String[]{"123", "abc", "A", "張三"});

　　基于 Collection： Stream<String> collectionStream = Arrays.asList("123", "abc", "A", "張三").stream();

　　把陣列變成 Stream 使用 Arrays.stream() 方法；對于 Collection（List、Set、Queue 等），直接呼叫 stream() 方法就可以獲得 Stream

轉換 Stream

　　轉換 Stream 的目的是對原 Stream 做出某種程度的資料映射/過濾，然后回傳一個新的流，交給下一個操作使用，對原 Stream 是沒有任何影響的，這類操作都是惰性化的（lazy），就是說，僅僅呼叫到這類方法，并沒有真正開始流的遍歷

　　由于獲取的是一個新的流，而不是我們需要的最終結果，所以轉換 Stream 這個操作有個官方的稱呼： Intermediate ，即中間操作

　　具體的轉換操作有很多，我們挑一些常用的來說明一下

　　distinct

　　　　對 Stream 中的元素進行去重操作（去重邏輯依賴元素的 equals 方法），新生成的 Stream 中沒有重復的元素

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
Stream<Integer> distinctStream = nums.stream().distinct();

　　filter

　　　　對 Stream 中的每個元素使用給定的過濾條件進行過濾操作，新生成的 Stream 只包含符合條件的元素

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
Stream<Integer> filterStream = nums.stream().filter(e -> e >= 2);

　　map

　　　　對 Stream 中的每個元素按給定的轉換規則進行轉換操作，新生成的 Stream 只包含轉換生成的元素

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
Stream<String> mapStream = nums.stream().map(e -> e * e + "");

　　　　JDK1.8 還提供了三個專門針對基本資料型別的 map 變種方法：mapToInt，mapToLong 和 mapToDouble，這三個方法也比較好理解，就是把原始 Stream 轉換成一個新的 Stream，這個新生成的 Stream 中的元素都是對應的基本型別，之所以會有這三個變種方法，是考慮到自動裝箱/拆箱的額外消耗

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
IntStream intStream = nums.stream().mapToInt(e -> e * 2);
LongStream longStream = nums.stream().mapToLong(e -> 3L * e);
DoubleStream doubleStream = nums.stream().mapToDouble(e -> 3.0 * e);

　　flatMap

　　　　與 map 類似

<R> Stream<R> map(Function<? super T, ? extends R> mapper);

<R> Stream<R> flatMap(Function<? super T, ? extends Stream<? extends R>> mapper);

　　　　不同的是 flatMap 中每個元素轉換得到的是 Stream 物件，然后會把子 Stream 中的元素都放到新的 Stream 中

List<List<String>> groupList = Arrays.asList(Arrays.asList("q","w","e"), Arrays.asList("a", "s", "d"), Arrays.asList("z","x", "c"));
Stream<String> superStarStream = groupList.stream().flatMap(group -> group.stream().map(e -> e + 1));

　　　　簡單點理解就是：把幾個小的集合中的元素經過處理后合并到一個大的集合中

　　　　類似的，JDK1.8 也提供了三個專門針對基本資料型別的 flatMap 變種方法：flatMapToInt，flatMapToLong 和 flatMapToDouble

　　limit

　　　　拷貝原 Stream 中的前 N 個元素到新的 Stream 中，如果原 Stream 中包含的元素個數小于 N，那就獲取其所有的元素

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
Stream<Integer> limitStream = nums.stream().limit(4);

　　skip

　　　　拷貝原 Stream 除了前 N 個元素后剩下的所有元素到新 Stream，如果原 Stream 中包含的元素個數小于 N，那么回傳空 Stream

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
Stream<Integer> skipStream = nums.stream().skip(4);

　　sorted

　　　　對原 Stream 進行排序操作，得到一個新的、有序的 Stream

　　　　排序函式有兩個，一個是用自然順序排序，一個是使用自定義比較器排序

Stream<T> sorted();
Stream<T> sorted(Comparator<? super T> comparator);

　　　　使用起來非常簡單，如下所示

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
// 自然排序，默認升序排序
Stream<Integer> sortedStream = nums.stream().sorted();
// 自定義排序
Stream<Integer> sortedCompareStream = nums.stream().sorted((a, b) -> b.compareTo(a));

　　peek

Stream<T> peek(Consumer<? super T> action);

　　　　生成一個包含原 Stream 所有元素的新 Stream，同時會提供一個消費函式（Consumer 實體），新 Stream 每個元素被消費的時候都會執行給定的消費函式

　　　　與 map 很像，但不會影響新 Stream 中的元素（還是原 Stream 中的元素），可以做一些輸出，外部處理等輔助操作

　　　　這個在實際專案中用的不多，知道是怎么回事就好

匯聚

　　匯聚操作接受一個 Stream 為輸入，反復使用某個匯聚操作，把 Stream 中的元素合并成一個匯總的結果，匯總結果可能是某個值，也可能是一個集合

　　匯聚操作能夠得到我們需要的最終結果，相當于一個終止操作，所以也有另一個稱呼： Terminal ，即結束操作

　　一個流只能有一個 terminal 操作，當這個操作執行后，流就被使用“光”了，無法再被操作，所以這必定是流的最后一個操作，Terminal 操作的執行，才會真正開始流的遍歷

　　JDK1.8 提供了很多常用的匯聚操作，我們一起來看看

　　foreach

　　　　這個類似我們平時的 for 回圈，遍歷 Stream 中的元素，執行指定的操作

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
nums.stream().forEach(num -> System.out.println(num));

　　max min count

　　　　作用就是字面意思

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
// 求最大值
Integer max = nums.stream().max(Comparator.naturalOrder()).get();
// 求最小值
Integer min = nums.stream().min(Comparator.naturalOrder()).get();
// 求元素個數
long count = nums.stream().count();
System.out.println("max = " + max);
System.out.println("min = " + min);
System.out.println("count = " + count);

　　findFirst

　　　　回傳一個 Optional，它包含了 Stream 中的第一個元素，若 Stream 是空的，則回傳一個空的 Optional

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
Integer firstNum = nums.stream().findFirst().get();

　　findAny

　　　　回傳一個 Optional，它包含了 Stream 中的任意一個元素，若 Stream 是空的，則回傳一個空的 Optional

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
Integer anyNum = nums.stream().findAny().get();

　　　　在串行的流中，findAny 和 findFirst回傳的，都是第一個物件；而在并行的流中，findAny 回傳的是最快處理完的那個執行緒的資料，所以說，在并行操作中，對資料沒有順序上的要求，那么 findAny 的效率會比 findFirst 要快的，但是沒有 findFirst 穩定

　　anyMatch

　　　　Stream 中是否有任意一個元素滿足判斷條件，有則回傳 true

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
boolean matchResult = nums.stream().anyMatch(num -> num > 2);

　　allMatch

　　　　Stream 中所有元素都滿足判斷條件則回傳 true

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
boolean matchResult = nums.stream().allMatch(num -> num > 2);

　　noneMatch

　　　　與 allMatch 相反，Stream 中所有元素都不滿足判斷條件，則回傳 true

List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);
boolean matchResult = nums.stream().noneMatch(num -> num > 7);

　　reduce

　　　　reduce 的主要作用是把 Stream 元素組合起來

　　　　它提供一個起始值（種子），然后依照運算規則（BinaryOperator），和 Stream 中的第一個、第二個、第 n 個元素組合，生成一個我們需要的值

　　　　JDK 提供了三種 reduce

T reduce(T identity, BinaryOperator<T> accumulator);

Optional<T> reduce(BinaryOperator<T> accumulator);

<U> U reduce(U identity,
                 BiFunction<U, ? super T, U> accumulator,
                 BinaryOperator<U> combiner);

　　　　引數不同，其回傳值型別是有所不同的，但其語意、作用還是一樣的

　　　　max()、min()其實都是特殊的 reduce，只是因為它們比較常用，所以就簡化書寫專門設計出了它們

@Override
public final Optional<P_OUT> max(Comparator<? super P_OUT> comparator) {
    return reduce(BinaryOperator.maxBy(comparator));
}

@Override
public final Optional<P_OUT> min(Comparator<? super P_OUT> comparator) {
    return reduce(BinaryOperator.minBy(comparator));

}

　　　　reduce 在實際專案中用的不多，又非常靈活，我們就簡單看幾個示例

        List<Integer> nums = Arrays.asList(1, 2, 1, 3, 2, 5);

        // 求和，相當于sum(); 有起始值
        Integer sum1 = nums.stream().reduce(0, Integer::sum);
        Integer sum2 = nums.stream().reduce(0, (a,b) -> a + b);
        // 求和，相當于sum(); 無起始值
        Integer sum3 = nums.stream().reduce(Integer::sum).get();
        System.out.println("sum = " + sum1 + ", sum2 = " + sum2 + ", sum3 = " + sum3);

        // 求最大值，相當于max()
        Integer max = nums.stream().reduce(Integer.MIN_VALUE, Integer::max);
        System.out.println("max = " + max);
        // 求最小值，相當于min()
        Integer min = nums.stream().reduce(Integer.MAX_VALUE, Integer::min);
        System.out.println("min = " + min);

View Code

　　　　reduce 擅長的是生成一個值，如果想要從 Stream 生成一個集合或者 Map 等復雜的物件該怎么辦呢？就需要 collect 出馬了

　　collect

　　　　collect 是 Stream 介面中最靈活的，也是最強大的；JDK 中提供了兩種 collect

// Supplier supplier是一個工廠函式，用來生成一個新的容器；
// BiConsumer accumulator也是一個函式，用來把Stream中的元素添加到結果容器中
// BiConsumer combiner還是一個函式，用來把中間狀態的多個結果容器合并成為一個（并發的時候會用到）
<R> R collect(Supplier<R> supplier,
              BiConsumer<R, ? super T> accumulator,
              BiConsumer<R, R> combiner);

<R, A> R collect(Collector<? super T, A, R> collector);

　　　　我們來各看一個案例

List<String> strList = Arrays.asList("123","abc", "1w1");
String concat  = strList.stream().collect(StringBuilder::new, StringBuilder::append, StringBuilder::append).toString();
System.out.println(concat);

List<String> stringList = strList.stream().collect(Collectors.toList());

　　　　實際應用中，基本上用的是第二種，而且用的是 JDK 中已經提供好的 Collector，在 Collectors 中提供了很多常用的 Collector，如下

　　　　我們挑一些比較常用的來說明下，有興趣的可以去通讀下

　　　　轉集合

　　　　　　toList、toSet、toMap

public class StreamTest {

    public static void main(String[] args) {
        Person[] personArray = {
                new Person("shangsan", 23), new Person("張三", 23),
                new Person("lisi", 24), new Person("李四", 24),
                new Person("wangwu", 20), new Person("王五", 20)};
        // 轉 list
        List<Person> personList = Arrays.stream(personArray).collect(Collectors.toList());
        // 轉 set
        Set<Person> personSet = Arrays.stream(personArray).collect(Collectors.toSet());
        // 轉 map, key為 name, value 為 Person 實體
        Map<String, Person> personMap = Arrays.stream(personArray).collect(Collectors.toMap(Person::getName, person -> person));

        System.out.println(personList);
        System.out.println(personSet);
        System.out.println(personMap);
    }

    static class Person {
        private String name;
        private Integer age;

        Person(){}

        Person(String name, Integer age) {
            this.name = name;
            this.age = age;
        }

        public String getName() {
            return name;
        }

        public void setName(String name) {
            this.name = name;
        }

        public Integer getAge() {
            return age;
        }

        public void setAge(Integer age) {
            this.age = age;
        }

        @Override
        public String toString() {
            return "Person{" +
                    "name='" + name + '\'' +
                    ", age=" + age +
                    '}';
        }
    }
}

View Code

　　　　　　toMap 有兩個注意點

　　　　　　　　1、底層呼叫的是 map.merge 方法，該方法遇到 value 為 null 的情況會報 npe

　　　　　　　　2、遇到重復的 key 會直接拋 IllegalStateException，因為未指定沖突合并策略，也就是第三個引數BinaryOperator<U> mergeFunction

　　　　分組

public class StreamTest {

    public static void main(String[] args) {
        Person[] personArray = {
                new Person("shangsan", 23), new Person("張三", 23),
                new Person("lisi", 24), new Person("李四", 24),
                new Person("wangwu", 20), new Person("王五", 20)};

        // 根據年齡進行分組
        Map<Integer, List<Person>> ageGroup = Arrays.stream(personArray).collect(Collectors.groupingBy(Person::getAge));
        System.out.println(ageGroup);
    }

    static class Person {
        private String name;
        private Integer age;

        Person(){}

        Person(String name, Integer age) {
            this.name = name;
            this.age = age;
        }

        public String getName() {
            return name;
        }

        public void setName(String name) {
            this.name = name;
        }

        public Integer getAge() {
            return age;
        }

        public void setAge(Integer age) {
            this.age = age;
        }

        @Override
        public String toString() {
            return "Person{" +
                    "name='" + name + '\'' +
                    ", age=" + age +
                    '}';
        }
    }
}

View Code

　　　　求和

// 年齡求和 summingInt、summingLong、summingDouble 類似
Integer ageSum = Arrays.stream(personArray).collect(Collectors.summingInt(Person::getAge));
System.out.println("age sum = " + ageSum);

　　　　求平均值

// 求平均值 averagingInt、averagingLong、averagingDouble 類似
Double averageAge = Arrays.stream(personArray).collect(Collectors.averagingInt(Person::getAge));
System.out.println("average age = " + averageAge);

　　　　其他

// 統計人數
Long count = Arrays.stream(personArray).collect(Collectors.counting());
System.out.println("人數 = " + count);

List<Integer> intList = Arrays.asList(1, 2, 3, 1, 5, 2);
// 求和
Integer sum = intList.stream().collect(Collectors.reducing(0, (a, b) -> a + b));
System.out.println("sum = " + sum);

// 字串拼接
List<String> strList = Arrays.asList("123", "abc", "666");
String str = strList.stream().collect(Collectors.joining(",", "(", ")"));
System.out.println(str);

并行流

　　前面講了那么多，都是基于順序流（Stream），JDK1.8 也提供了并行流： parallelStream ，使用起來非常簡單，通過 parallelStream() 可能創建并行流，流的操作還是和順序流一樣

List<Integer> intList = Arrays.asList(1, 2, 3, 1, 5, 2);
boolean result = intList.parallelStream().anyMatch(e -> e > 5);
System.out.println("result = " + result);

　　顧名思義，并行流可以運用多核特性(forkAndJoin)進行并行處理，從而大幅提高效率，既然能提高效率，為什么實際專案中，順序流用的更多，而并行流用的非常少了，還是有一些原因的

　　1、parallelStream 是執行緒不安全的

　　　　一旦出現并發問題，大家都懂的，非常頭疼

　　2、parallelStream 適用于 CPU 密集型任務

　　　　如果 CPU 負載已經很大，還用并行流，不但不會提高效率，反而會降低效率

　　　　并行流不適用于 I/O 密集型任務，很可能會造成 I/O 阻塞

　　3、并行流無法保證元素順序，輸出結果具有不確定性

　　　　如果我們的業務需要關注元素先后順序，那么不能用并行流

　　4、lambda 的執行并不是瞬間完成的，所有使用 parallel stream 的程式都有可能成為阻塞程式的源頭

總結

　　Stream 特點

　　　　無存盤：Stream 不是資料結構并不保存資料，它是有關演算法和計算的，它只是某種資料源的一個視圖，資料源可以是一個陣列，Java 容器或 I/O channel

　　　　函式式編程：每次轉換，原有 Stream 不改變，回傳一個新的 Stream 物件，這就允許對其操作可以像鏈條一樣排列；轉換程序可以多次

　　　　惰性執行：Stream 上的轉換操作（中間操作）并不會立即執行，只有執行匯聚操作（終止操作）時，轉換操作才會執行

　　　　一次消費：Stream 只能被使用一次，一旦遍歷過就會失效，就像容器的迭代器那樣，想要再次遍歷必須重新生成

　　Stream 優點

　　　　代碼簡潔且易理解，這個感受是最明顯的，用與不用 Stream，代碼量與可閱讀性相差甚遠

　　　　多核友好，如果想多執行緒處理，只需要調一下 parallel() 方法，僅此而已

　　Stream 操作分類

　　　　分兩類：中間操作（Intermediate）、結束操作（Terminal）

　　　　中間操作總是會惰式執行，呼叫中間操作只會生成一個標記了該操作的新 stream，僅此而已

　　　　結束操作會觸發實際計算，計算發生時會把所有中間操作積攢的操作以 pipeline 的方式執行，這樣可以減少迭代次數；計算完成之后stream就會失效

　　性能問題

　　　　在對于一個 Stream 進行多次轉換操作 (Intermediate 操作)，每次都對 Stream 的每個元素進行轉換，而且是執行多次，這樣時間復雜度就是 N（轉換次數）個 for 回圈里把所有操作都做掉的總和嗎？其實不是這樣的，轉換操作都是 lazy 的，多個轉換操作只會在 Terminal 操作的時候融合起來，一次回圈完成，我們可以這樣簡單的理解，Stream 里有個操作函式的集合，每次轉換操作就是把轉換函式放入這個集合中，在 Terminal 操作的時候回圈 Stream 對應的集合，然后對每個元素執行所有的函式

　　　　關于順序流、并行流、傳統 for 的性能問題，大家看看這個：Java Stream API性能測驗、for回圈與串行化、并行化Stream流性能對比

參考

　　Java 8 中的 Streams API 詳解

　　JDK8函式式編程之Stream API

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/33606.html

標籤：Java

上一篇：Struts+Servlet+JDBC網上手機銷售系統

下一篇：Docker 極簡入門教程，傻瓜都能看懂！