Java 8 Stream API 引入和使用-有解無憂

引入流

流是什么

流是Java API的新成員，它允許你以宣告性的方式處理資料集合，可以看成遍歷資料集的高級迭代，流可以透明地并行處理，無需撰寫多執行緒代碼，我們先簡單看一下使用流的好處，下面兩段代碼都是用來回傳年齡小于14歲的初中生的姓名，并按照年齡排序，

假如我們有下面Student物體類

@Data
public class Student {
    private String name;
    private int age;
    private boolean member;
    private Grade grade;
    public Student() {
    }
    public Student(String name, int age, boolean member, Grade grade) {
        this.name = name;
        this.age = age;
        this.member = member;
        this.grade = grade;
    }
    public enum Grade{
        JUNIOR_ONE,JUNIOR_TWO,JUNIOR_THREE
    }
}

Java 8之前的實作方式：

List<Student> students = Arrays.asList(
        new Student("張初一", 13, false, Student.Grade.JUNIOR_ONE),
        new Student("李初二", 14, false, Student.Grade.JUNIOR_TWO),
        new Student("孫初三", 15, false, Student.Grade.JUNIOR_THREE),
        new Student("王初一", 12, false, Student.Grade.JUNIOR_ONE),
        new Student("錢初二", 14, false, Student.Grade.JUNIOR_TWO),
        new Student("周初三", 16, false, Student.Grade.JUNIOR_THREE));
List<Student> resultStudent = new ArrayList<>(); //垃圾變數，一次性的中間變數
//foreach回圈，根據條件篩選元素
for (Student student : students) {
    if (student.getAge() < 14) {
        resultStudent.add(student);
    }
}
//匿名類，給元素排序
Collections.sort(resultStudent, new Comparator<Student>() {
    @Override
    public int compare(Student o1, Student o2) {
        return Integer.compare(o1.getAge(), o2.getAge());
    }
});
List<String> resultName = new ArrayList<>();
//foreach回圈，獲取元素屬性
for (Student student : resultStudent) {
    resultName.add(student.getName());
}

Java 8流的實作方式：

List<String> resultName = students.stream()
        .filter(student -> student.getAge() < 14) //年齡篩選
        .sorted(Comparator.comparing(Student::getAge)) //年齡排序
        .map(Student::getName) //提取姓名
        .collect(Collectors.toList());//將提取的姓名保存在List中

為了利用多核架構并行執行這段代碼，只需要把stream()替換成parallelStream()即可，

通過對比兩段代碼之后，Java8流的方式有幾個顯而易見的好處，

代碼是以宣告性的方式寫的：說明想要做什么（篩選小于14歲的學生）而不是去說明怎么去做（回圈、if）
將幾個基礎操作鏈接起來，表達復雜的資料處理流水線（filter->sorted->map->collect）,同時保持代碼清晰可讀，

總結一下，Java 8的Stream API帶來的好處：

宣告性-更簡潔，更易讀
可復合-更靈活
可并行-性能更好

流簡介

流到底是什么？簡單定義：“從支持資料處理操作的源生成的元素序列”，下面剖析這個定義，

元素序列：像集合一樣，流也提供了一個介面，可以訪問特定元素型別的一組有序值，集合講的是資料，流講的是計算，
源：流使用一個提供資料的源，如集合、陣列或輸入/輸出資源，
資料處理操作：流的資料處理功能之處類似于資料庫的操作，以及函式式編程語言中的常用操作，如filter、map、reduce、find、match、sort等，流的操作可以順序執行，也可以并行執行，
流水線：很多流的操作會回傳一個流，這樣多個操作就可以鏈接起來，形成一個流水線，可以看成資料庫式查詢，
內部迭代：于迭代器顯示迭代的不同，流的迭代操作是在背后進行的，

看一段代碼，更好理解這些概念

List<String> resultName = students.stream() //從串列中獲取流
        .filter(student -> student.getAge() < 16) //操作流水線：篩選
        .map(Student::getName) //操作流水線：提取姓名
        .limit(2) //操作流水線：只取2個
        .collect(Collectors.toList());//將結果保存在List中

在上面代碼中，資料源是學生串列（students），用來給流提供一個元素序列，呼叫stream()獲取一個流，接下來就是一系列資料處理操作：filter、map、limit和collect，除collect之外，所有這些操作都會回傳一個流，組成了一條流水線，最后collect操作開始處理流水線，并回傳結果，

流與集合

粗略的說，流與集合之間的差異就在于什么時候進行計算，

集合是一個記憶體中的資料結構（可以添加或者洗掉），它包含資料結構中目前所有的值——集合中的每個元素都是預先處理好然后添加到集合中的，
流則是在概念上固定的資料結構（不能添加或洗掉元素），其元素是按需計算的，

在哲學中，流被看作在時間中分布的一組值，而集合則是空間（計算機記憶體）中分布的一組值，在一個時間點上全體存在，

只能遍歷一次

和迭代器類似，流只能遍歷一次，遍歷完成之后，我們說這個流已經被消費掉了，

例如下面的代碼會拋出例外

Stream<Student> stream = students.stream();
stream.forEach(System.out::println);
stream.forEach(System.out::println);

執行之后拋出如下例外：

Exception in thread "main" java.lang.IllegalStateException: stream has already been operated upon or closed
	at java.util.stream.AbstractPipeline.sourceStageSpliterator(AbstractPipeline.java:279)
	at java.util.stream.ReferencePipeline$Head.forEach(ReferencePipeline.java:580)
	at com.example.demo.java8.stream.StreamTest.main(StreamTest.java:58)

所以要記得，流只能消費一次，

外部迭代與內部迭代

我們使用iterator或者foreach遍歷集合時的這種迭代方式被稱為外部迭代，而Streams庫使用內部迭代，它幫你把迭代做了，還把得到的流值存在了某個地方，你只要給出一個函式說要干什么就可以了，

下面的代碼說明了這種區別，

外部迭代

//使用增強for回圈做外部迭代，底層還是迭代器
List<String> resultName = new ArrayList<>();
for (Student student : students) {
    resultName.add(student.getName());
}
//使用迭代器做外部迭代
Iterator<Student> iterator = students.iterator();
while (iterator.hasNext()){
    Student student = iterator.next();
    resultName.add(student.getName());
}

內部迭代

List<String> resultName = students.stream()
        .map(Student::getName)
        .collect(Collectors.toList());

流操作

java.util.stream中的Stream介面定義了許多操作，可以分為兩大類，先看一下下面這個例子：

List<String> resultName = students.stream() //從串列中獲取流
        .filter(student -> student.getAge() < 16) //中間操作
        .map(Student::getName) //中間操作
        .limit(2) //中間操作
        .collect(Collectors.toList());//將Stream轉為List

可以看到兩類操作：

filter、map和limit鏈接的一條流水線
collect觸發流水線執行并關閉它
流水線中流的操作稱為中間操作，關閉流的操作稱為終端操作

中間操作

諸如filter或sorted等中間操作會回傳一個流，這讓很多操作鏈接起來形成一個復合的流水線（查詢），重要的是，除非流水線上觸發一個終端操作，否則中間操作不會執行任何處理——它們很懶（延遲計算/惰性求值），
因為中間操作一般都可以合并起來，在終端操作時一次性全部處理，
修改一下上面的代碼，看一下發生了什么：

List<String> resultName = students.stream() //從串列中獲取流
        .filter(student -> {
            System.out.println("filter："+student.getName());
            return student.getAge() < 16;
        }) //中間操作
        .map(student -> {
            System.out.println("map："+student.getName());
            return student.getName();
        }) //中間操作
        .limit(3) //中間操作
        .collect(Collectors.toList());//將Stream轉為List

執行結果如下：

filter：張初一
map：張初一
filter：李初二
map：李初二
filter：孫初三
map：孫初三

可以發現，利用流的延遲性質實作了幾個好的優化，limit操作實作了只選擇前3個，filter和map操作是相互獨立的操作，但他們合并到同一次遍歷中，

終端操作

終端操作會從流的流水線生成結果，其結果可以是任何不是流的值，例如List、Integer，亦或是void等，

流的使用

流的使用一般包括三件事：

一個資料源（如集合）來執行一個查詢
一個中間操作鏈，形成一條流水線
一個終端操作，執行流水線，并生成結果

流的流水線背后的理念類似于構建器模式，在構建器模式中有一個呼叫鏈來設定一套配置（對流來說這就是一個中間操作鏈），接著時呼叫build方法（對流來說就是終端操作），

使用流

Stream API支持許多操作，這些操作能幫助我們快速完成復雜的資料查詢，如篩選、切片、映射、查找、匹配和歸約，

篩選和切片

用謂詞篩選，篩選出各不相同的元素，忽略流中的頭幾個元素，或將流截短至指定長度，

用謂詞篩選 `filter`

流支持filter方法，該方法接受一個謂詞（一個回傳boolean的函式）作為引數，并回傳一個包括所有符合謂詞的元素的流，例如，下面的代碼就是篩選是團員的學生：

List<Student> memberList = students.stream()
        .filter(Student::isMember) //方法參考檢查學生是否是團員
        .collect(Collectors.toList());

去重元素 `distinct`

流支持distinct方法，該方法可以將串列中的元素去重（根據流所生成元素的hashCode和equals方法實作）的流，例如下面的代碼事篩選串列中的偶數，并去重：

List<Integer> numberList = Arrays.asList(1, 2, 3, 4, 5, 6, 2, 4, 6);
numberList.stream()
        .filter(n -> n % 2 == 0)
        .distinct()
        .forEach(System.out::println);

截短流 `limit`

流支持limit(n)方法，該方法回傳一個不超過給定長度的流，如果是有序的流，則最多回傳前n個元素，例如，篩選出小于14歲的前三個學生：

List<Student> studentList = students.stream()
        .filter(student -> student.getAge() < 14)
        .limit(3)
        .collect(Collectors.toList());

跳過元素 `skip`

流支持skip(n)方法，該方法回傳一個跳過了前n個元素的流，如果流中的元素不足n個，則回傳一個空流，例如，跳過年齡小于14歲的頭三個學生，回傳剩下的，

List<Student> studentList = students.stream()
        .filter(student -> student.getAge() < 14)
        .skip(3)
        .collect(Collectors.toList());

映射

有時候當我們在處理資料時，需要從一系列物件中提取某個屬性值，比如從SQL表中選擇一列，Stream API通過map和flatMap方法提供了類似的工具，

對流中的每一個元素應用函式 `map`

流支持map方法，該方法接受一個函式作為引數，這個函式會被應用到每個元素上，并將其映射成一個新的元素，例如，需要提取學生串列中的學生姓名：

List<String> studentList = students.stream()
        .map(Student::getName)//getName會回傳String，此時map回傳的就是Stream<String>
        .collect(Collectors.toList());

如果需要進一步操作，例如獲取姓名的長度，在鏈接上一個map即可：

List<Integer> studentList = students.stream()
        .map(Student::getName)
        .map(String::length)
        .collect(Collectors.toList());

流的扁平化 `flatMap`

先舉個例子，我們需要從["hello", "world"]單詞串列中提取每個字符并去重，結果應該是["h", "e", "l", "o", "w", "r", "d"]，

我們可能會寫出下面這樣的代碼：

List<String> wordList = Arrays.asList("hello","word");
List<String[]> result = wordList.stream()
        .map(word -> word.split(""))
        .distinct()
        .collect(Collectors.toList());

但實際上map回傳的是Stream<String[]>，或者我們又寫出下面這樣的代碼：

List<String> wordList = Arrays.asList("hello","word");
List<Stream<String>> result = wordList.stream()
        .map(word -> word.split(""))
        .map(Arrays::stream)
        .distinct()
        .collect(Collectors.toList());

但實際上map回傳的是Stream<Stream<String>>，而我們真想想要的是Stream<String> ，

這時候flatMap就派上用場了：

List<String> wordList = Arrays.asList("hello","word");
List<String> result = wordList.stream()
        .map(w -> w.split(""))
        .flatMap(Arrays::stream)
        .distinct()
        .collect(Collectors.toList());
System.out.println(result);

map(Arrays::stream)是將每個元素都映射成一個流，而flatMap方法效果將映射的流合并起來，即扁平化一個流，意思就是將流中的每個值都轉換成一個流，然后把所有的流連接起來成為一個流

查找和匹配

還有在處理資料時，我們會判斷一個集合中的某些元素是否符合給定的條件，Stream API通過allMatch、anyMatch、noneMatch、findFirst和findAny方法提供了這樣的工具，

檢查謂詞是否至少匹配一個元素 `anyMatch`

anyMatch方法可以用來判斷“流中是否有一個元素能匹配給定的謂詞”，

if(students.stream().anyMatch(Student::isMember)) {
    System.out.println("學生串列中至少有一個是團員！");
}

anyMatch方法回傳一個boolean，是一個終端操作，

檢查謂詞是否匹配所有元素 `allMatch` `noneMatch`

allMatch方法可以用來判斷“流中是否所有的元素都能匹配給定的謂詞”

if (students.stream().allMatch(student -> student.getAge() < 18)) {
    System.out.println("學生串列中所有學生的年齡都小于18歲！");
}

noneMatch和allMatch是相對的，用來判斷“流中的所有元素都不能匹配給定的謂詞”

if (students.stream().noneMatch(student -> student.getAge() >= 18)) {
    System.out.println("學生串列中沒有學生的年齡大于等于18歲！");
}

anyMatch、allMatch和noneMatch這三個操作都用到了我們所謂的短路，這就是我們熟悉的Java中的&&和||運算子短路在流中的版本，

查找元素 `findAny`

findAny方法回傳當前流中的任意元素，可與其他流操作相結合使用，例如，我們需要找到一個學生串列中的團員：

Optional<Student> studentOptional = students.stream()
        .filter(Student::isMember)
        .findAny();

不過這個Optional是什么？

Optional簡介
Optional<T>類(java.util.Optional)是一個容器類，代表一個值存在或不存在，上面代碼中有可能什么元素都沒有找到，Java 8引入Optional<T>用來避免null帶來的例外，

先簡單了解下它的幾個方法：

isPresent()：若Optional包含值則回傳true，否則回傳false，
ifPresent(Consumer<? super T> consumer)：若Optional包含值時執行給定的代碼，引數是Consumer，一個函式式介面，
T get()：若Optional包含值時回傳該值，否則拋出NoSuchElementException例外，
T orElse(T other)：若Optional包含值時回傳該值，否則回傳指定默認值，

例如，前面的studentOptional若包含一個學生，我們就列印該學生的姓名，否則就什么也不做，

studentOptional.ifPresent(student -> System.out.println(student.getName()));

查找第一個元素 `findFirst`

findFirst方法回傳當前流中的第一個元素，在某些順序流中，我們要找到第一個元素，這時可以使用findFirst，例如，給定一個數字串列，找到其中第一個平方根能被2整除的數：

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6);
Optional<Integer> first = numbers.stream()
        .map(n -> n * n)
        .filter(n -> n % 2 == 0)
        .findFirst();
first.ifPresent(n -> System.out.println(n));// 4

我們會發現findAny和findFirst的作業方式是類似的，那我們什么時候使用findFirst和findAny呢？
findFirst在并行上限制很多，所以如果不關心回傳元素是哪一個（不關心順序），請使用findAny，因為在并行時限制較少，

歸約 `reduce`

reduce操作可以將一個流中的元素組合起來，得到一個值，

元素求和

使用foreach回圈求和：

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6);
int sum = 0;
for (Integer number : numbers) {
    sum += number;
}

這里通過反復加法，把一個串列歸約成一個數字，如果是計算相乘的結果，是不是還要復制粘貼這段代碼？大可不必，reduce操作將這種模式做了抽象，用reduce求和：

Integer sum = numbers.stream().reduce(0, (a, b) -> a + b);

這里reduce()接受兩個引數:

初始值，這里是0
BinaryOperator<T>組合兩個元素產生新值，這里是Lambda(a, b) -> a + b
如果是相乘，則只需傳遞Lambda(a, b) -> a * b即可：

Integer result = numbers.stream().reduce(0, (a, b) -> a * b);

Java 8中，Integer類有了static int sum(int a, int b)方法來求兩個數的和，這剛好是BinaryOperator型別的值，所以代碼可以更精簡，更易讀：

Integer sum = numbers.stream().reduce(0, Integer::sum);

reduce還有一個多載版本，不接受初始值，回傳一個Optional<T>物件，考慮流中沒有任何元素，也沒有初始值，所以reduce無法回傳結果，此時Optional中的值就不存在，

最大值和最小值

類比求和的操作，我們傳遞Lambda(a, b) -> a > b ? a : b即可：

numbers.stream().reduce((a, b) -> a > b ? a : b);

相同的Java 8中的Integer也新增了max和min來求兩個數中的最大和最小值，則可以寫成：

Optional<Integer> max = numbers.stream().reduce(Integer::max);
Optional<Integer> min = numbers.stream().reduce(Integer::min);

數值流

前面用reduce計算流中元素的中和，現在我想計算學生串列中學生的年齡總和，就可以這么寫：

students.stream().map(Student::getAge)
        .reduce(0, Integer::sum);

但是這里暗含了裝箱成本，Integer需要被拆箱成原始型別，在進行求和，所以Stream API提供了原始型別流特化，專門支持處理數流的方法，

原始型別流

Java 8中引入了三個原始型別流：IntStream、DoubleStream和LongStream，分別將流中的元素轉化為int、long和double，從而避免暗含裝箱成本，每個介面都帶來了進行常用數值歸約的新方法，如對數值流求和的sum，找到最大元素的max，還可以把它們再轉回物件流，

映射到數值流 mapToInt mapToDouble mapToLong

students.stream()
        .mapToInt(Student::getAge)
        .sum();

轉回物件流 .boxed()

Stream<Integer> stream = students.stream()
        .mapToInt(Student::getAge)
        .boxed();

默認值 OptionalInt OptionalDouble OptionalLong

OptionalInt optionalInt = students.stream()
        .mapToInt(Student::getAge)
        .max();

數值范圍 `range` `rangeClosed`

Java 8引入了兩個可以用于IntStream和LongStream的靜態方法，幫助我們生成一個數值范圍，range和rangeClosed，兩個方法接收兩個引數第一個是起始值，第二個是結束值，前者不包含結束值，后者包含結束值，

IntStream range = IntStream.range(1, 100);
System.out.println(range.count());//99
IntStream intStream = IntStream.rangeClosed(1, 100);
System.out.println(intStream.count());//100

數值流例子

100以內的勾股數：a*a + b*b = c*c，a、b、c都是整數，

IntStream.rangeClosed(1, 100)
        .boxed()
        .flatMap(a ->
                IntStream.rangeClosed(a, 100)
                        .mapToObj(b -> new double[]{a, b, Math.sqrt(a * a + b * b)})
                        .filter(ints -> ints[2] % 1 == 0))
        .forEach(t -> 
                System.out.println((int) t[0] + "--" + (int) t[1] + "--" + (int) t[2]));

構建流

前面我們已經了解了很多流的的操作，并且知道通過stream方法從集合生成流以及根據數值范圍創建數值流，下面我們我們介紹如何從序列、陣列、檔案和生成函式來創建流，

由序列創建流 `Stream.of`

使用靜態方法Stream.of顯示的創建一個流，該方法接受任意數量的引數，

//創建一個字串流
Stream<String> stringStream = Stream.of("A", "B", "C", "D", "E");
//創建一個空流
Stream.empty();

由陣列創建流 `Arrays.stream`

使用靜態方法Arrays.stream從陣列創建一個流，該方法接受一個陣列引數，

int[] num = {1,2,3,4,5};
IntStream stream = Arrays.stream(num);
System.out.println(stream.sum());//15

由檔案生成流

Java 8更新了NIO API（非阻塞 I/O），其中java.nio.file.Files中新增了許多靜態方法可以回傳一個流，如Files.lines()該方法接受一個檔案路徑物件（Path物件），回傳由指定檔案中每一行組成的字串流，下面的代碼用來計算這個檔案中有多少個不同的字符：

try (Stream<String> lines = Files.lines(Paths.get("C:\\Users\\symon\\Desktop\\test.txt"), Charset.defaultCharset())) {
    long count = lines
            .flatMap(line -> {
                System.out.println(line);
                return Arrays.stream(line.split(""));
            })
            .distinct()
            .count();
    System.out.println(count);
} catch (IOException e) {
    e.printStackTrace();
}

由函式生成流，創建無限流

Stream API提供了兩個靜態方法來生成流：Stream.iterate()和Stream.generate()，這兩個操作可以創建所謂的無限流：沒有固定大小的流，一般來說，會使用limit(n)來進行限制，避免無盡地計算下去，

迭代 `Stream.iterate`

Stream.iterate(0, n -> n + 2)
        .limit(20)
        .forEach(System.out::println);

iterate方法接受一個初始值（這里是0），還有一個依次應用在每個產生的新值上的Lambda（UnaryOperator<T>型別），這里是n -> n + 2，回傳前一個元素加2，所以上面代碼生成了一個正偶數流，如果不加limit限制，則會永遠計算下去，

生成 `Stream.generate`

Stream.generate(Math::random)
        .limit(10)
        .forEach(System.out::println);

generate方法接受一個Supplier<T>型別的Lambda作為引數，不會像iterate一樣對每個新生成的值應用函式，上面代碼是取10個0~1之間的亂數，同樣，如果不加limit限制，該流也會無限長，

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/519257.html

標籤：其他

上一篇：樹結構

下一篇：學習Java AES加解密字串和檔案方法，然后寫個簡單工具類

Java 8 Stream API 引入和使用

引入流

流是什么

流簡介

流與集合

只能遍歷一次

外部迭代與內部迭代

流操作

中間操作

終端操作

流的使用

使用流

篩選和切片

用謂詞篩選 filter

去重元素 distinct

截短流 limit

跳過元素 skip

映射

對流中的每一個元素應用函式 map

流的扁平化 flatMap

查找和匹配

檢查謂詞是否至少匹配一個元素 anyMatch

檢查謂詞是否匹配所有元素 allMatch noneMatch

查找元素 findAny

查找第一個元素 findFirst

歸約 reduce