隨便聊聊 Java 8 的函式式編程-有解無憂

函式式編程（Functional Programming）

首先，我們來了解一個叫做"編程范式"的概念，

什么是"編程范式"呢？簡單來說就是指導我們編程的方法論，是一種教我們如何撰寫代碼、如何組織代碼的"解題"思路，

業界普遍將編程范式劃分為兩大類：指令式和程序式，當然每個大類也可以接著往下細分，下面只列出了一些比較常見的子分類：

指令式（Imperative）
- 程序式（Procedural），比如：Fortran、C
- 面向物件（Object Oriented），比如：C++、Java
宣告式（Declarative）
- 邏輯式（Logic），比如：Prolog
- 函式式（Functional），比如：Haskell、Erlang

在上面的分類中，有的同學看到 Java 被劃分到了指令式范式的范疇可能會感覺到疑惑，其實指令式范式與宣告式范式之間并沒有絕對的界限，而且大有相互滲透的趨勢，上述的分類也只是一個廣義的劃分，不用太過較真，稍微有個概念就行了，

指令式范式更關注程序，側重于描述"如何去做"，而宣告式范式關注結果，側重于描述"去做什么"，

來看一個 Java 計算階乘的例子：

// 給出明確的演算法實作（指令式）
public int factorialImperative(int n) {
    int f = 1;
    for (; n > 0; --n) {
        f *= n;
    }
    return f;
}
// 僅僅給出了階乘的遞回定義（宣告式）
public int factorialDeclarative(int n) {
    return n == 0 ? 1 : n * factorialDeclarative(n - 1);
}

什么是函式式編程

關于什么是函式式編程貌似也沒有什么官方的定義，我好像也沒有找到什么權威的解釋，參考 wikipedia 以及自己的一些理解大概描述一下吧：

函式式編程是一種宣告式的編程范式（以目標為導向，側重于描述"去做什么"），通過函式運算以及函陣列合的方式構建程式，并且避免使用共享狀態（變數）以及可變物件，

好吧，總結的好像也比較抽象，沒關系，還是有個概念就好，多寫寫多看看就有感覺了，

說說函式式編程中一些常見的概念吧：

First-class function（一言以蔽之：函式可以賦值給變數）
High-order function（一言以蔽之：函式可以作為另一個函式的入參或者出參）
Pure function（一言以蔽之：給定輸入，輸出總是固定的）
- 補充說明，正是因為輸出總是依賴輸入，所以引申出一些其他的概念
  - Side Effect Free（沒有副作用的，即不會污染背景關系）
  - Reference Transparency（參考透明，即不依賴外部變數）
  - Lazy Evaluation（延遲求值，即呼叫的時機就不那么重要了）
不可變（這個很好理解，當一切都是不可變，也就不需要考慮鎖競爭了，也不用擔心并發問題了，并行也變得簡單起來）
科里化（一種模塊化和重用代碼的技術，說白了其實就是閉包的一種實踐）
延遲串列、模式匹配還有結合器等等大家感興趣的話可以自己去谷歌一下

Java 8 的函式式編程

Java 8 對函式式編程的支持

眾所周知 Java 屬于面向物件編程語言，廣義上屬于指令式范式的語言，但是沒必要較真這個范式的分類，或是追求寫出標準的函式式編程風格的代碼，最重要的還是寫出好的代碼，業務價值OK、擴展性OK、維護性OK（當然好代碼可不止這些標準），

下面我們就來看看 Java 為了支持函式式編程，做了哪些努力，

首先，就是引數傳遞，Java 為了實作把函式當做引數來傳遞，引入了一個函式式介面（Functional Inteface）的概念，

函式式介面

簡單來說函式式介面就是只定義一個方法的介面，比如我們經常會用到的 java.lang.Runnable 和 java.util.concurrent.Callable，

但是這樣的定義未免有點單薄，因為只要人為的在介面里多添加一個方法，那么這個介面就不是函式介面了，又或者說某個介面壓根兒就不是函式式介面，但是這個介面也只定義了一個方法，恰巧也符合函式式介面的語意，比如 java.lang.AutoCloseable，這就會給我們使用帶來很多歧義和誤導，

Java 8 提供了 @FunctionalInterface 注解來解決上面提到的問題，跟泛型和 @Override 類似，@FunctionalInterface 也同樣是編譯器來給代碼做約束的，提供安全性的同時也提高了代碼的可讀性（因為顯示的給你標記了嘛），

當然，這個注解也不是必須的，還是舉 java.lang.AutoCloseable 這個例子，像下面的宣告編譯器也并不會報錯，但是這并沒有什么實際意義，這些都是代碼里面的壞味道，切記不可這樣寫：

public static void main(String[] args) throws Exception {
    AutoCloseable unscientific = () -> {
        System.out.println("不科學的示例...");
    };
    unscientific.close();
}

在上面的示例代碼中，引入了 Java 8 的一個新的語法特性，你應該注意到了，就是 () -> {}：一個引數塊+一個箭頭+一個代碼塊，這就是 Lamdba 運算式，

Lambda 運算式

Java 8 引入 Lambda 運算式的主要作用就是簡化代碼撰寫，它只是一個語法糖而已，底層還是基于函式介面來實作的，如下面的示例那樣：

// 基于函式介面
Runnable task1 = new Runnable() {
    @Override
    public void run() {
        // business code
    }
};
// Lamdba 寫法
Runnable task2 = () -> {
    // business code
};

以前，我們只能通過匿名內部類將代碼作為資料（也可以說是行為）來傳遞，寫過匿名內部類的小伙伴都知道，樣板代碼你肯定是躲不開的，可讀性也沒那么友好，而現在，Lambda 運算式給我們提供了一種更加緊湊的傳遞行為的方式，

可以把 Lambda 運算式理解為函式式介面的一個具體實作的實體，Java 8 也允許我們直接以行內的形式直接撰寫函式式介面的抽象實作，而且，還可以把整個運算式直接當成引數進行傳遞，

最簡單的 Lambda 運算式可以用逗號分隔的引數串列、-> 箭頭符號以及陳述句塊：

Arrays.asList("a", "b", "d")
        .forEach(e -> System.out.println(e));

Lambda運算式可能會有回傳值，編譯器會根據背景關系推斷回傳值的型別，如果lambda的陳述句塊只有一行，可以省略return關鍵字，

// 傳統的方式
Arrays.asList("a", "d", "c").sort(new Comparator<String>() {
            @Override
            public int compare(String e1, String e2) {
                return e1.compareTo(e2);
            }
        });
// Lambda 語法
Arrays.asList("a", "d", "c").sort((e1, e2) -> {
            int result = e1.compareTo(e2); 
            return result;
        });
// Lambda 語法精簡
Arrays.asList("a", "d", "c").sort((e1, e2) -> e1.compareTo(e2));

關于 Lamdba 再說兩點：

對區域變數的限制
我們在使用程序中，常常發現 Lamdba 參考區域變數必須是final的或者說是隱式的final的，這主要是因為實體變數和區域變數背后的實作有一個關鍵不同：實體變數都存盤在堆中，而區域變數則保存在堆疊上，堆是執行緒共享的，而堆疊是執行緒私有的，換句話說，Lambda 運算式參考的是值，而不是變數，
方法參考
Java 8 還提供了方法應用來進一步簡化代碼的撰寫，就像上個示例中代碼，我們還能進一步簡寫為：
```
// 方法參考
Arrays.asList("a", "b", "d").sort(String::compareTo);
```

好了，剛剛介紹了 Java 8 的函式式介面還有 Lambda 運算式，可以進入下一個階段了，就是流（Stream），

流（Stream）

舉個電商計算 ROI（投資回報率）的簡單例子，公式如下：

ROI =［（收入－成本）／ 投入 ］＊100

常規操作可能寫成這樣：

multiply(divide(subtract(收入,成本),投入),100)

但如果我們換一種可讀性更高的寫法：

subtract(收入,成本).divide(投入).multiply(100)

是不是立馬眼前一亮！我們知道 . 運算子是 Java 里面的方法呼叫，為了支持上面的這種級聯操作，Java 8 讓每個方法都回傳一個通用的型別，即：Stream，

流有兩個特點

流水線（簡單來說就是函式的級聯呼叫，可以類比SQL陳述句）
內部迭代（簡單來說就是不需要像集合那樣顯示的處理迭代）

"流水線"這個特點就像剛剛計算ROI公式的那個例子，比較明了，我們來看看內部迭代：

在 Java 8 以前，我們大量的使用集合，對于稍微復雜一些的操作（過濾、分組、排序等組合操作）我們通常需要顯示的撰寫大量的代碼，當然，這也是無法避免的，這又回到文章開頭提到的指令式范式的特點上面了，在沒有宣告式編程語法的支持下，你只能給出具體的演算法實作，這個就不舉例子了，大家應該深有體會，還是舉個簡單的例子吧：

int count=0;
 for (Person person : persons) {
     if (person.isFrom("江蘇"))){
         count++;
     }
 }

現在 Java 8 引入了流，在流上支持了宣告式的編程風格，一切就都變得豁然開朗起來，語意也更加豐滿起來了：

long count = persons.stream()
      .filter(person -> person.isFrom("江蘇"))
      .count()

流的惰性求值

Stream 上的有兩種操作：中間操作和終止操作
- 中間操作仍然回傳 Stream 物件，而終止操作回傳的是具體的結果（或者說歸約，按照給定的規則對流中的元素進行加工，然后輸出到結果中）
- 常見的中間操作：map、filter、limit
- 常見的終止操作：max、collect、forEach
Stream 補充說明
- 流的目的在于表達計算，集合講的是資料，而流講的是計算，粗略地說，集合與流之間的差異就在于什么時候進行計算，流就像是一個延遲創建的集合：只有在消費者要求的時候才會計算值
- 從有序集合生成流時會保留原有的順序，由串列生成的流其元素順序與串列一致
- 流操作可以順序執行，也可以并行執行
- 注意，和迭代器類似，流只能消費一次

常用的流操作

map

如果有一個函式可以將一種型別的值轉換成另外一種型別，map 操作就可以使用該函式，將一個流中的值轉換成一個新的流，

List<String> results = Stream.of("a", "c", "c")
        .map(String::toUpperCase)
        .collect(Collectors.toList());
// output: [A, B, C]

filter

遍歷資料并檢查其中的元素時，可嘗試使用 Stream 中提供的新方法 filter，

List<Integer> results = Stream.of("1", "2", "3")
        .map(Integer::parseInt)
        .filter(n -> n % 2 == 0)
        .collect(Collectors.toList());
// output: [2]

flatMap

flatMap 方法可用 Stream 替換值，然后將多個 Stream 連接成一個 Stream，

List<Integer> results = Stream.of(Arrays.asList(1, 2), Arrays.asList(3, 4))
        .flatMap(List::stream)
        .collect(Collectors.toList());
// output: [1, 2, 3, 4]

reduce

reduce 操作可以實作從一組值中生成一個值，

int result1 = IntStream.of(1, 2, 3, 4)
        .sum();

int result2 = Stream.of(1, 2, 3, 4)
        .reduce(0, (acc, element) -> acc + element);

int result3 = Stream.of(1, 2, 3, 4)
        .reduce(0, Integer::sum);

// output: 10

Collector

最后，我們來看一看 Collector介面，Stream 介面中定義了一個 <R, A> R collect(Collector<? super T, A, R> collector); 的方法，接收一個 Collector 型別的引數，Collector 顧名思義，就是收集器，就是按照一定的規則，對流進行資料的歸約操作，

剛剛 map、filter 的示例中都用到了 Stream.collect(Collectors.toList()); ：將流中的元素輸出到一個 List 中去，

我們先看一下 Collector 的介面定義：

// 建立新的結果容器
Supplier<A> supplier();
// 將元素添加到結果容器
BiConsumer<A, T> accumulator();
// 合并兩個結果容器
BinaryOperator<A> combiner();
// 對結果容器應用最終轉換
Function<A, R> finisher();
// 定義了收集器的行為（尤其是關于流是否可以并行歸約），以及可以使用哪些優化的提示，
Set<Characteristics> characteristics();

如果我們想把流中的元素歸約到一個 List<Integer> 中，那么首先，你得有一個收集結果的容器：

Supplier<List<Integer>> containerSupplier = ArrayList::new;

然后我們需要一個累加函式，將流中的一個個元素放到結果容器中：

BiConsumer<List<Integer>, Integer> accumulator = List::add;

然后，我們需要告訴編譯器這個流是否可以并行歸約，或是可以做哪些優化：

Set<Collector.Characteristics> characteristics = Collections.unmodifiableSet(EnumSet.of(Collector.Characteristics.IDENTITY_FINISH));

然后如果是在并行的場景下，我們需要將并行的各個部分進行合并，這個時候，就需要一個合并的函式：

BinaryOperator<List<Integer>> combiner = (List<Integer> left, List<Integer> right) -> {
    left.addAll(right);
    return left;
};

最后，我們需要一個型別轉換的函式，將流中的元素轉換成歸約的目標型別：

Function<Integer, Integer> finisher = (Integer i) -> (Integer) i;

所以整體思路就是動態新建了一個目標集合，然后遍歷這個流，將流中的元素依次添加到目標集合中，如果不考慮并行的情況，其實Collector就是干了這么一件事，如果你要實作自己的收集器，大體上，也就是跟這5個方法打交道了，

當然，Java 已經給我們提供了不少常用的收集器了，用于實作像 join、groupingBy 等常用操作，可以直接看一下 Collectors 的類注釋，官方很貼心的給我們提供了不少示例代碼，

好了，就寫這么多吧，希望對大家有所幫助，

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/275657.html

標籤：Java

上一篇：Java性能調優實戰,覆寫80%以上調優場景

下一篇：Java讀取圖片exif資訊實作圖片方向自動糾正