從菜鳥程序員到高級架構師，竟然是因為這個字final

語言: CN / TW / HK

時間 2023-03-02 14:02:15 博學谷狂野架構師

主題: java

final實現原理

簡介

final關鍵字，實際的含義就一句話，不可改變。什麼是不可改變？就是初始化完成之後就不能再做任何的修改，修飾成員變量的時候，成員變量變成一個常數；修飾方法的時候，方法不允許被重寫；修飾類的時候，類不允許被繼承；修飾參數列表的時候，入參的對象也是不可以改變。這個就是不可變，無論是引用新的對象，重寫還是繼承，都是改變的方法，而final就是把這個變更的路給堵死

用法

final修飾變量

final成員變量表示常量，只能被賦值一次，賦值後值不再改變（final要求地址值不能改變）
當final修飾一個基本數據類型時，表示該基本數據類型的值一旦在初始化後便不能發生變化；
如果final修飾一個引用類型時，則在對其初始化之後便不能再讓其指向其他對象了，但該引用所指向的對象的內容是可以發生變化的。本質上是一回事，因為引用的值是一個地址，final要求值，即地址的值不發生變化。
final修飾一個成員變量（屬性），必須要顯示初始化。這裏有兩種初始化方式。
- 一種是在變量聲明的時候初始化。
- 第二種方法是在聲明變量的時候不賦初值，但是要在這個變量所在的類的所有的構造函數中對這個變量賦初值。

final修飾方法

使用final方法的原因有兩個。

第一個原因是把方法鎖定，以防任何繼承類修改它的含義，不能被重寫；
第二個原因是效率，final方法比非final方法要快，因為在編譯的時候已經靜態綁定了，不需要在運行時再動態綁定。

注：類的private方法會隱式地被指定為final方法

final修飾類

當用final修飾一個類時，表明這個類不能被繼承。

final類中的成員變量可以根據需要設為final，但是要注意final類中的所有成員方法都會被隱式地指定為final方法。

在使用final修飾類的時候，要注意謹慎選擇，除非這個類真的在以後不會用來繼承或者出於安全的考慮，儘量不要將類設計為final類。

final關鍵字的好處

final關鍵字提高了性能。JVM和Java應用都會緩存final變量。
final變量可以安全的在多線程環境下進行共享，而不需要額外的同步開銷。
使用final關鍵字，JVM會對方法、變量及類進行優化。

注意事項

final關鍵字可以用於成員變量、本地變量、方法以及類。
final成員變量必須在聲明的時候初始化或者在構造器中初始化，否則就會報編譯錯誤。
你不能夠對final變量再次賦值。
本地變量必須在聲明時賦值。
在匿名類中所有變量都必須是final變量。
final方法不能被重寫。
final類不能被繼承。
final關鍵字不同於finally關鍵字，後者用於異常處理。
final關鍵字容易與finalize()方法搞混，後者是在Object類中定義的方法，是在垃圾回收之前被JVM調用的方法。
接口中聲明的所有變量本身是final的。
final和abstract這兩個關鍵字是反相關的，final類就不可能是abstract的。
final方法在編譯階段綁定，稱為靜態綁定(static binding)。
沒有在聲明時初始化final變量的稱為空白final變量(blank final variable)，它們必須在構造器中初始化，或者調用this()初始化。不這麼做的話，編譯器會報錯“final變量(變量名)需要進行初始化”。
將類、方法、變量聲明為final能夠提高性能，這樣JVM就有機會進行估計，然後優化。
按照Java代碼慣例，final變量就是常量，而且通常常量名要大寫。
對於集合對象聲明為final指的是引用不能被更改，但是你可以向其中增加，刪除或者改變內容。

原理

內存語義

寫內存語義可以確保在對象的引用為任意線程可見之前，final 域已經被初始化過了。

讀內存語義可以確保如果對象的引用不為 null，則説明 final 域已經被初始化過了。

總之，final 域的內存語義提供了初始化安全保證。

寫內存語義：在構造函數內對一個 final 域的寫入，與隨後將對象引用賦值給引用變量，這兩個操作不能重排序。
讀內存語義：初次讀一個包含 final 域的對象的引用，與隨後初次讀這個 final 域，這兩個操作不能重排序。

寫 final 域的重排序規則

寫 final 域的重排序規則禁止把 final 域的寫重排序到構造函數之外。這個規則的實現包含下面 2 個方面：

JMM 禁止編譯器把 final 域的寫重排序到構造函數之外。
編譯器會在 final 域的寫之後，構造函數 return 之前，插入一個 StoreStore 屏障。這個屏障禁止處理器把 final 域的寫重排序到構造函數之外。

現在讓我們分析 writer () 方法。writer () 方法只包含一行代碼：finalExample = new FinalExample ()。這行代碼包含兩個步驟：

構造一個 FinalExample 類型的對象；
把這個對象的引用賦值給引用變量 obj。

假設線程 B 讀對象引用與讀對象的成員域之間沒有重排序（馬上會説明為什麼需要這個假設），下圖是一種可能的執行時序：

在上圖中，寫普通域的操作被編譯器重排序到了構造函數之外，讀線程 B 錯誤的讀取了普通變量 i 初始化之前的值。而寫 final 域的操作，被寫 final 域的重排序規則“限定”在了構造函數之內，讀線程 B 正確的讀取了 final 變量初始化之後的值。

寫 final 域的重排序規則可以確保：在對象引用為任意線程可見之前，對象的 final 域已經被正確初始化過了，而普通域不具有這個保障。以上圖為例，在讀線程 B“看到”對象引用 obj 時，很可能 obj 對象還沒有構造完成（對普通域 i 的寫操作被重排序到構造函數外，此時初始值 2 還沒有寫入普通域 i）。

讀 final 域的重排序規則

讀 final 域的重排序規則如下：

在一個線程中，初次讀對象引用與初次讀該對象包含的 final 域，JMM 禁止處理器重排序這兩個操作（注意，這個規則僅僅針對處理器）。編譯器會在讀 final 域操作的前面插入一個 LoadLoad 屏障。

初次讀對象引用與初次讀該對象包含的 final 域，這兩個操作之間存在間接依賴關係。由於編譯器遵守間接依賴關係，因此編譯器不會重排序這兩個操作。大多數處理器也會遵守間接依賴，大多數處理器也不會重排序這兩個操作。但有少數處理器允許對存在間接依賴關係的操作做重排序（比如 alpha 處理器），這個規則就是專門用來針對這種處理器。

reader() 方法包含三個操作：

初次讀引用變量 obj;
初次讀引用變量 obj 指向對象的普通域 j。
初次讀引用變量 obj 指向對象的 final 域 i

現在我們假設寫線程 A 沒有發生任何重排序，同時程序在不遵守間接依賴的處理器上執行，下面是一種可能的執行時序

在上圖中，讀對象的普通域的操作被處理器重排序到讀對象引用之前。讀普通域時，該域還沒有被寫線程 A 寫入，這是一個錯誤的讀取操作。而讀 final 域的重排序規則會把讀對象 final 域的操作“限定”在讀對象引用之後，此時該 final 域已經被 A 線程初始化過了，這是一個正確的讀取操作。

讀 final 域的重排序規則可以確保：在讀一個對象的 final 域之前，一定會先讀包含這個 final 域的對象的引用。在這個示例程序中，如果該引用不為 null，那麼引用對象的 final 域一定已經被 A 線程初始化過了。

如果 final 域是引用類型

上面我們看到的 final 域是基礎數據類型，下面讓我們看看如果 final 域是引用類型，將會有什麼效果？

請看下列示例代碼：

COPYpublic class FinalReferenceExample {
    final int[] intArray;                     //final 是引用類型 
    static FinalReferenceExample obj;

    public FinalReferenceExample () {        // 構造函數 
        intArray = new int[1];              //1
        intArray[0] = 1;                   //2
    }

    public static void writerOne () {          // 寫線程 A 執行 
        obj = new FinalReferenceExample ();  //3
    }

    public static void writerTwo () {          // 寫線程 B 執行 
        obj.intArray[0] = 2;                 //4
    }

    public static void reader () {              // 讀線程 C 執行 
        if (obj != null) {                    //5
            int temp1 = obj.intArray[0];       //6
        }
    }
}

這裏 final 域為一個引用類型，它引用一個 int 型的數組對象。對於引用類型，寫 final 域的重排序規則對編譯器和處理器增加了如下約束：

在構造函數內對一個 final 引用的對象的成員域的寫入，與隨後在構造函數外把這個被構造對象的引用賦值給一個引用變量，這兩個操作之間不能重排序。

對上面的示例程序，我們假設首先線程 A 執行 writerOne() 方法，執行完後線程 B 執行 writerTwo() 方法，執行完後線程 C 執行 reader () 方法。下面是一種可能的線程執行時序：

在上圖中，1 是對 final 域的寫入，2 是對這個 final 域引用的對象的成員域的寫入，3 是把被構造的對象的引用賦值給某個引用變量。這裏除了前面提到的 1 不能和 3 重排序外，2 和 3 也不能重排序。

JMM 可以確保讀線程 C 至少能看到寫線程 A 在構造函數中對 final 引用對象的成員域的寫入。即 C 至少能看到數組下標 0 的值為 1。而寫線程 B 對數組元素的寫入，讀線程 C 可能看的到，也可能看不到。JMM 不保證線程 B 的寫入對讀線程 C 可見，因為寫線程 B 和讀線程 C 之間存在數據競爭，此時的執行結果不可預知。

如果想要確保讀線程 C 看到寫線程 B 對數組元素的寫入，寫線程 B 和讀線程 C 之間需要使用同步原語（lock 或 volatile）來確保內存可見性。

為什麼 final 引用不能從構造函數內“逸出”

前面我們提到過，寫 final 域的重排序規則可以確保：在引用變量為任意線程可見之前，該引用變量指向的對象的 final 域已經在構造函數中被正確初始化過了。其實要得到這個效果，還需要一個保證：在構造函數內部，不能讓這個被構造對象的引用為其他線程可見，也就是對象引用不能在構造函數中“逸出”。為了説明問題，讓我們來看下面示例代碼：

COPYpublic class FinalReferenceEscapeExample {
    final int i;
    static FinalReferenceEscapeExample obj;

    public FinalReferenceEscapeExample () {
        i = 1;                              //1 寫 final 域 
        obj = this;                          //2 this 引用在此“逸出”
    }

    public static void writer() {
        new FinalReferenceEscapeExample ();
    }    

    public static void reader {
        if (obj != null) {                     //3
            int temp = obj.i;                 //4
        }
    }
}

假設一個線程 A 執行 writer() 方法，另一個線程 B 執行 reader() 方法。這裏的操作 2 使得對象還未完成構造前就為線程 B 可見。即使這裏的操作 2 是構造函數的最後一步，且即使在程序中操作 2 排在操作 1 後面，執行 read() 方法的線程仍然可能無法看到 final 域被初始化後的值，因為這裏的操作 1 和操作 2 之間可能被重排序。實際的執行時序可能如下圖所示：

從上圖我們可以看出：在構造函數返回前，被構造對象的引用不能為其他線程可見，因為此時的 final 域可能還沒有被初始化。在構造函數返回後，任意線程都將保證能看到 final 域正確初始化之後的值。

final 語義在處理器中的實現

現在我們以 x86 處理器為例，説明 final 語義在處理器中的具體實現。

上面我們提到，寫 final 域的重排序規則會要求譯編器在 final 域的寫之後，構造函數 return 之前，插入一個 StoreStore 障屏。讀 final 域的重排序規則要求編譯器在讀 final 域的操作前面插入一個 LoadLoad 屏障。

由於 x86 處理器不會對寫 - 寫操作做重排序，所以在 x86 處理器中，寫 final 域需要的 StoreStore 障屏會被省略掉。同樣，由於 x86 處理器不會對存在間接依賴關係的操作做重排序，所以在 x86 處理器中，讀 final 域需要的 LoadLoad 屏障也會被省略掉。也就是説在 x86 處理器中，final 域的讀 / 寫不會插入任何內存屏障！

為什麼要增強 final 的語義

在舊的 Java 內存模型中，最嚴重的一個缺陷就是線程可能看到 final 域的值會改變。比如，一個線程當前看到一個整形 final 域的值為 0（還未初始化之前的默認值），過一段時間之後這個線程再去讀這個 final 域的值時，卻發現值變為了 1（被某個線程初始化之後的值）。最常見的例子就是在舊的 Java 內存模型中，String 的值可能會改變。

為了修補這個漏洞，JSR-133 專家組增強了 final 的語義。通過為 final 域增加寫和讀重排序規則，可以為 java 程序員提供初始化安全保證：只要對象是正確構造的（被構造對象的引用在構造函數中沒有“逸出”），那麼不需要使用同步（指 lock 和 volatile 的使用），就可以保證任意線程都能看到這個 final 域在構造函數中被初始化之後的值。

final、finally、 finalize區別

final可以用來修飾類、方法、變量，分別有不同的意義，final修飾的class代表不可以繼承擴展，final的變量是不可以修改的，而final的方法也是不可以重寫的（override）。
finally則是Java保證重點代碼一定要被執行的一種機制。我們可以使用try-finally或者try-catch-finally來進行類似關閉JDBC連接、保證unlock鎖等動作。
finalize是基礎類java.lang.Object的一個方法，它的設計目的是保證對象在被垃圾收集前完成特定資源的回收。finalize機制現在已經不推薦使用，並且在JDK 9開始被標記為deprecated。

本文由傳智教育博學谷狂野架構師教研團隊發佈。

如果本文對您有幫助，歡迎關注和點贊；如果您有任何建議也可留言評論或私信，您的支持是我堅持創作的動力。

轉載請註明出處！

「其他文章」