JavaCV人臉識別三部曲之一:視訊中的人臉儲存為圖片

語言: CN / TW / HK

一起養成寫作習慣!這是我參與「掘金日新計劃 · 4 月更文挑戰」的第4天,點選檢視活動詳情

歡迎訪問我的GitHub

這裡分類和彙總了欣宸的全部原創(含配套原始碼):http://github.com/zq2599/blog_demos

關於人臉識別

  • 本文是《JavaCV人臉識別三部曲》的第一篇,在《JavaCV的攝像頭實戰之八:人臉檢測》一文中,實現了檢測人臉並用方框標註出來,但僅框出人臉作用不大,最好是識別出此人的身份,這樣就能做很多事情了,例如簽到、告警等,這就是接下來咱們要挑戰的人臉識別
  • 人臉識別涉及到兩個步驟:訓練和識別,接下來簡單說明解釋一下
  • 先看什麼是訓練,如下圖,用兩位天王的六張照片來訓練,一共兩個類別,訓練完成後得到模型檔案faceRecognizer.xml在這裡插入圖片描述

  • 訓練成功後, 我們拿一張新的照片給模型去識別,得到的結果是訓練時的類別,如此識別完成,我們已確定了新照片的身份: 在這裡插入圖片描述

  • 下面用流程圖將訓練和識別說得更詳細一些: 在這裡插入圖片描述

關於《JavaCV人臉識別三部曲》

《JavaCV人臉識別三部曲》一共三篇文章,內容如下: 1. 《視訊中的人臉儲存為圖片》:本篇介紹如何通過JavaCV將攝像頭中的每個人臉都檢測出來,並且把每個人臉儲存為圖片,這種方法可以讓我們快速獲取大量人臉照片用於訓練 2. 《訓練》:講述如何用分類好的照片去訓練模型 3. 《識別和預覽》:拿到訓練好的模型,去識別視訊中每一幀的人臉,把結果標註到圖片上預覽 - 整個三部曲也是《JavaCV的攝像頭實戰》系列的一部分,分別是《JavaCV的攝像頭實戰》系列的的第九、第十、第十一篇

本篇概覽

  • 本篇要做的事情就是把訓練用的照片準備好
  • 您可能會疑惑:我自己去找一些照片不就行了嗎?去網上搜、去相簿搜、去拍照不都可以嗎?沒錯,只要找到您想識別的人臉即可,而本篇介紹的是另一種方法:藉助攝像頭檢測人臉,然後將人臉大小的照片儲存在硬碟,用這些照片來訓練,實測多張照片訓練處的模型在檢測新照片時效果更好
  • 具體做法如下:
  • 寫個程式,對攝像頭的照片做人臉檢測,每個檢測到的人臉,都作一張圖片儲存,注意不是攝像頭視訊幀的完整圖片,而是檢測出每張人臉,把這個人臉的矩形作為圖片儲存,而且儲存的是灰度圖片,不是彩色圖片(訓練和檢測只需要灰度圖片)
  • 然後找個沒人的地方執行程式,一個人對著攝像頭,開始......搔首弄姿,各種光線明暗、各種角度、各種表情都用上,作為圖片儲存
  • 用這些圖片訓練出的模型,由於覆蓋了各種亮度、角度、表情,最終的識別效果會更好
  • 接下來我們就來寫這段程式吧

原始碼下載

  • 《JavaCV的攝像頭實戰》的完整原始碼可在GitHub下載到,地址和連結資訊如下表所示(http://github.com/zq2599/blog_demos):

| 名稱 | 連結 | 備註| | :-------- | :----| :----| | 專案主頁| http://github.com/zq2599/blog_demos | 該專案在GitHub上的主頁 | | git倉庫地址(https)| http://github.com/zq2599/blog_demos.git | 該專案原始碼的倉庫地址,https協議 | | git倉庫地址(ssh)| [email protected]:zq2599/blog_demos.git | 該專案原始碼的倉庫地址,ssh協議 |

  • 這個git專案中有多個資料夾,本篇的原始碼在javacv-tutorials資料夾下,如下圖紅框所示: 在這裡插入圖片描述
  • javacv-tutorials裡面有多個子工程,《JavaCV的攝像頭實戰》系列的程式碼在simple-grab-push工程下: 在這裡插入圖片描述

編碼:檢測服務

  • 先定義一個檢測有關的介面DetectService.java,如下,主要是定義了三個方法init、convert、releaseOutputResource,其中init用於初始化檢測服務,convert負責處理單個幀(本篇就是檢測出人臉、把人臉照片儲存在硬碟),releaseOutputResource在結束的時候被執行,用於釋放資源,另外還有個靜態方法buildGrayImage,很簡單,生成灰度圖片對應的Mat物件: ```java public interface DetectService {

    /* * 根據傳入的MAT構造相同尺寸的MAT,存放灰度圖片用於以後的檢測 * @param src 原始圖片的MAT物件 * @return 相同尺寸的灰度圖片的MAT物件 / static Mat buildGrayImage(Mat src) { return new Mat(src.rows(), src.cols(), CV_8UC1); }

    /* * 初始化操作,例如模型下載 * @throws Exception / void init() throws Exception;

    /* * 得到原始幀,做識別,新增框選 * @param frame * @return / Frame convert(Frame frame);

    /* * 釋放資源 / void releaseOutputResource(); } - 然後就是DetectService的實現類DetectAndSaveService.java,完整程式碼如下,有幾處要注意的地方稍後提到:java @Slf4j public class DetectAndSaveService implements DetectService {

    /* * 每一幀原始圖片的物件 / private Mat grabbedImage = null;

    /* * 原始圖片對應的灰度圖片物件 / private Mat grayImage = null;

    /* * 分類器 / private CascadeClassifier classifier;

    /* * 轉換器 / private OpenCVFrameConverter.ToMat converter = new OpenCVFrameConverter.ToMat();

    /* * 模型檔案的下載地址 / private String modelFileUrl;

    /* * 存放人臉圖片的位置 / private String basePath;

    /* * 記錄圖片總數 / private final AtomicInteger num = new AtomicInteger();

    /* * 訓練的圖片尺寸 / Size size = new Size(Constants.RESIZE_WIDTH, Constants.RESIZE_HEIGHT);

    public DetectAndSaveService(String modelFileUrl, String basePath) { this.modelFileUrl = modelFileUrl;

    // 圖片儲存在硬碟的位置,注意檔名的固定字首是當前的年月日時分秒
    this.basePath = basePath
                  + new SimpleDateFormat("yyyyMMddHHmmss").format(new Date())
                  + "-";
    

    }

    /* * 音訊取樣物件的初始化 * @throws Exception / @Override public void init() throws Exception { // 下載模型檔案 URL url = new URL(modelFileUrl);

    File file = Loader.cacheResource(url);
    
    // 模型檔案下載後的完整地址
    String classifierName = file.getAbsolutePath();
    
    // 根據模型檔案例項化分類器
    classifier = new CascadeClassifier(classifierName);
    
    if (classifier == null) {
        log.error("Error loading classifier file [{}]", classifierName);
        System.exit(1);
    }
    

    }

    @Override public Frame convert(Frame frame) { // 由幀轉為Mat grabbedImage = converter.convert(frame);

    // 灰度Mat,用於檢測
    if (null==grayImage) {
        grayImage = DetectService.buildGrayImage(grabbedImage);
    }
    
    String filePath = basePath + num.incrementAndGet();
    
    // 進行人臉識別,根據結果做處理得到預覽視窗顯示的幀
    return detectAndSave(classifier, converter, frame, grabbedImage, grayImage, filePath , size);
    

    }

    /* * 程式結束前,釋放人臉識別的資源 / @Override public void releaseOutputResource() { if (null!=grabbedImage) { grabbedImage.release(); }

    if (null!=grayImage) {
        grayImage.release();
    }
    
    if (null==classifier) {
        classifier.close();
    }
    

    }

    static Frame detectAndSave(CascadeClassifier classifier, OpenCVFrameConverter.ToMat converter, Frame rawFrame, Mat grabbedImage, Mat grayImage, String basePath, Size size) {

    // 當前圖片轉為灰度圖片
    cvtColor(grabbedImage, grayImage, CV_BGR2GRAY);
    
    // 存放檢測結果的容器
    RectVector objects = new RectVector();
    
    // 開始檢測
    classifier.detectMultiScale(grayImage, objects);
    
    // 檢測結果總數
    long total = objects.size();
    
    // 如果沒有檢測到結果就提前返回
    if (total<1) {
        return rawFrame;
    }
    
    // 假設現在是一個人對著攝像頭,因為此時檢測的結果如果大於1,顯然是檢測有問題
    if (total>1) {
        return rawFrame;
    }
    
    Mat faceMat;
    
    // 如果有檢測結果,就根據結果的資料構造矩形框,畫在原圖上
    // 前面的判斷確保了此時只有一個人臉
    Rect r = objects.get(0);
    
    // 從完整的灰度圖中取得一個矩形小圖的Mat物件
    faceMat = new Mat(grayImage, r);
    
    // 訓練時用的圖片尺寸是固定的,因此這裡要調整大小
    resize(faceMat, faceMat, size);
    
    // 圖片的儲存位置
    String imagePath = basePath + "." + Constants.IMG_TYPE;
    
    // 儲存圖片到硬碟
    imwrite(imagePath, faceMat);
    
    // 人臉的位置資訊
    int x = r.x(), y = r.y(), w = r.width(), h = r.height();
    
    // 在人臉上畫矩形
    rectangle(grabbedImage, new Point(x, y), new Point(x + w, y + h), Scalar.RED, 1, CV_AA, 0);
    
    // 釋放檢測結果資源
    objects.close();
    
    // 將標註過的圖片轉為幀,返回
    return converter.convert(grabbedImage);
    

    } } ``` - 上述程式碼有幾處要注意: 1. detectAndSave方法中,當前照片檢測出的人臉數如果大於1就提前返回不做處理了,這是因為假定執行程式的時候,攝像頭前面只有一個人,所以如果檢測出超過一張人臉,就認為當前照片的檢測不準確,就不再處理當前照片了(實際使用中發現常有檢測失誤的情況,例如把一個矩形盒子檢測為人臉),這個提前返回的邏輯,您可以根據自己的環境去調整 2. imwrite方法可以將Mat以圖片的形式儲存到硬碟 3. 儲存檔案到磁碟前呼叫了resize方法,將圖片調整為164*164大小,這是因為後面的訓練和檢測統一使用該尺寸 - 現在核心程式碼已經寫完,需要再寫一些程式碼來使用DetectAndSaveService

編碼:執行框架

  • 《JavaCV的攝像頭實戰之一:基礎》建立的simple-grab-push工程中已經準備好了父類AbstractCameraApplication,所以本篇繼續使用該工程,建立子類實現那些抽象方法即可
  • 編碼前先回顧父類的基礎結構,如下圖,粗體是父類定義的各個方法,紅色塊都是需要子類來實現抽象方法,所以接下來,咱們以本地視窗預覽為目標實現這三個紅色方法即可: 在這裡插入圖片描述
  • 新建檔案PreviewCameraWithDetectAndSave.java,這是AbstractCameraApplication的子類,其程式碼很簡單,接下來按上圖順序依次說明
  • 先定義CanvasFrame型別的成員變數previewCanvas,這是展示視訊幀的本地視窗: java protected CanvasFrame previewCanvas
  • 把前面建立的DetectService作為成員變數,後面檢測的時候會用到: ```java /**
    • 檢測工具介面 */ private DetectService detectService; ```
  • PreviewCameraWithDetectAndSave的構造方法,接受DetectService的例項: ```java /**
    • 不同的檢測工具,可以通過構造方法傳入
    • @param detectService */ public PreviewCameraWithDetectAndSave(DetectService detectService) { this.detectService = detectService; } ```
  • 然後是初始化操作,可見是previewCanvas的例項化和引數設定: ```java @Override protected void initOutput() throws Exception { previewCanvas = new CanvasFrame("攝像頭預覽,檢測人臉並儲存在硬碟", CanvasFrame.getDefaultGamma() / grabber.getGamma()); previewCanvas.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE); previewCanvas.setAlwaysOnTop(true);
    // 檢測服務的初始化操作
    detectService.init();
    

    } - 接下來是output方法,定義了拿到每一幀視訊資料後做什麼事情,這裡呼叫了detectService.convert檢測人臉並儲存圖片,然後在本地視窗顯示:java @Override protected void output(Frame frame) { // 原始幀先交給檢測服務處理,這個處理包括物體檢測,再將檢測結果標註在原始圖片上, // 然後轉換為幀返回 Frame detectedFrame = detectService.convert(frame); // 預覽視窗上顯示的幀是標註了檢測結果的幀 previewCanvas.showImage(detectedFrame); } - 最後是處理視訊的迴圈結束後,程式退出前要做的事情,先關閉本地視窗,再釋放檢測服務的資源:java @Override protected void releaseOutputResource() { if (null!= previewCanvas) { previewCanvas.dispose(); }

    // 檢測工具也要釋放資源
    detectService.releaseOutputResource();
    

    } - 由於檢測有些耗時,所以兩幀之間的間隔時間要低於普通預覽:java @Override protected int getInterval() { return super.getInterval()/8; } - 至此,功能已開發完成,再寫上main方法,在例項化DetectAndSaveService的時候注意入參有兩個,第一個是人臉檢測模型的下載地址,第二個是人臉照片儲存在本地的位置,還有action方法的引數<font color="red">**1000**</font>表示預覽持續時間是1000秒:java public static void main(String[] args) { String modelFileUrl = "http://raw.github.com/opencv/opencv/master/data/haarcascades/haarcascade_frontalface_alt.xml"; new PreviewCameraWithDetectAndSave( new DetectAndSaveService( modelFileUrl, "E:\temp\202112\18\001\man")) .action(1000); } ```

抓取第一個人的照片

  • 執行main方法,然後請群眾演員A登場,看著他一個人對著攝像頭,開始......搔首弄姿,各種光線明暗、各種角度、各種表情都用上吧,哎,不忍直視...
  • 由於開啟了預覽視窗,因此可以看到攝像頭拍攝的效果,出現紅框的矩形最終都會被儲存為圖片,請注意調整角度和表情,群眾演員A好像很熱衷於自拍,玩得不亦樂乎,好吧,讓他放飛自我: 在這裡插入圖片描述

  • 檢測的圖片到了一定數量就可以結束了,我這裡儲存了259張,如下圖: 在這裡插入圖片描述

  • 對以上照片,建議是用肉眼檢查一遍所有照片,把不是人臉的全部刪除,我發現了十多張不是人臉的照片,例如下面這張把臉上的一部分識別成了人臉,顯然是有問題的,這樣的照片就刪除吧,不要用在訓練了: 在這裡插入圖片描述

  • 上述照片全部儲存在E:\temp\202112\18\001\man目錄下

抓取第二個人的照片

  • 修改程式碼,把main方法中存放圖片的目錄改成E:\temp\202112\18\001\woman,然後再次執行程式,請群眾演員B登場,懇求她像前一位群眾演員那樣一個人對著攝像頭,開始......搔首弄姿,各種光線明暗、各種角度、各種表情都用上吧
  • 於是,我們又順利拿到第二位群眾演員的大量人臉圖片,記得要肉眼觀察每一張照片,把不準確的都刪除掉
  • 至此,藉助前面編寫的程式,我們輕鬆拿到了兩位群眾演員的大量人臉照片,其中A的照片儲存在E:\temp\202112\18\001\man,B的照片儲存在E:\temp\202112\18\001\woman在這裡插入圖片描述

  • 至此,本篇的任務已經完成,下一篇會用這些照片進行訓練,為最終的識別做好準備;

歡迎關注掘金:程式設計師欣宸

學習路上,你不孤單,欣宸原創一路相伴...