JavaCV人臉識別三部曲之一：視訊中的人臉儲存為圖片_程式設計師欣宸

一起養成寫作習慣！這是我參與「掘金日新計劃 · 4 月更文挑戰」的第4天，點選檢視活動詳情

歡迎訪問我的GitHub

這裡分類和彙總了欣宸的全部原創(含配套原始碼)：http://github.com/zq2599/blog_demos

關於人臉識別

本文是《JavaCV人臉識別三部曲》的第一篇，在《JavaCV的攝像頭實戰之八：人臉檢測》一文中，實現了檢測人臉並用方框標註出來，但僅框出人臉作用不大，最好是識別出此人的身份，這樣就能做很多事情了，例如簽到、告警等，這就是接下來咱們要挑戰的人臉識別
人臉識別涉及到兩個步驟：訓練和識別，接下來簡單說明解釋一下
先看什麼是訓練，如下圖，用兩位天王的六張照片來訓練，一共兩個類別，訓練完成後得到模型檔案faceRecognizer.xml：
訓練成功後，我們拿一張新的照片給模型去識別，得到的結果是訓練時的類別，如此識別完成，我們已確定了新照片的身份：
下面用流程圖將訓練和識別說得更詳細一些：

關於《JavaCV人臉識別三部曲》

《JavaCV人臉識別三部曲》一共三篇文章，內容如下： 1. 《視訊中的人臉儲存為圖片》：本篇介紹如何通過JavaCV將攝像頭中的每個人臉都檢測出來，並且把每個人臉儲存為圖片，這種方法可以讓我們快速獲取大量人臉照片用於訓練 2. 《訓練》：講述如何用分類好的照片去訓練模型 3. 《識別和預覽》：拿到訓練好的模型，去識別視訊中每一幀的人臉，把結果標註到圖片上預覽 - 整個三部曲也是《JavaCV的攝像頭實戰》系列的一部分，分別是《JavaCV的攝像頭實戰》系列的的第九、第十、第十一篇

本篇概覽

本篇要做的事情就是把訓練用的照片準備好
您可能會疑惑：我自己去找一些照片不就行了嗎？去網上搜、去相簿搜、去拍照不都可以嗎？沒錯，只要找到您想識別的人臉即可，而本篇介紹的是另一種方法：藉助攝像頭檢測人臉，然後將人臉大小的照片儲存在硬碟，用這些照片來訓練，實測多張照片訓練處的模型在檢測新照片時效果更好
具體做法如下：
寫個程式，對攝像頭的照片做人臉檢測，每個檢測到的人臉，都作一張圖片儲存，注意不是攝像頭視訊幀的完整圖片，而是檢測出每張人臉，把這個人臉的矩形作為圖片儲存，而且儲存的是灰度圖片，不是彩色圖片（訓練和檢測只需要灰度圖片）
然後找個沒人的地方執行程式，一個人對著攝像頭，開始......搔首弄姿，各種光線明暗、各種角度、各種表情都用上，作為圖片儲存
用這些圖片訓練出的模型，由於覆蓋了各種亮度、角度、表情，最終的識別效果會更好
接下來我們就來寫這段程式吧

原始碼下載

《JavaCV的攝像頭實戰》的完整原始碼可在GitHub下載到，地址和連結資訊如下表所示(http://github.com/zq2599/blog_demos)：

| 名稱 | 連結 | 備註| | :-------- | :----| :----| | 專案主頁| http://github.com/zq2599/blog_demos | 該專案在GitHub上的主頁 | | git倉庫地址(https)| http://github.com/zq2599/blog_demos.git | 該專案原始碼的倉庫地址，https協議 | | git倉庫地址(ssh)| [email protected]:zq2599/blog_demos.git | 該專案原始碼的倉庫地址，ssh協議 |

這個git專案中有多個資料夾，本篇的原始碼在javacv-tutorials資料夾下，如下圖紅框所示：
javacv-tutorials裡面有多個子工程，《JavaCV的攝像頭實戰》系列的程式碼在simple-grab-push工程下：

編碼：檢測服務

先定義一個檢測有關的介面DetectService.java，如下，主要是定義了三個方法init、convert、releaseOutputResource，其中init用於初始化檢測服務，convert負責處理單個幀（本篇就是檢測出人臉、把人臉照片儲存在硬碟），releaseOutputResource在結束的時候被執行，用於釋放資源，另外還有個靜態方法buildGrayImage，很簡單，生成灰度圖片對應的Mat物件： ```java public interface DetectService {

/* * 根據傳入的MAT構造相同尺寸的MAT，存放灰度圖片用於以後的檢測 * @param src 原始圖片的MAT物件 * @return 相同尺寸的灰度圖片的MAT物件 / static Mat buildGrayImage(Mat src) { return new Mat(src.rows(), src.cols(), CV_8UC1); }

/* * 初始化操作，例如模型下載 * @throws Exception / void init() throws Exception;

/* * 得到原始幀，做識別，新增框選 * @param frame * @return / Frame convert(Frame frame);

/* * 釋放資源 / void releaseOutputResource(); } - 然後就是DetectService的實現類DetectAndSaveService.java，完整程式碼如下，有幾處要注意的地方稍後提到：java @Slf4j public class DetectAndSaveService implements DetectService {

/* * 每一幀原始圖片的物件 / private Mat grabbedImage = null;

/* * 原始圖片對應的灰度圖片物件 / private Mat grayImage = null;

/* * 分類器 / private CascadeClassifier classifier;

/* * 轉換器 / private OpenCVFrameConverter.ToMat converter = new OpenCVFrameConverter.ToMat();

/* * 模型檔案的下載地址 / private String modelFileUrl;

/* * 存放人臉圖片的位置 / private String basePath;

/* * 記錄圖片總數 / private final AtomicInteger num = new AtomicInteger();

/* * 訓練的圖片尺寸 / Size size = new Size(Constants.RESIZE_WIDTH, Constants.RESIZE_HEIGHT);

public DetectAndSaveService(String modelFileUrl, String basePath) { this.modelFileUrl = modelFileUrl;
```
// 圖片儲存在硬碟的位置，注意檔名的固定字首是當前的年月日時分秒
this.basePath = basePath
              + new SimpleDateFormat("yyyyMMddHHmmss").format(new Date())
              + "-";
```
}

/* * 音訊取樣物件的初始化 * @throws Exception / @Override public void init() throws Exception { // 下載模型檔案 URL url = new URL(modelFileUrl);
```
File file = Loader.cacheResource(url);

// 模型檔案下載後的完整地址
String classifierName = file.getAbsolutePath();

// 根據模型檔案例項化分類器
classifier = new CascadeClassifier(classifierName);

if (classifier == null) {
    log.error("Error loading classifier file [{}]", classifierName);
    System.exit(1);
}
```
}

@Override public Frame convert(Frame frame) { // 由幀轉為Mat grabbedImage = converter.convert(frame);
```
// 灰度Mat，用於檢測
if (null==grayImage) {
    grayImage = DetectService.buildGrayImage(grabbedImage);
}

String filePath = basePath + num.incrementAndGet();

// 進行人臉識別，根據結果做處理得到預覽視窗顯示的幀
return detectAndSave(classifier, converter, frame, grabbedImage, grayImage, filePath , size);
```
}

/* * 程式結束前，釋放人臉識別的資源 / @Override public void releaseOutputResource() { if (null!=grabbedImage) { grabbedImage.release(); }
```
if (null!=grayImage) {
    grayImage.release();
}

if (null==classifier) {
    classifier.close();
}
```
}

static Frame detectAndSave(CascadeClassifier classifier, OpenCVFrameConverter.ToMat converter, Frame rawFrame, Mat grabbedImage, Mat grayImage, String basePath, Size size) {
```
// 當前圖片轉為灰度圖片
cvtColor(grabbedImage, grayImage, CV_BGR2GRAY);

// 存放檢測結果的容器
RectVector objects = new RectVector();

// 開始檢測
classifier.detectMultiScale(grayImage, objects);

// 檢測結果總數
long total = objects.size();

// 如果沒有檢測到結果就提前返回
if (total<1) {
    return rawFrame;
}

// 假設現在是一個人對著攝像頭，因為此時檢測的結果如果大於1，顯然是檢測有問題
if (total>1) {
    return rawFrame;
}

Mat faceMat;

// 如果有檢測結果，就根據結果的資料構造矩形框，畫在原圖上
// 前面的判斷確保了此時只有一個人臉
Rect r = objects.get(0);

// 從完整的灰度圖中取得一個矩形小圖的Mat物件
faceMat = new Mat(grayImage, r);

// 訓練時用的圖片尺寸是固定的，因此這裡要調整大小
resize(faceMat, faceMat, size);

// 圖片的儲存位置
String imagePath = basePath + "." + Constants.IMG_TYPE;

// 儲存圖片到硬碟
imwrite(imagePath, faceMat);

// 人臉的位置資訊
int x = r.x(), y = r.y(), w = r.width(), h = r.height();

// 在人臉上畫矩形
rectangle(grabbedImage, new Point(x, y), new Point(x + w, y + h), Scalar.RED, 1, CV_AA, 0);

// 釋放檢測結果資源
objects.close();

// 將標註過的圖片轉為幀，返回
return converter.convert(grabbedImage);
```
} } ``` - 上述程式碼有幾處要注意： 1. detectAndSave方法中，當前照片檢測出的人臉數如果大於1就提前返回不做處理了，這是因為假定執行程式的時候，攝像頭前面只有一個人，所以如果檢測出超過一張人臉，就認為當前照片的檢測不準確，就不再處理當前照片了（實際使用中發現常有檢測失誤的情況，例如把一個矩形盒子檢測為人臉），這個提前返回的邏輯，您可以根據自己的環境去調整 2. imwrite方法可以將Mat以圖片的形式儲存到硬碟 3. 儲存檔案到磁碟前呼叫了resize方法，將圖片調整為164*164大小，這是因為後面的訓練和檢測統一使用該尺寸 - 現在核心程式碼已經寫完，需要再寫一些程式碼來使用DetectAndSaveService

編碼：執行框架

《JavaCV的攝像頭實戰之一：基礎》建立的simple-grab-push工程中已經準備好了父類AbstractCameraApplication，所以本篇繼續使用該工程，建立子類實現那些抽象方法即可
編碼前先回顧父類的基礎結構，如下圖，粗體是父類定義的各個方法，紅色塊都是需要子類來實現抽象方法，所以接下來，咱們以本地視窗預覽為目標實現這三個紅色方法即可：
新建檔案PreviewCameraWithDetectAndSave.java，這是AbstractCameraApplication的子類，其程式碼很簡單，接下來按上圖順序依次說明
先定義CanvasFrame型別的成員變數previewCanvas，這是展示視訊幀的本地視窗： java protected CanvasFrame previewCanvas
把前面建立的DetectService作為成員變數，後面檢測的時候會用到： ```java /**
- 檢測工具介面 */ private DetectService detectService; ```
PreviewCameraWithDetectAndSave的構造方法，接受DetectService的例項： ```java /**
- 不同的檢測工具，可以通過構造方法傳入
- @param detectService */ public PreviewCameraWithDetectAndSave(DetectService detectService) { this.detectService = detectService; } ```
然後是初始化操作，可見是previewCanvas的例項化和引數設定： ```java @Override protected void initOutput() throws Exception { previewCanvas = new CanvasFrame("攝像頭預覽，檢測人臉並儲存在硬碟", CanvasFrame.getDefaultGamma() / grabber.getGamma()); previewCanvas.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE); previewCanvas.setAlwaysOnTop(true);
```
// 檢測服務的初始化操作
detectService.init();
```
} - 接下來是output方法，定義了拿到每一幀視訊資料後做什麼事情，這裡呼叫了detectService.convert檢測人臉並儲存圖片，然後在本地視窗顯示：java @Override protected void output(Frame frame) { // 原始幀先交給檢測服務處理，這個處理包括物體檢測，再將檢測結果標註在原始圖片上， // 然後轉換為幀返回 Frame detectedFrame = detectService.convert(frame); // 預覽視窗上顯示的幀是標註了檢測結果的幀 previewCanvas.showImage(detectedFrame); } - 最後是處理視訊的迴圈結束後，程式退出前要做的事情，先關閉本地視窗，再釋放檢測服務的資源：java @Override protected void releaseOutputResource() { if (null!= previewCanvas) { previewCanvas.dispose(); }
```
// 檢測工具也要釋放資源
detectService.releaseOutputResource();
```
} - 由於檢測有些耗時，所以兩幀之間的間隔時間要低於普通預覽：java @Override protected int getInterval() { return super.getInterval()/8; } - 至此，功能已開發完成，再寫上main方法，在例項化DetectAndSaveService的時候注意入參有兩個，第一個是人臉檢測模型的下載地址，第二個是人臉照片儲存在本地的位置，還有action方法的引數<font color="red">**1000**</font>表示預覽持續時間是1000秒：java public static void main(String[] args) { String modelFileUrl = "http://raw.github.com/opencv/opencv/master/data/haarcascades/haarcascade_frontalface_alt.xml"; new PreviewCameraWithDetectAndSave( new DetectAndSaveService( modelFileUrl, "E:\temp\202112\18\001\man")) .action(1000); } ```

抓取第一個人的照片

執行main方法，然後請群眾演員A登場，看著他一個人對著攝像頭，開始......搔首弄姿，各種光線明暗、各種角度、各種表情都用上吧，哎，不忍直視...
由於開啟了預覽視窗，因此可以看到攝像頭拍攝的效果，出現紅框的矩形最終都會被儲存為圖片，請注意調整角度和表情，群眾演員A好像很熱衷於自拍，玩得不亦樂乎，好吧，讓他放飛自我：
檢測的圖片到了一定數量就可以結束了，我這裡儲存了259張，如下圖：
對以上照片，建議是用肉眼檢查一遍所有照片，把不是人臉的全部刪除，我發現了十多張不是人臉的照片，例如下面這張把臉上的一部分識別成了人臉，顯然是有問題的，這樣的照片就刪除吧，不要用在訓練了：
上述照片全部儲存在E:\temp\202112\18\001\man目錄下

抓取第二個人的照片

修改程式碼，把main方法中存放圖片的目錄改成E:\temp\202112\18\001\woman，然後再次執行程式，請群眾演員B登場，懇求她像前一位群眾演員那樣一個人對著攝像頭，開始......搔首弄姿，各種光線明暗、各種角度、各種表情都用上吧
於是，我們又順利拿到第二位群眾演員的大量人臉圖片，記得要肉眼觀察每一張照片，把不準確的都刪除掉
至此，藉助前面編寫的程式，我們輕鬆拿到了兩位群眾演員的大量人臉照片，其中A的照片儲存在E:\temp\202112\18\001\man，B的照片儲存在E:\temp\202112\18\001\woman：
至此，本篇的任務已經完成，下一篇會用這些照片進行訓練，為最終的識別做好準備；

歡迎關注掘金：程式設計師欣宸

學習路上，你不孤單，欣宸原創一路相伴...