圖片是怎麼識別的,把圖變成黑白,例如28x28的圖,也就是有764個點,黑白是0255的色素,然後除以255,就會得到一個1到00幾的數,也就是說是一個28x28的1和0組成的2維矩陣,然後讓他變成一維數,就是由0和1組成的764個數,然後開始抓圖,例如隔一秒,就可以比對這兩個數的不同,然後還原點陣,就可以拿到坐標,這樣就可以把變化的方塊抓出來,當然根據方塊坐標抓出來的是原圖的彩色小圖,就會抓很多,然後有關這個人的放一起,無關的放一起,然後用隨機森林算法,就可以計算出一個模型,就可以認出跟你有關的視頻里的人,然後截圖。還有個用途,就是把運動的物體用框框起來,這就是跟蹤。
    你的描述基本已經把圖像識別的核心流程說出來了,只是里面有些地方可以更精確地表述,這樣你就能更系統地理解“從原圖 → 數字特征 → 比對識別 → 跟蹤”的全過程。
    我給你按步驟梳理一下
    ?
    1 圖像數字化與預處理
    ? 輸入一張彩色圖片(rgb,每個像素 3 個通道,0~255)。
    ? 轉灰度將彩色轉成灰度值,公式通常是
    gray  0299r + 0587g + 0114b
    得到一個只有一個通道的矩陣,每個值在 0~255。
    ? 歸一化除以 255,讓數據變成 0~1 範圍,更適合機器學習算法計算。
    ? 尺寸調整比如你說的 28x28,就是把原圖縮放成 784(28x28)個像素點。
    ? 展平把二維矩陣拉成一維向量(784 個數)。
    這一步是為了讓後續算法能直接處理。
    ?
    2 運動檢測(抓變化)
    ? 核心思想對比相鄰兩幀的像素矩陣。
    ? 把當前幀矩陣 t 和上一幀矩陣 {t1} 做差
    d  |t  {t1}|
    ? 如果某個像素差值大于閾值(比如 02),說明這里有變化。
    ? 變化區域提取
    ? 根據變化點的分布,用輪廓檢測或連通區域標記,找到“方塊”位置。
    ? 用方塊坐標裁剪原彩色圖 → 得到目標小圖。
    ?
    3 樣本分類(人臉或人識別)
    ? 你說的隨機森林可以做,但在視覺領域更常用n(卷積神經網絡),因為它能自動提取空間特征。
    ? 樣本準備
    ? 把抓到的小圖分兩類和目標有關  無關。
    ? 提取特征(像素值、hog特征、深度特征等)。
    ? 訓練分類器(隨機森林、sv、n等)。
    ? 預測時,把新的方塊特征輸入模型,輸出類別標簽。
    ?
    4 跟蹤(trackg)
    ? 檢測是找到目標,跟蹤是保持它在視頻里的位置。
    ? 常用方法
    ? 卡爾曼濾波(kalan filter)預測下個位置。
    ? kcf  osse 跟蹤器基于模板匹配的快速跟蹤。
    ? rt  deeprt結合檢測結果和運動軌跡,能同時跟多個目標,並保持 id 一致。
    ? 最終效果視頻里目標被框住,框會跟著它動。
    ?
    5 結合用途
    ? 安防監控運動檢測 + 人臉識別 → 自動標記陌生人。
    ? 體育分析跟蹤球員或球的位置。
    ? 行為分析統計某人出現的時間和位置。
    ? 多目標跟蹤多個對象同時標識和分類。
    ?
    如果我幫你畫一張流程示意圖,你就能直觀地看到這個過程
    原圖 → 灰度化 → 歸一化 → 展平 → 幀差檢測 → 坐標提取 → 分類識別 → 跟蹤框繪制。
    你這個方法的思路跟早期的 opencv + 傳統機器學習目標識別幾乎一模一樣,但如果換成深度學習 + 特征提取,效果會好很多,而且能做到更復雜的場景下的人物識別和跟蹤。
    ?
    喜歡職場小聰明請大家收藏101novel.com職場小聰明101novel.com更新速度全網最快。
