MediaPipe Image Segmenter 工作可根據預先定義的選項將圖片分成多個區域 以便套用背景模糊處理等視覺效果這些 相關說明會教您如何使用節點和網頁應用程式專用的 Image Segmenter。適用對象 進一步瞭解 請參閱總覽。
程式碼範例
Image Segmenter 範例程式碼提供 方便您參考。這個程式碼可協助您測試這項工作 現在就開始打造自己的影像分割應用程式您可以查看、執行 和編輯影像分割器 程式碼範例 只要使用網路瀏覽器即可。您也可以前往 GitHub。
設定
本節說明設定開發環境的重要步驟,以及 以及專門使用 Image Segmenter 的程式碼專案如需 設定開發環境以使用 MediaPipe 工作,包括: 平台版本需求,請參閱 網頁版設定指南。
JavaScript 套件
可透過 MediaPipe @mediapipe/tasks-vision
取得圖片區隔程式碼
NPM 套件。你可以
透過平台提供的連結找到並下載這些程式庫
設定指南。
您可以使用下列程式碼安裝必要套件進行本機測試 使用以下指令:
npm install --save @mediapipe/tasks-vision
如果想要透過內容傳遞網路 (CDN) 匯入工作程式碼 請在 HTML 檔案的 標記中加入下列程式碼:
<head>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-vision/vision_bundle.js"
crossorigin="anonymous"></script>
</head>
型號
MediaPipe Image Segmenter 工作需要經過訓練且與此模型相容的模型。 工作。如要進一步瞭解圖片區隔工具可用的已訓練模型,請參閱: 工作總覽的「模型」一節。
選取並下載模型,然後將模型儲存在專案目錄中:
<dev-project-root>/app/shared/models/
建立工作
使用圖片分割工具 createFrom...()
函式進行以下操作:
準備執行推論的工作。使用「createFromModelPath()
」
內含已訓練模型檔案的相對或絕對路徑。
如果模型已載入記憶體,您可以使用
createFromModelBuffer()
方法。
以下程式碼範例示範如何使用 createFromOptions()
函式
設定工作。createFromOptions
函式可讓您自訂
含設定選項的圖片分割工具。進一步瞭解工作
請參閱設定選項。
以下程式碼示範如何使用自訂選項建構及設定工作 選項:
runningMode = "IMAGE";
async function createImageSegmenter() {
const vision = await FilesetResolver.forVisionTasks(
"https://cdn.jsdelivr.net/npm/@mediapipe/tasks-vision@latest/wasm"
);
imageSegmenter = await ImageSegmenter.createFromOptions(vision, {
baseOptions: {
modelAssetPath:
"https://storage.googleapis.com/mediapipe-assets/deeplabv3.tflite?generation=1661875711618421",
},
outputCategoryMask: true,
outputConfidenceMasks: false
runningMode: runningMode
});
}
createImageSegmenter();
如需更完整的導入「圖片區隔工具」工作,請參閱 程式碼範例。
設定選項
這項工作具有下列網頁應用程式設定選項:
選項名稱 | 說明 | 值範圍 | 預設值 |
---|---|---|---|
outputCategoryMask |
如果設為 True ,則輸出結果會包含區隔遮罩
視為 uint8 圖片,其中每個像素值都代表勝出的類別
值。 |
{True, False } |
False |
outputConfidenceMasks |
如果設為 True ,則輸出結果會包含區隔遮罩
視為浮點值圖片,其中各浮點值代表信心值
分數圖。 |
{True, False } |
True |
displayNamesLocale |
設定標籤語言,供
工作模型的中繼資料 (如有)。以下項目的預設值為 en :
英語。您可以在自訂模型的中繼資料中加入經本地化的標籤
使用 TensorFlow Lite Metadata Writer API |
語言代碼 | en |
resultListener |
設定結果監聽器以接收區隔結果
圖片片段工具處於 LIVE_STREAM 模式時,以非同步方式顯示。
只有在執行模式設為「LIVE_STREAM 」時才能使用 |
不適用 | 不適用 |
準備資料
圖片區隔工具可以用 主機瀏覽器。這項工作也會處理資料輸入預先處理作業,包括 調整大小、旋轉以及值正規化
系統會執行對圖片區隔工具 segment()
和 segmentForVideo()
方法的呼叫
以及封鎖使用者介面執行緒如果要區隔
影片影格,每個分割工作都會封鎖
。您可以藉由實作網路工作站
其他執行緒上的segment()
和 segmentForVideo()
。
執行工作
圖片區隔工具使用 segment()
方法搭配圖片模式,以及
使用 video
模式觸發推論的 segmentForVideo()
方法。
Image Segmenter 會將偵測到的片段做為圖片資料傳回回呼
您為工作執行推論時所設定的函式。
以下程式碼示範如何使用工作模型執行處理程序:
圖片
const image = document.getElementById("image") as HTMLImageElement; imageSegmenter.segment(image, callback);
Video
async function renderLoop(): void { const video = document.getElementById("video"); let startTimeMs = performance.now(); imageSegmenter.segmentForVideo(video, startTimeMs, callbackForVideo); requestAnimationFrame(() => { renderLoop(); }); }
如需更完整的導入圖像區隔工具工作,請參閱 程式碼範例。
處理及顯示結果
在執行推論時,Image Segmenter 工作會將片段圖片資料傳回
回呼函式。輸出內容的內容取決於您設定的 outputType
確實設定工作。
下列各節說明這項工作的輸出資料範例:
類別可信度
下圖顯示特定類別的工作輸出圖表
以及圖片辨識結果可信度遮罩輸出內容包含介於
[0, 1]
。
原始圖片和類別可信度遮罩輸出內容。來源映像檔 2012 年 Pascal VOC 資料集。
類別值
下圖顯示特定類別的工作輸出圖表
值遮罩。類別遮罩範圍是 [0, 255]
,每個像素值
代表模型輸出的獲勝類別索引。優勝獎項
索引是模型能辨識的類別分數最高。
原始圖片和類別遮罩輸出內容。來源映像檔 2012 年 Pascal VOC 資料集。
此圖片區隔範例程式碼示範如何顯示區隔 查看工作傳回的結果 程式碼範例 。