瑞薩電子與Syntiant共同開發結合先進視覺與語音技術的語音控制多模態AI解決方案


原標題:瑞薩電子與Syntiant共同開發結合先進視覺與語音技術的語音控制多模態AI解決方案
瑞薩電子與Syntiant共同開發的結合先進視覺與語音技術的語音控制多模態AI解決方案,是面向物聯網和邊緣系統的一項創新技術。以下是對該解決方案的詳細分析:
一、解決方案概述
瑞薩電子(Renesas)與Syntiant宣布共同開發出一款語音控制的多模態AI解決方案,該方案在基于視覺AI的物聯網和邊緣系統(如自助收銀機、安全攝像頭和視頻會議系統)以及智能家電(如掃地機器人等)中實現了低功耗、非接觸式的圖像處理。該解決方案結合了瑞薩RZ/V系列視覺AI微處理器(MPU)和低功耗多模態、多功能Syntiant NDP120 Neural Decision Processor?,提供了先進的語音和圖像處理功能。
二、核心技術與特點
瑞薩RZ/V系列視覺AI微處理器(MPU):
集成了瑞薩獨有的DRP-AI(動態可配置處理器-AI)加速器,將高精度AI推理與業界領先能效充分結合。
卓越能效可消除對散熱片或冷卻風扇等散熱措施的需求,降低材料清單(BOM)成本,使視覺AI集成至廣泛的嵌入式應用成為可能。
Syntiant NDP120 Neural Decision Processor?:
集成了復雜的AI功能,可用于眾多高精度免提語音應用,包括演講人識別、關鍵詞檢測、多喚醒詞和本地命令識別等。
-NDP120與Syntiant Core 2?神經網絡推理引擎封裝,可同時運行多個應用程序,并將功耗降至1mW電池功率。多模態架構:
該解決方案具備常開功能,可從待機模式快速通過語音激活,以執行物體識別、面部識別等視覺任務,以及其它安防攝像機等系統的關鍵功能。
多模態架構使得為基于視覺AI的系統創建非接觸式用戶體驗變得更加容易。
三、應用場景與優勢
應用場景:
物聯網和邊緣系統:如自助收銀機、安全攝像頭和視頻會議系統。
智能家電:如掃地機器人等。
優勢:
低功耗:利用專用的高能效芯片進行語音識別,降低待機功耗。
快速開發:可以獨立于視覺AI功能進行軟件開發,加速系統開發進程。
非接觸式體驗:多模態架構使得基于視覺AI的系統能夠提供更安全的非接觸式用戶體驗。
四、市場與前景
根據瑞薩電子和Syntiant的預測,隨著物聯網和邊緣計算的快速發展,對采用多輸入信息流(包括圖像和語音)的多模態系統需求將會增加。因此,這款結合先進視覺與語音技術的語音控制多模態AI解決方案具有廣闊的市場前景。
五、合作方簡介
瑞薩電子:全球半導體解決方案供應商,致力于提供創新的半導體解決方案,以推動社會的智能化發展。
Syntiant:深度學習芯片技術供應商,專注于在邊緣設備領域推動低功耗智能語音及傳感器處理技術。
綜上所述,瑞薩電子與Syntiant共同開發的語音控制多模態AI解決方案是一項創新的技術成果,將在物聯網和邊緣計算領域發揮重要作用。
責任編輯:David
【免責聲明】
1、本文內容、數據、圖表等來源于網絡引用或其他公開資料,版權歸屬原作者、原發表出處。若版權所有方對本文的引用持有異議,請聯系拍明芯城(marketing@iczoom.com),本方將及時處理。
2、本文的引用僅供讀者交流學習使用,不涉及商業目的。
3、本文內容僅代表作者觀點,拍明芯城不對內容的準確性、可靠性或完整性提供明示或暗示的保證。讀者閱讀本文后做出的決定或行為,是基于自主意愿和獨立判斷做出的,請讀者明確相關結果。
4、如需轉載本方擁有版權的文章,請聯系拍明芯城(marketing@iczoom.com)注明“轉載原因”。未經允許私自轉載拍明芯城將保留追究其法律責任的權利。
拍明芯城擁有對此聲明的最終解釋權。