語音算法輸出以及AI芯片競爭的白熱化,讓更多AI語音的場景更成為各方爭奪的焦點,這也意味著我們離AI語音真正改變生活更近了一步。
2019年1月的AI語音芯片市場十分熱鬧,1月2日,云知聲召開發布會推出多模態AI芯片戰略,并公布今年布局的3款AI芯片。1月4日,思必馳召開發布會發布其第一代AI語音芯片TAIHANG。1月21日,獵豹移動旗下AI公司獵戶星空聯合瑞芯微電子宣布推出專門針對智能音箱和物聯網設備的AI語音芯片。
加上此前出門問問、Rokid已經發布的AI語音芯片,AI語音芯片的競爭正在走向白熱化。這不禁讓人疑問,為什么AI公司或者說AI語音公司都開始爭相推出AI芯片?
研發AI語音芯片是自然趨勢
獵戶星空首席戰略官王兵博士接受我們專訪時表示,AI公司紛紛推出AI語音芯片有幾方面的原因,一方面是語音市場需求增長非常快,僅看智能音箱,去年整個市場的出貨量就超過2000萬,并且還在保持增長。另一方面,AI語音算法現在已經相對比較成熟,做算法的輸出競爭已經有點白熱化的狀態,所以許多公司就開始研發芯片,因為芯片相對而言商業化的潛力更大,這是一個非常自然的趨勢。
他同時指出,由于AI語音芯片并不需要像AI視覺那么強的計算能力,也不需要最先進的工藝制程,因此相對而言AI語音芯片不僅研發的門檻低一些,開發周期也相對較短,這也是許多公司推出AI語音芯片的原因。
不過,獵戶星空最終決定研發AI芯片還有更多的考慮。此前獵豹移動董事長兼CEO傅盛接受采訪時提到推出AI芯片的兩方面考慮,第一,沒有針對某個AI場景的專用芯片,例如英偉達GPU是為游戲設計芯片,高通的SoC是為手機設計,為 AI 或者一些專屬設備設計的芯片很少。第二,如今 28nm工藝已經很成熟,成本也非常低,做一款集成語音算法的芯片可能只有幾美金,流片幾百萬元人民幣。但在產品中加入這樣一塊芯片,主芯片的負載就可以明顯降低,用原來為手機設計的芯片光語音處理可能就要消耗40%的算力。
當然,獵戶星空能推出AI語音芯片也與自身的積累密不可分。王兵表示:“獵戶星空已掌握麥克風陣列、語音喚醒、語音識別、語義理解和語音合成等全套遠場語音技術,也擁有自研全鏈路的遠場語音交互系統獵戶語音OS,作為全技術鏈條的公司,芯片是必須涉足的領域,這有利于我們在垂直領域建立優勢。同時,在中國人工智能產業發展聯盟(AIIA)公布的國內智能音箱智能化評級結果中,獵戶語音OS占據了獲評產品前五強中的三席,這說明了我們在語音市場的影響力。還有,實現芯片的自主可控也是大趨勢。因此,研發芯片成為了非常自然的事情。”
聯合研發AI語音芯片是好選擇
AI語音公司研發AI芯片是自然趨勢,芯片的研發卻可以有多種選擇,包括完全自主研發、聯合研發以及完全交由第三方設計。值得注意的是,獵戶星空選擇的方式是與瑞芯微聯合研發,與此類似,思必馳與中芯國際下屬投資公司中芯聚源成立合資公司上海深聰智能聯合研發。這是否意味著聯合研發AI語音芯片是個好選擇?
對此,王兵表示:“對比而言,從開發周期和成本的角度,聯合研發確實是一個更好的方案。因為比較成熟的芯片公司已經有積累,很多東西不需要重新去設計,能夠縮短開發周期,另外,對許多公司而言,芯片的生產和管理也沒必要親自介入。”
至于為什么選擇和瑞芯微合作,王兵表示,瑞芯微在低成本芯片方面有很多年的經驗,我們評估了包括自行研發以及與其它廠商合作的方案之后,最終發現瑞芯微的方案成本最低,并且,我們的算法與他們的硬件能力的結合也比較合適。
具體的合作分工上,獵戶星空負責芯片架構、算法以及系統軟件的設計,瑞芯微提供一些硬件的成熟方案以及對后期芯片的生產和管理。王兵表示,在合作的過程中,由于獵戶星空有有許多來自知名芯片公司經驗豐富的工程師,因此他們對于芯片該如何去設計以及如何與瑞芯微溝通都非常清楚,雙方的合作還比較順利。
我們了解到,獵戶星空在2018年上半年啟動芯片項目,目前獵戶星空語音算法團隊的規模接近200人,芯片團隊包括軟件和系統團隊大約有30人。那么,從項目啟動到芯片正式推出時間還不到一年,獵戶星空的AI語音芯片競爭力如何?
芯片不一定最便宜,但一站式解決方案便宜且靈活
據了解,獵戶星空與瑞芯微聯合研發的AI語音芯片OS1000RK基于28nm工藝,采用64位4核ARM Cortex-A35 CPU,整合高性能 CODEC(8通道ADC+2通道DAC),可以低成本地支持8個麥克風陣列,硬件語音檢測模塊(VAD)可實現很低的待機功能,專用指令集能讓神經網絡的運行更加優化。
OS1000RK主打功耗低、通用性強,能夠實現從語音喚醒、語音理解、語音合成等全鏈條的語音交互能力。
另據了解,在功耗的降低方面OS1000RK的在沒有任何聲音的時候,除了VAD其他部分都不耗電,芯片還會根據需實現變頻工作,讓OS1000RK實現較低功耗。通用能力則是王兵重點強調的優勢,他表示:“我們的AI芯片是一個通用性很強的產品,目前可以看到的規模較大的語音應用,基本都可以用它來實現,現在市面上還沒有其他AI語音芯片的通用能力特別強。”
“除了芯片,作為全鏈條AI公司,客戶需要什么算法我們都能提供,我認為目前行業內其他人還不能做到這一點。這一能力來源于我們在算法上的巨大投入,還有數據的積累,獵戶星空從2016年成立之初就開始做語音的算法。”王兵補充道。
另外,有一個AI芯片公司都不得不面臨的問題就是AI算法的不斷更新。對此,王兵表示:“我們用互聯網的思維做硬件,我們不認為一個硬件出售之后功能就不會變,而是需要不斷更新,因此我們的芯片可以通過OTA在線更新,以此來保持芯片的競爭力。”
但是,芯片的通用性、性能和成本不可兼得。獵戶星空高通用性還能具備成本優勢嗎?王兵指出,成本需要看系統成本,而不是只看芯片成本,這也是為什么我們要推出一站式解決方案的原因,這種模式能讓系統成本最低。也就是說,如果只強調硬件成本,做一款特別專用的芯片成本可能是最低,但靈活性不行,這將導致最終的系統不管是從性能還是成本的角度可能都比不過一站式的解決方案。因此,我們芯片不一定最便宜,但一站式解決方案一定是最便宜,而且是最靈活的。
推薦閱讀