應用

技術

物聯(lián)網世界 >> 物聯(lián)網新聞 >> 物聯(lián)網熱點新聞
企業(yè)注冊個人注冊登錄

智能語音賽道已鋪設,千億級規(guī)模市場即將爆發(fā)

2021-06-01 11:19 智東西

導讀:企業(yè)級場景近一年來收到疫情的加速催化,空間也即將達到千億規(guī)模。

智能語音即聲音信息在人機間的交互模擬,為人工智能的核心技術之一,也是人工智能落地最早的技術之一。1980s至今智能語音經歷三個階段發(fā)展,2016年開始進入落地期,智能語音助手、智能音箱相繼落地。

現(xiàn)在,智能語音的相關應用正向消費級企業(yè)級兩大方向爆發(fā)。其中消費級包括智慧生活場景、智能家居場景和智能駕駛場景,近期總的發(fā)展空間將達到3000億元。

企業(yè)級應用包括智慧教育場景、智慧醫(yī)療場景和應用于電信/金融/電商等場景的智能呼叫/客服場景,值得一提的是,企業(yè)級場景近一年來收到疫情的加速催化,空間也即將達到千億規(guī)模。

本期我們推薦華西證券的報告《智能語音賽道:風口已至,全面開花》, 從消費級、企業(yè)級兩大分支還原智能語音的發(fā)展格局。如果想收藏本文的報告,可以在物聯(lián)傳媒公眾號后臺回復關鍵詞“智能語音”獲取。

一、智能語音,AI核心賽道

智能語音是AI的重要入口,是AI三大核心基礎技術之一( 機器視覺、智能語音和機器學習)。

智能語音在AI技術中占據重要地位,就市場份額而言,2019年智能語音占據我國AI22%的份額,僅次于已經實現(xiàn)大規(guī)模商用的機器視覺。

▲智能語音是人工智能行業(yè)重要細分市場

所以,什么是智能語音?簡單點說,智能語音即聲音信息在人機間的交互。

人類大腦皮層每天處理的信息中,聲音信息占20%,是溝通最重要的紐帶。智能語音將聲音轉為文字供機器處理、在機器生成語言之后,用語音合成技術將文本語言轉化為聲波。

▲智能語音的實現(xiàn)流程 & 各環(huán)節(jié)模擬機制

智能語音的發(fā)展始于上世紀八十年代,迄今已經歷了三個階段:

1980s-2010為起步期:語音識別開始從孤立詞識別系統(tǒng)向大量詞匯連續(xù)語音識別系統(tǒng)發(fā)展;

2011-2015為變革期:微軟DNN(深度神經網絡)的出現(xiàn)使識別錯誤率第一次大幅降低,降幅約90%,技術與產品開始大發(fā)展;

2016至今為落地期:機器語音識別準確率第一次達到人類水平,約95%,智能語音技術進入落地期,智能語音助手、智能音箱相繼落地。

但是,相比于機器視覺,智能語音的落地進程相對落后。機器視覺企業(yè)在全球AI企業(yè)中占比40%、在國內占比46%;是國內外AI企業(yè)最集中的領域。

主要有兩方面原因,一方面其數據的體量、密度相對有限,另一方面其涉及的聲學研究、模式識別研究、通用NLP研究及垂直場景的深度語義理解等還未完全成熟(尤其2016年以前),因此在交互體驗、使用效果、場景優(yōu)化等方面都仍有較大空間。

▲全球AI企業(yè)應用技術方向分布

▲中國AI企業(yè)應用技術方向分布

但隨著智能語音技術逐漸成熟,未來幾年市場將維持高速增長。

根據Gartner發(fā)布的2018年AI技術成熟度曲線,當前語音識別已經進入?實質生產高峰期,意味著語音識別技術已被廣泛接受,規(guī)?;涞丶磳㈤_始。此外,像自然語言處理、虛擬助理等相關智能語音技術歷經淘洗之后即將落入,泡沫化低谷期,商業(yè)模式越來越成熟,也將進一步推動智能語音的落地。

根據ReportLinker的預測:到2024年全球智能語音市場規(guī)模將達到215億美元,其中智慧醫(yī)療健康、智慧金融以及各類智能終端智能語音技術需求將成為主要的驅動因素。

智能語音市場按客戶類型可分為消費級市場( 2C 或 2B2C )和企業(yè)級市場(2B)。

消費級應用,立足于個人日常生活,主要包括了智慧生活、智能家居、智慧辦公、智能駕駛等場景,本質上是智能語音技術(以語音助手為代表)對于各類終端的賦能,是AIoT大生態(tài)的重要構成。

具體產品包括了:智能手機、智能可穿戴、智能音箱、智能家電、翻譯機、錄音筆、轉寫TWS耳機、智能車載等。

專業(yè)級應用:服務于特定場景,如智慧醫(yī)療、智慧教育、智慧電信/金融/電商等。相較而言,專業(yè)級應用具有更高的垂直屬性和know-how壁壘。

具體產品包括了智慧課堂、自動審閱、學習機(2C屬性)、智慧客戶/呼叫等。

▲智能語音領域的各類細分賽道

二、2C消費級市場

智能手機開創(chuàng)語音助手先河,引領消費級市場。消費級智能語音交互是大眾接觸智能語音最普遍的渠道,核心邏輯仍是消費級AIoT,消費級AIoT市場規(guī)模就已達到1753億元,在總AIoT市場中占比68%,空間極其廣闊。

眾多人工智能公司(硬件設備廠商 & 互聯(lián)網廠商)均瞄準消費級智能交互終端,第一款典型的落地產品就是智能手機語音助手。

語音助手落地開啟智能語音應用元年:2011年第一款手機語音助手Siri伴隨iPhone 4S亮相,各大廠商紛紛入局。從2017年下半年開始通過開放語音生態(tài)系統(tǒng)進行產業(yè)內合作,語音助可穿戴、家居、車載等領域延伸。

智能手機中配置智能語音助手比例提升,預計2023年占比將達90%。根據Strategy Analytics數據,2018年全球銷售的智能手機中就已經有47.7%配置了人工智能語音助手,占比將近一半。

當前,智能手機配置AI語音助手已成為整體性趨勢,從已有用戶的情況來看,智能語音助手用戶使用助手頻率占比最大的為每周3-4次,表明人們正日益傾向于使用智能語音助手。

基于這一趨勢,Strategy Analytics預計,到2023年前,90%的智能手機都將會配置AI語音助手。

▲智能手機配置語音助手的比例

▲智能手機語音助手使用頻率

智能可穿戴設備市場空間廣闊,智能語音為其天然入口。智能可穿戴設備趨于小屏化、無屏化的特點決定了智能語音將成為其天然入口。伴隨中國智能可穿戴設備行業(yè)在各垂直領域應用程度的加深,中國智能可穿戴設備行業(yè)將持續(xù)擴容。沙利文預測,2023年中國智能可穿戴設備行業(yè)的市場規(guī)模將達到913.7億元

中國智能可穿戴設備行業(yè)由上游的軟硬件供應商、中游的智能可穿戴設備廠商及下游各應用領域構成。

預計2020年全球可穿戴設備出貨量將達到3.96億臺,與2019年出貨量3.459億臺相比增長14.5%。

展望未來,IDC預測,2024年全球可穿戴設備出貨量將達到6.371億臺,五年內復合年增長率(CAGR)為12.4%。

據IDC發(fā)布的《中國可穿戴設備市場季度跟蹤報告》顯示,2020年中國可穿戴設備市場出貨量第一季度、第二季度分別為1762萬臺(同比下降11.3%)和2658萬臺(同比增長4.1%),扭虧趨勢明確,預期全年數據增速可觀,不低于全球增速。

▲IDC:全球智能可穿戴產品出貨量及預測值

▲IDC:中國智能可穿戴產品出貨量

現(xiàn)階段,搭載語音助手的設備產品主要為智能手機和智能可穿戴設備,同時也包括小部分智能家居產品、智能車載產品。就規(guī)模來看,2020年智能語音助手的市場規(guī)模已經達到241.1億元;2021年規(guī)模將達到337.5億元。

由于中國居民消費水平提升,消費主力群體代際變遷等因素,搭載語音助手的智能設備的消費量將會有所增長,推動中國語音助手市場規(guī)模進一步擴大。預計到2023年,中國語音助手市場規(guī)模將增長至570.3億元。

▲中國智能語音助手市場規(guī)模(億元)

另外一個智能語音落地場景是智能家居,智能家居的最終形態(tài)是實現(xiàn)全屋產品的智能化,為AIoT的關鍵場景,在燈光、空調、電視、窗簾、門窗、背景音樂、安防、監(jiān)控控制以及可編程定時控制等方面均有應用。

2020年中國智能家居市場規(guī)模突破2400億,2020年全球智能家居市場平均滲透率將超過60%。未來三年將是智能家居行業(yè)快速發(fā)展的時期,行業(yè)并購及市場規(guī)模增長將誕生一批年銷售額超過百億的企業(yè)。

▲智能家居市場規(guī)模(億元)

▲2020 智能家電平均滲透率超過60%

智能音箱為語音交互藍圖鋪路,是智能家居入口。早在2019年底,中國智能音箱累計出貨量就已經超過7000萬臺,在我國城鎮(zhèn)住房中滲透率達到20%,接近2012年智能手機的滲透程度。

▲2012-2019年智能手機/音箱出貨情況

▲2012-2019年智能手機/音箱滲透情況

智能音箱當前市場規(guī)模已超百億元,未來三年中國智能音箱行業(yè)市場規(guī)模將保持穩(wěn)定增長,2023年有望達到8712萬臺,即174.2億元。

▲智能音箱行業(yè)市場規(guī)模及出貨量

第三個落地場景是智慧辦公,核心是翻譯機。根據華經情報網數據,我國翻譯機價格主要分布在250-800元和2560-3310元兩個區(qū)間,其占比均為38%。

出境旅游、教育剛需和經濟全球化等因素持續(xù)驅動產業(yè)規(guī)模增長,自動語音識別、機器翻譯、語音合成、圖像識別等AI技術大幅提升翻譯機性能加速產業(yè)發(fā)展。

2020年我國翻譯機市場規(guī)模將有望達到27.7億,并在2030年進一步擴張至56.2億元。

▲翻譯機價格分布

▲ 翻譯機市場空間(億元)

另一個潛在爆發(fā)場景是語音輸入法。輸入法是智能語音技術在C端的重要落地場景,語音輸入、智能糾錯、語音翻譯等功能開始成為標配;語音變聲、語音斗圖等針對年輕群體的創(chuàng)新功能也相繼推出。

第四種智能語音落地場景是智能駕駛。目前,特斯拉、造車新勢力&傳統(tǒng)整車廠、初創(chuàng)公司、科技巨頭采用不同的方法和路徑更新迭代自動駕駛的能力,體現(xiàn)出技術路徑的分化,行業(yè)競爭格局正在發(fā)生新的變革。

未來伴隨著科技的進一步發(fā)展,AI、人機&語音交互、5G C-V2X 車聯(lián)網等技術的成熟,智能汽車的功能將進一步豐富,使得智能駕駛的滲透率逐步提高,進而帶動整個產業(yè)鏈市場規(guī)模的快速增加。

在當前智能汽車的發(fā)展中,最為激烈的競爭集中在自動駕駛智能車載系統(tǒng)兩個領域。

隨著信息技術、網絡技術和人工智能的發(fā)展,智能車載系統(tǒng)將通過融合數字顯示、多屏作者互動、手勢操作、智能語音等多項技術,為汽車的駕乘人員提供全新的、直接的、多元的人車交互服務。

在汽車產業(yè)領域,搭載基于智能語音的車載交互系統(tǒng)已經成為主流。車載語音交互或將成為標配,打造車內交互新體驗。

根據高工智能汽車研究院的數據,2020年一季度中國市場銷售新車前裝搭載4G聯(lián)網功能滲透率為46.05%,同比上年提高近20個百分點。預計,搭載率到2025年期間將呈現(xiàn)較快的增長態(tài)勢。

同時到2025年主流的車企將基本實現(xiàn)新車的聯(lián)網標配,車載語音巨頭面臨更大的產業(yè)機遇。智能車載潛力巨大,智能語音有望成為車載系統(tǒng)標配。

不同于手機以觸屏為主的交互方式,車機和人的交互更多將采用語音,而未來伴隨著智能汽車滲透率的逐步提高,智能汽車中的語音交互將更加豐富,進而帶動市場規(guī)模不斷增加。

AI 車庫數據顯示:我國車載語音市場規(guī)模在2022年將接近30%。

競爭格局來看,國內巨頭科大訊飛占據半壁江山,老牌海外廠商Nuance的國內份額正在被不斷蠶食,身后BAT、思必馳等也在快速追趕。

▲中國智能車載市場規(guī)模預測(億元)

▲中國智能車載語音市場規(guī)模(億元)

▲我國車載語音市場占比(截至2019H1)

三、2B企業(yè)級市場

智能語音消費者業(yè)務主要通過硬件出售及相關互聯(lián)網增值服務獲利,而企業(yè)級和公共級業(yè)務則主要有兩類合作模式:

一是技術平臺輸出模式,將通用技術能力封裝為SDK或API,下游客戶或生態(tài)中的開發(fā)者使用時向技術提供方支付一定費用,當然為了促進生態(tài)的快速發(fā)展,一些平臺如華為HiAI 、百度語音技術采取面向開發(fā)者免費的策略;

二是切入傳統(tǒng)行業(yè),提供解決方案(含核心設備),這種情形下涉及智能語音企業(yè)與傳統(tǒng)行業(yè)集成商或最終客戶進行定制化、深度合作。

▲人工智能技術平臺輸出和解決方案業(yè)務規(guī)模

智能教育,AI 課堂的建設進入快車道。教育部發(fā)布的《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》中提到,我國要建立教育經費投入保障體系,并重點提出各級政府在教育經費中按不低于8%的比例列出教育信息化經費。

2021年為十四五開局之年,判斷教育信息化仍將迎來加碼新政,智慧教育將正在政策助推下持續(xù)加速發(fā)展。

政策直接相關的應用主要有智能語音訓練與評測、互動教學等,其中語音評測市場受益于新高考方案和國家英語能力考試改革,潛力巨大。

智慧教育空間寬廣,應用邊界不斷拓寬。自2012年以來,語音識別、圖像識別、深度學習等人工智能技術發(fā)展迅速,不斷實現(xiàn)突破,人工智能在線教育在人工智能技術的發(fā)展推動下逐漸興起,基于語音識別技術的語音測評、基于圖像識別的智能情緒分析等人工智能在線教育產品涌現(xiàn)在市場中,人工智能在線教育行業(yè)發(fā)展步伐逐步加快。

中國人工智能在線教育市場規(guī)模從2014年的54.9億元增長至2020年368.3億元,呈現(xiàn)快速增長趨勢。隨著人工智能技術日趨成熟,人工智能在線教育產品性能將進一步提升,用戶規(guī)模將不斷擴張,人工智能在線教育市場規(guī)模有望迎來新一輪快速增長。

預測至2023年,中國人工智能在線教育規(guī)模將達680.5億元,復合增長率仍將維持在20%以上。

▲人工智能在線教育市場規(guī)模(億元)

第二個2B場景是智慧醫(yī)療。智慧醫(yī)療領域,語音電子病歷系統(tǒng)需求正在釋放。通過語音輸入的方式生成結構化病例、執(zhí)行病例檢索,節(jié)約醫(yī)師輸入病歷的時間,解決方案一般包括 ASR/NLU 技術和專用醫(yī)療麥克風。

此外,需求正在向導診機器人、問診小程序、診后隨訪系統(tǒng)、住院病房管理系統(tǒng)、臨床決策支持系統(tǒng)(CDSS)等多應用領域擴散。

中國的智慧醫(yī)療建設行業(yè)有著廣闊的發(fā)展空間和投資市場,當前市場空間整體超千億元。

根據中商情報網數據,2019年我國智慧醫(yī)療建設行業(yè)規(guī)模為880億元,而2020年這一數字已經達到1040億元。

按照現(xiàn)狀估計,預計到2022年,我國電子病歷語音輸入累計覆蓋近1600家三級與二級醫(yī)院付費數,滲透率分別為36%和4.5%,180萬醫(yī)生受益。

四、智能語音格局及核心玩家

智能語音語音技術和自然語言理解技術快速進步,目前已在2C消費級的智慧生活、智能家居、智慧辦公、智能駕駛;2B企業(yè)級的智慧醫(yī)療、智慧醫(yī)療、智能客服等多個領域實現(xiàn)場景應用。

根據沙利文咨詢的統(tǒng)計預測,2019年我國智能語音行業(yè)市場規(guī)模約為218.4億元,預計2024年將達到489.8億元。

▲中國智能語音行業(yè)市場規(guī)模(億元)

智能語音2C消費級 & 2B企業(yè)級市場各細分賽道均有廣闊空間,后疫情時代有望全面開花,梳理如下圖。

▲智能語音領域細分賽道市場空間

國內外智能語音市場均已相對集中,龍頭占據主要份額。根據中商產業(yè)研究院的數據,智能語音全球市場CR5達到88%,中國市場CR5達到84.6%,均已呈現(xiàn)相對集中市場格局。

差異:全球巨頭玩家如Nuance、谷歌等在中國份額有限,取而代之的是國內龍頭科大訊飛。一是由于中英文語義理解差異(疊加方言影響);二是受益于國內互聯(lián)網生態(tài)高速發(fā)展,智能語音在國內具有更加豐富的落地場景。

在這一背景下,可梳理兩類玩家:

1、通用平臺商如科大訊飛、百度致力于打造開放語音生態(tài);

2、專業(yè)應用商如云知聲、思必馳致力于搶占家居、車載等細分賽道。

▲全球智能語音市場格局

▲全球智能語音市場格局

自2011年iPhone 4S首次搭載Siri以來,智能語音助手這個聊勝于無但又頗具想象力的功能就一步步成為手機中的基礎功能,并旋即在智能音箱領域大顯身手。雖然語音助手一直的覆蓋面一直在提升,但使用率確一直不高。但是,以智慧家居為例,智能語音設備其實只是一個入口,隨著IoT、自動駕駛等技術的不斷拓展,與智能語音設備相互配合一定會大放異彩。