愛數智慧創始人兼CEO 張晴晴
作者丨巴里
編輯丨子鉞
圖源丨受訪者
“能夠讓機器理解人的所思所想重慶科創職業學院招中專生不,并能夠將這些內容轉化成文字是一件很酷的事情?!?/p>
17年前重慶科創職業學院招中專生不,還在北郵讀通信的本科生張晴晴偶然間接觸到了語音識別。她當時也許沒有料到,在接下來的17年,語音識別會與她的理想與事業結下不解之緣。
在人工智能三駕馬車中,數據是算法的基礎,就好比原油,只有經過清洗、分類、標注、質檢和篩選等結構化過程,才能用于AI模型訓練。
2015年,已經在中科院聲學所從事對話式AI研究的張晴晴意識到,如果不從根本上解決數據的問題,人工智能在未來幾年仍然會面臨巨大的挑戰。
就這樣,肩負著這份理想與情懷,一位女科學家開啟了創業之旅,創立了愛數智慧。
據介紹,目前,愛數智慧已處于AI語音數據服務行業的第一梯隊,為超100家國內外頭部互聯網公司、移動通信、知名算法公司等提供專業的AI數據解決方案。2020年,愛數智慧的營業收入接近億元。
同時,近兩年來,畢馬威、華為、百度、亞馬遜、英特爾等大廠人才紛紛加入愛數智慧。尤其是今年6月,前華為資深銷售總監張濤也正式加盟愛數智慧任合伙人兼銷售副總裁。
正值愛數智慧成立5周年,創業邦獨家采訪了愛數智慧創始人兼CEO張晴晴、合伙人兼銷售副總裁張濤,深入解讀對話式AI如何賦能企業數字化轉型,以及女科學家又是如何蛻變成為一家AI數據服務公司的創始人。
女科學家曾為科研采集數據
立志為AI輸送“原油”
從事語音識別研究已經17年的張晴晴,在最初接觸到這個專業時可以說是興趣使然?!罢Z音信號數字處理”這門選修課,讓她第一次萌生了對語音的興趣。
后來在保研過程中,張晴晴看到中科院聲學所在招語音專業的研究生,毫不猶豫立馬報了名。最終,她在北郵通訊學院600多個報名的學生中脫穎而出,以第7名的成績保送到了中科院聲學研究所中科信利語音實驗室,師從中科院聲學所首席科學家顏永紅。
后來,張晴晴成為實驗室中最年輕的副高,并且獲得了2014年度中科院杰出科技成就獎,又在法國國家實驗室攻讀博士后,可謂一個妥妥的女學霸。
自此,如何構建更好的模型,讓機器更好地理解人說的語音成為了她的研究目標。
張晴晴的博士論文研究的是中國人說英語的問題。她需要用200個中國人說英語的語音進行訓練模型,分析出中國人的發音特征,從而讓機器用最適合的方式理解中國人說英語的特點。
為此,她收集了200個人的聲音,不僅包括親朋好友,甚至她碰見走在大街上的路人,也會習慣的問一句:“您能幫我來錄個音嗎重慶科創職業學院招中專生不?”經過300天的時間,張晴晴終于收集齊了這200個人的聲音,將所有語音進行清洗和分類,并把數據送到系統模型里,僅花費了1天的時間系統就給出了第一個實驗結果。
301天的時間,300天都在收集和處理數據,張晴晴發現,像這樣的現象并不是只有她一個人遇到,這是很多AI科學家共同的難題。在人們普遍印象里,AI科學家每天所做的工作應該都是在構建高大上的模型,但實際上絕大多數的時間都用在了與數據做掙扎上。
那么,有沒有可能創造一個大型的訓練數據集,來讓所有科學家和企業都能夠使用呢?這一想法在張晴晴的腦海中油然而生。
直到2016年,整個市場的時機逐漸成熟。張晴晴觀察到BAT等互聯網巨頭對于數據的需求越來越多。實際上,在這幾年,人工智能曾經出現過三起三落,張晴晴的大部分師兄師姐在畢業后也都轉型到了其他行業。
在人工智能三駕馬車中,數據是算法的基礎,就好比原油,只有經過清洗、分類、標注、質檢和篩選等結構化過程,才能用于AI模型訓練。如果不從根本上解決數據的問題,人工智能在未來幾年仍然會面臨巨大的挑戰。
作為一個人工智能從業者,她希望這一次的人工智能可以一直向前,不再衰落。也正是肩負著這樣的情懷和理想,終于在同年11月,愛數智慧在北京正式成立。
經過五年的發展,公司已經從最開始10個人的小團隊發展到100多人規模。在這其中,有一件事始終讓張晴晴印象深刻,直至今日,她也認為是創業過程中最大的挑戰之一。
2017年,公司剛剛成立一年,為了節省成本,張晴晴只能租下在北京海淀區的一個商住兩用樓的房間里辦公。那段時間,北京大興區的幾場大火讓存在消防隱患的辦公樓都受到了波及。
一個周日的下午,消防隊員走進大樓,公司被告知這個樓的消防不合規,需要當天晚上立刻撤走。當時,辦公室里一共50個員工的辦公物品,張晴晴需要在3-4個小時的時間里,把所有人的電腦、座椅、辦公用品全部搬走。面對突如其來的打擊,張晴晴仿佛無所適從。
“如果我是一個員工,聽著我的老板打電話告訴我說我們要立刻搬家,員工會覺得這個公司很不靠譜吧,還要不要在這里繼續工作?”這些話不由自主地浮現在了張晴晴的腦海里,開始忐忑起來。但她很快晃過神來:不可能以一己之力完成,需要求助團隊的力量,馬上告訴大家。
聽到這個消息之后,所有員工沒有一個人抱怨。50個員工僅用一晚上的時間就把所有東西搬到了新的辦公樓里,第二天團隊還面臨著給客戶交付數據。
第二天10點,所有人準時打開了電腦開始辦公。而在那個時刻,公司還正在忙著A輪融資。投資人看到了整個過程以及所有人的凝聚力,毅然決然地投下了A輪。
“公司一路發展過來,幾乎碰到了所有創業者都會遇到的問題,早期甚至有可能明天就發不出工資了。但好在我們一直堅信公司的目標和戰略,如今終于迎來了人工智能行業的爆發?!睆埱缜缯f。
據艾瑞分析《2020年中國AI基礎數據服務行業發展報告》顯示,2019年中國AI基礎數據服務行業市場規模達到30.9億元,其中語音類數據需求規模占比為39.1%,預計到2025年數據市場規模將突破100億元,年化增長率21.8%。
伴隨著數據市場的爆發,今年年初,愛數智慧也已完成B輪融資。目前,公司已經處于AI語音數據服務行業的第一梯隊,為全球超過100家頂級人工智能企業提供相應的數據服務,而且規模也已經達到了上億的小目標。
愛數智慧-融資歷程
打造對話式AI三大基石
賦能企業數字化轉型
公司成立之初,張晴晴就把她一直在研究的對話式AI(Conversational AI)作為公司發展重點。在她看來,對話式一定是AI人機交互的終極形態,突破對話式形態代表著強人工智能時代的到來。
張晴晴之所以創立愛數智慧很重要的一點就是要把公司定位于AI人機交互這一場景,讓人和機器可以以一種非常自然的方式進行交流。
從技術角度看,對話式AI涉及語音識別、自然語言理解和語音合成等技術,想要通過這些技術實現人和機器更自然的對話,面臨著更大的難題。對話式口語常常會有語序顛倒,猶豫、遲疑產生的停頓,多人同時交流甚至出現語句打斷、搶話、交疊音等復雜語音場景,這都為 AI建模帶來了很大困難。
目前,從數據行業看,行業提供的大部分人工智能數據都以朗讀式訓練數據為主,而人與人自然的對話式數據對訓練對話式 AI 有更加關鍵的作用?!耙氚褭C器訓練成人,使得機器可以像人一樣能夠理解語言,這就需要我們為機器注入知識圖譜、中文、方言、外語等等,這確實有很大的難度,但這正是我們意義所在?!睆埱缜缯f道。
如今,AI訓練數據集、數據智能化標注平臺Annotator ? 5.0以及MagicHub.com開源社區已經構成了愛數智慧業務的三大基石。
一方面,對于沒有自己數據的企業,或者企業在合規的角度不能觸碰數據又需要解決AI的問題,都可以從愛數智慧采購合規的數據集。這些數據已經按照一定的行業和場景的規則,進行了個人信息的脫敏性處理,同時有著嚴格的保密性存儲,從而幫助企業既快又合規地搭建自己的基礎系統。
值得一提的是,愛數智慧是國內第一批拿到ISO27701認證的數據服務商,27701是全球最新的個人隱私認證,在數據處理上遵循國際國內的最高標準。
目前,愛數智慧擁有超過200000小時數據集,其中超過140000小時對話式AI訓練數據集,這些數據集經過多維度的標注,包括語音到文本的轉換,以及說話人性別、年齡、情感等標簽,這些標簽能夠幫助開發者在解決多語言對話式AI上提供更多的信息,從而幫助優化對應的模型。
在語種上,愛數智慧擁有超過60種語言的數據集,還有部分針對外語數據構建的雙語混合數據集,如泰語英語混合數據集、馬來語英語混合數據集等,從而幫助開發者解決混合語音識別的問題。
在場景和行業上,愛數智慧構建了五大行業垂類AI數據集,包括智慧出行、智能社交、智慧金融、智能家居以及智能終端。以智能座艙為例,整個行業在語音識別、語音合成、自然語言理解方面,普遍還面臨識別率低、機器聽不懂、合成聲音比較假等難題。
愛數智慧合伙人兼銷售副總裁 張濤
據愛數智慧合伙人兼銷售副總裁張濤介紹,國內車企在拓展海外市場時,會涉及到要能夠識別不同地區用戶的英語口音問題。通過大量的對話數據集或者語料庫,愛數智慧已經將這些共性抽取出來,從而形成了一個標準AI訓練數據集。
客戶通過這些數據集來訓練它的模型,就能夠讓整個人機交互提升到更高的水平。除此之外,愛數智慧還能夠提供智能化標注平臺Annotator ? 5.0,為企業提供私有化部署,在保證數據安全的情況下幫助客戶降本增效。
目前,有不少傳統車企和造車新勢力都已經成為愛數智慧的客戶。
在大多數人的印象中,會把數據標注認為是一項沒有技術含量的活兒,甚至認為只需要中專生、大專生審核對錯、是否敏感即可。但其實,數據標注是要將現有的專家知識體系和知識圖譜融入到系統中去,也就是“教機器做事”。
隨著AI數據處理的復雜度越來越高,就需要更多垂直行業和場景的背景知識。因此,AI數據標注這個動作未來會越來越會由懂行業knowhow的專家來完成。
但是每個企業不可能都請到專家天天做數據標注這樣最基本的動作。要能夠做到真正地降本增效就需要一款能夠高效且自動化、智能化的數據處理工具,愛數智慧將其稱之為office for AI——Annotator ? 5.0智能化標注平臺。
經過5年的迭代,這套系統不斷給各大企業處理音頻、視頻、文字等多模態數據,如今Annotator ? 5.0不僅僅是一個數據標注平臺,更是在此之上同步完成了企業的數字化、信息化以及智能化這三個步驟。
眾所周知,企業的系統中都存在大量的音視頻等非結構化數據,并沒有被智能化的挖掘出來釋放出其價值。而這套系統就可以幫助企業把這些雜亂無章的數據進行相應的標簽化,并存儲到企業的數據庫中,從而便于企業基于這些數據再進行挖掘,為決策分析提供參考。
張濤談到,在這個標注系統中,已經有大量專業術語的知識沉淀。在標注的過程中,機器可以像幫助人工解決一部分標簽化的工作,而人只需要在此基礎上做一些校正即可。整體操作效率預計能夠提高100%以上,綜合成本反而可以降低50%。
同時,為了滿足更多行業和AI從業者對于訓練數據的需求、降低數據使用門檻,解決找數據難的問題,今年4月上線的MagicHub.com開源社區也體現出了愛數智慧在整個行業中的前瞻式布局。
迄今為止,開源社區已擁有超過60個包含語音識別、語音合成、發音詞典、自然語言理解等不同類型的開源數據集,覆蓋全球超過3000名開發者,數據集累計下載量超過7萬小時。MagicHub.com開源社區除了開源大量數據集外,還與各大高校和相關機構合作,通過組建開發者社群、開展培訓和賽事,致力于打造全球AI開發者生態。
科學家創業重在思維轉換
要以客戶為中心
回顧愛數智慧5年來的發展,也是一部科學家的創業史。有投資人就曾說過,科學家創業者掌握著核心技術以及商業轉化的能力,這是投資者最為關注的。但對于這些科學家創業者,最大的挑戰可能在于缺乏傾聽市場和客戶需求的意識。
剛剛創業時,張晴晴感覺到的是既有未知的興奮,也同時有創業0到1所帶來的不確定感?!白铋_始,甚至財務的小姑娘都在幫我們標數據,大家沒有什么區別,只要能夠一起解決,大家都會伸把手”。從研究學術的科學家到成立公司面臨商業化的難題,給張晴晴帶來的最大挑戰來自于思維上的轉換。
“最開始和市場銷售的同事、客戶交流的時候,可能大家都不是在一個頻段上?!钡珜τ趶埱缜鐏碚f,其實并沒有什么退路,只能迎難而上去解決這些問題。
科研人員普遍追求的是類似于1+1=2這樣一個客觀真理,然后不斷地思考、迭代,并且很多時候都是獨立完成,但作為一家商業化定位的企業服務公司,更多時候要去看客戶遇到了什么問題,并且在考慮投入產出比的情況下,如何幫助客戶解決現有的問題。
張晴晴談到,我們很多時候追求的理論上極致,不見得是一件好事,加之AI本身的發展速度非???,如果按照現有規則解決,有可能半年后會發生一些調整,這么看來,當期的投入其實可能是不合適的。所以,科研出身的創始人在思維上很重要的轉變就是要從理想化、追求極致的狀態轉變為以客戶為中心。
實際上,這對于一個已經做了十幾年科研的人來說是一個極大的挑戰,但作為一個公司的創始人來說,學習能力是最為重要的能力之一,包括對于新事物的接受能力、思考問題的體系方法。這考驗的是創始人是否能夠基于自身的學習能力,舉一反三的不斷克服新的問題。
梅花創投、明勢資本、策源創投、凡創資本等投資人從早期一路陪伴愛數智慧走過來的投資機構也見證了張晴晴從一個科學家到企業家的轉變。
張晴晴還清楚地記得,“天使輪的投資人看到我的狀態時有一種焦慮感,怕我hold不住創業這件事情。但隨著公司的發展,他們也看到了我學習和成長的過程,現在已經很信任我來做這件事情了?!?/p>
沒有一個所謂天生的企業家,企業也不是一成之規,投資人最為看重的是創始人在面臨挑戰的過程中能不能快速成長、解決問題?!霸诠驹缙陔A段的時候,更重要的是要尋找到那些相信你并認為你是潛力股的投資人。面對投資人的疑慮,公司規模的發展就是對所有投資人最好的解釋?!彼f道。
今年8月,海天瑞聲在科創板成功上市,成為了AI數據資源和數據服務領域的首家上市公司。對于整個行業來說,海天瑞聲的上市是一個利好消息。
對于上市,張晴晴也給出了自己的答案:早期投資人更多時候還是希望公司能夠按照我們認為對的方向發展?!拔覀円蚕M?,在為行業提供訓練數據集這樣的基礎之上,能夠通過智能化標注平臺這樣系統化的輸出,為未來各行各業提供更具價值的服務,從而可以幫助公司完成未來3-5年上市的目標?!?/p>
“上市是對過去工作的一個證明,肯定不是終極目標?!彼J為,尤其對于企服領域,更要重視業務的扎實度。判斷一家公司優劣與否不僅要看當期,也要看這家公司在當期之上未來的可能性,這也是有時兩家公司營收相差不多,估值、市值卻有天壤之別的原因。
不僅身為科學家,同時作為女性創業者的張晴晴也表現出了其堅韌的一面?!拔以趧摌I過程中都沒有考慮過性別或是年齡的問題,作為一名擁有五年經驗的創業者,我認為任何人創業之前不應給自己太多的預設,而是應該專注在事情本身,實現這個結果是最重要的。尤其在企服ToB領域,更講求專業性,能不能利用你的專業給客戶帶來價值,而這與創始人是否是女性都沒有關系?!?/p>
對于一個創始人來說,只有兩件最重要的事:一是看方向看戰略重慶科創職業學院招中專生不;二是找到愿意做這件事的人一起往前走。最后,張晴晴笑著說,公司基于數據的戰略是一件難而正確的事,如果還有什么遺憾的話,那就是吸引更多優秀的伙伴更早加入愛數智慧,一起創造價值。
愛數智慧五周年大合影