全文共3072字,預計學習時長8分鐘圖片來源:Unsplash官網(by Pascal Debrunner)也許在某些人看來,人工智能落地聽上去就像是個笑話。“人工智能”的概念自1956年達特茅斯會議上第一次被提出以來,似乎就一直停留在概念層面,隻有少數研究它的人一聽到它就像被打瞭雞血一樣興奮,普通老百姓可能唯一能想到的就隻有打敗世界圍棋冠軍李世石的那隻“α狗”。人工智能不知怎麼的好像變成瞭少數人的知識特權,對大多數人來說卻像是陽春白雪般遙不可及,不能雅俗共賞。但當養豬用上AI,這似乎足夠接地氣瞭。Oops,21世紀養豬都開始用AI瞭昨天,畢業後許久不發動態的直系師兄突然轉發瞭一條題為《京東數科簽下中國智能養殖第一大單 助力元寶楓養殖千萬頭AI豬》的推送鏈接。點開一看,映入眼簾的就是“京東數科旗下京東農牧與成都元寶楓農業開發集團有限公司簽署瞭智能養殖和數字農業項目合作合同,合同總金額達2.06億元,這是迄今為止中國智能農牧領域的第一大單”。圖片來源:新華網客戶端前不久才在第二屆數字中國建設峰會成果展覽會上亮相的“豬叫識別”技術,這麼快就商業變現瞭,這波輸出操作簡直太過迅猛。古有神農炎帝嘗百草,今有AI神農醫百獸。當中國傳統神話與普通人眼裡的“AI神話”在21世紀碰撞結合,可能就一不小心催生出一些富有時代特色的文明新產物。京東數科通過與中國工程院李德發院士合作,建立起京東農牧院士研究院,開發瞭一套包含“神農大腦”(AI)、“神農物聯網設備”(IoT)、“神農系統”(SaaS)的智能養殖解決方案。據稱,“神農大腦”中存儲著全世界現有的全部養豬方案,這就不得不承認它確實是名副其實的“養豬專業戶”。圖片來源:京東農牧官網在普通農戶還在糾結豬哼來哼去是不是沒吃飽的時候,“神農大腦”可能已經精準判定好瞭豬飼料的分量和配比,甚至可能還知道它“哼哼”隻是因為尾巴上有隻跳蚤在癢癢撓。除此之外,這顆“神農大腦”還連接著巡檢機器人和飼喂機器人,可以說它不僅是個合格的獸醫和養豬專業戶,還是個全天24小時全程服務的貼心保姆。豬圈裡冷瞭,加溫。豬飼料少瞭,加餐。京東數科首席經濟學傢沈建光先生就曾表示,到2035年,人工智能將帶來真正意義上的無人養殖場、無人種植基地。這似乎預言得並不怎麼過分。AI養豬背後的“聲紋識別”技術京東數科的此次成果展上,最引人註目的莫過於“神農”方案背後的“聲紋識別”技術。“豬的叫聲其實分很多種,平時是‘哼哼’,尋覓伴侶時‘呼嚕呼嚕’,身心舒暢的時候也會發出滿足享受型的‘哼唧’,京東數字科技在做的事情,就是從叫聲來探測豬的身心健康狀況。”AI神農搖身一變成瞭AI神醫,通過機器判斷豬咳嗽的頻率和聲音狀態,這可不就是名醫才能做到的“聞”聲診病麼?圖片來源:SOOGIF網站此等神奇的“聲紋識別”診斷術背後到底運用瞭怎樣的技術原理呢?聲紋識別是一種生物識別技術,計算機通過采集聲音信號提取語音特征,由於聲音和指紋一樣,每個人各不相同,所以通常被用於驗證說話人身份。當然也可以像京東數科這樣另辟蹊徑,通過將小豬的咳嗽聲與數據庫中海量的豬咳嗽聲進行比對,從而診斷小豬的健康是否存在異常。計算機處理的離散聲學信號大多數生物識別系統中廣泛存在的兩個通用概念為1:1和1:N。在聲紋識別技術中,1:1主要指的是說話人確認(Speaker Verification),它需要事先錄入聲音信息並將其存儲為聲音模板。當需要識別時,系統會將輸入的聲音特征與存儲的聲音模板特征進行比對,從而判斷兩者是否是同一個人。1:N主要指的是說話人辨認(Speaker Identification),系統中提前存儲瞭豐富的聲音信息,當有聲音輸入時,它通過將其與聲音庫中的聲音數據進行比對,從而判斷說話者是誰。說話人驗證和說話人識別京東數科將“聲紋識別”技術應用於智能養殖不可不謂是一項創舉,從而也讓我們看到瞭“另辟蹊徑”的無限可能性。聲紋識別系統的工作過程具體到技術細節,主要包括特征層面和機器學習模型層面。特征層面常用的經典輸入參數主要有梅爾倒譜系數MFCC、感知線性預測系數PLP、深度特征Deep Feature以及能量規整譜系數PNCC等,當然也可以將其進行組合在特征或模型中使用。就機器學習模型而言,N.Dehak在2009年提出的iVector(身份認證矢量,identity vector)框架仍然占據主導地位,在深度學習神經網絡權勢熏天的當下,聲紋識別也不免受其影響。iVector通過將語音映射到一個固定且低維的向量上,可以將機器學習的各種算法充分吸收到聲紋識別技術當中。基於此,傳統的UBM-iVector框架消化吸收瞭神經網絡的優勢,前端使用DNN(或者BN)替換MFCC來提取特征,或者也可以將其作為MFCC的補充,後端學習框架則繼續沿用iVector。聲紋識別算法的完整訓練及識別框架在一個完整的聲紋識別系統中,最重要的環節包括iVector模型的訓練以及隨後的信道補償模型訓練。由於iVector模型中既包含聲音信息也包含信道信息,而我們隻關註聲音信息,因此就需要做信道補償,信道補償中目前最好用的是PLDA算法。在特征提取階段,可以使用DNN模型提取BottleNeck等特征來代替或者補充經典的MFCC特征,並將提取到的特征輸入到iVector框架中進一步對模型加以訓練。使用BottleNeck功能訓練iVector模型從整個系統層面來說,如何將特征和模型完美結合並從多維度去刻畫聲音信息,將需要各個子系統的協同配合,這其中的每一環都將是研究人員可思考的技術優化方向。值得一提的是,聲紋識別需要建立足夠龐大的聲音數據庫,因此它實際上還是一種基於數據驅動的模型,在人工智能和大數據的大環境下,這既是挑戰也是機遇。對於像京東數科這類大公司來說,足夠大的平臺可以獲得足夠多的數據,如果再有足夠強的算法和足夠高明的遠見一並加持,那麼在行業裡遙遙領先甚至一傢獨大都不無可能。新時代AI青年的使命與情懷遙想曾幾何時聽說師兄在看“豬咳嗽”的相關論文,大傢還調侃說怎麼東哥不賣電子產品,開始搞畜牧業瞭。結果一波操作猛如虎,這行動力簡直讓人不得不佩服。調侃歸調侃,實驗室小群裡也曾看師兄曬過周末去養豬牧場實地考察時和小豬仔的親密合照。明明去做算法工程師的師兄,卻經常需要“下鄉”去采集數據。明明是人人眼紅的高薪算法崗,卻不曾想也會如此近民生、接地氣。圖片來源:Unsplash官網( by Franki Chamaki )互聯網時代巨大的人口紅利讓一眾ToC企業盆滿缽盈,好像隨時隨地隻要“操控”流量就能日進鬥金,這讓很多年輕人拼瞭命地往互聯網行業裡擠,暢想著整天坐在辦公室,喝著星巴克。然而,在人口紅利逐漸減退的當下,或許去ToB企業踏踏實實做技術的深耕者和領域的拓荒者才是年輕人該有的選擇。而人工智能的落地,無疑是ToB企業未來絕對的開墾方向。百度CEO李彥宏先生說,未來沒有一傢企業可以聲稱自己跟人工智能無關。不論是今年數字中國成果展上亮相的京東數科“智能養殖系統”和“城市操作系統”,還是去年百度世界大會上亮相的L4級別無人駕駛乘用車、“農業遙感智能檢測系統”以及打造“ACE王牌”的智慧城市計劃,都在向這個時代證明,AI不再隻是一個前沿理念,它已充分向我們展示瞭它的社會價值和可怕的發展潛力。圖片來源:Unsplash官網(by Hitesh Choudhary)在陌生的領域開疆擴土可能並不容易,也可能不會像ToC企業那樣在人口紅利的溫室中坐享其成,但就像京東數科CEO陳生強先生曾說,做行業裡最臟、最苦、最累、最難的活,一定是最有價值的事情。我們這代的年輕人,既不畏懼“到西部去、到基層去、到祖國最需要的地方去”,也勇於紮根到最需要落地的技術領域中去,不怕吃苦、敢為人先。我想,走在科技前線的AI青年,這樣的情懷一定都有。留言 點贊 關註我們一起分享AI學習與發展的幹貨歡迎關註全平臺AI垂類自媒體 “讀芯術”
本文出自快速备案,转载时请注明出处及相应链接。