入選信通院“星河”案例,百度數(shù)據(jù)眾包“智能駕駛數(shù)據(jù)資產(chǎn)管理”為產(chǎn)業(yè)落地提速
近日,由中國信通院(CAICT)等組織開展的2020大數(shù)據(jù)“星河(Galaxy)”案例評選結果出爐,百度智能云數(shù)據(jù)眾包智能駕駛數(shù)據(jù)資產(chǎn)管理實踐項目入選“數(shù)據(jù)資產(chǎn)管理優(yōu)秀案例”。
據(jù)悉,該案例征集活動由中國信息通信研究院、中國通信標準化協(xié)會大數(shù)據(jù)技術標準推進委員會(CCSA?TC601)共同組織開展,面向行業(yè)大數(shù)據(jù)應用、數(shù)據(jù)資產(chǎn)管理、隱私計算案例三大方向。
隨著國家“新基建”的深入布局,人工智能行業(yè)迎來更加廣闊的發(fā)展機遇,自動駕駛、智能交通是其中的重要賽道。百度作為中國智能駕駛領軍企業(yè),在智能駕駛領域積累了深厚的技術、能力和資源。
基于在智能駕駛行業(yè)多年的數(shù)據(jù)經(jīng)驗,百度智能云數(shù)據(jù)眾包(以下簡稱“百度數(shù)據(jù)眾包”)打造的“數(shù)據(jù)資產(chǎn)管理實踐方案”,可提供數(shù)據(jù)采集、標注、存儲、管理、訓練、清洗、評測等全流程的配套產(chǎn)品和服務。
2020年12月30日,交通運輸部發(fā)布《關于促進道路交通自動駕駛技術發(fā)展和應用的指導意見》,強力推動國內(nèi)自動駕駛產(chǎn)業(yè)進一步發(fā)展。百度數(shù)據(jù)眾包致力于通過優(yōu)秀的智能駕駛數(shù)據(jù)資產(chǎn)管理實踐,加速智能駕駛技術的應用落地,助力政府解決交通效率問題,推進企業(yè)實現(xiàn)智能化轉型。
??在百度本次入選案例實踐中,某專注于智能駕駛研究的 科技 創(chuàng)新企業(yè),需優(yōu)化算法,提升自動駕駛能力由L2至L4級別,但該企業(yè)在智能駕駛算法訓練方面,缺少多場景覆蓋的道路數(shù)據(jù)、高質量標注數(shù)據(jù)、完善的數(shù)據(jù)集管理流程等,致使研發(fā)進度緩慢。由此,該企業(yè)選擇與百度數(shù)據(jù)眾包進行合作。
在充分考慮該企業(yè)內(nèi)部的數(shù)據(jù)資源、業(yè)務應用現(xiàn)狀后,百度數(shù)據(jù)眾包為其提供了全流程數(shù)據(jù)資產(chǎn)管理解決方案。
該項目具備數(shù)據(jù)量大、場景種類多、準確率要求高等特性,對數(shù)據(jù)資產(chǎn)管理提出了極高的要求。對此,百度發(fā)起成立了自動駕駛數(shù)據(jù)資產(chǎn)管理專項委員會,提出一套有針對性的組織管理實施辦法,包括資產(chǎn)管理組織架構、數(shù)據(jù)標準評判方式、數(shù)據(jù)資產(chǎn)管理流程、稽核檢查評估辦法,以及數(shù)據(jù)安全保障措施等。
在數(shù)據(jù)采集方面,完成跨越北京、上海兩個城市2000公里道路的數(shù)據(jù)采集工作,最終累計交付1.5km點云分割結果、7w幀車道線、80w幀障礙物數(shù)據(jù),驗收正確率99%以上。
在數(shù)據(jù)標注方面,依托獨有的、專業(yè)的標注人力與平臺,高效、高質地完成了數(shù)據(jù)清洗、數(shù)據(jù)標注;上萬種corner?case場景,可幫助查找通過采集和標注建設的場景庫是否有缺漏,助力客戶L4級自動駕駛領域算法加速升級。
在數(shù)據(jù)管理方面,通過數(shù)據(jù)管理平臺,客戶可實現(xiàn)對數(shù)據(jù)的分層級管理,加工處理后數(shù)據(jù)的可視化,以及針對特定標簽的數(shù)據(jù)檢索等,幫助其構建完善的非結構化數(shù)據(jù)治理與管理體系,從而更有效地利用數(shù)據(jù),提升模型訓練和算法迭代效率,加快其自動駕駛模型落地。
項目過程中,依托百度上百萬公里采集經(jīng)驗,百度數(shù)據(jù)眾包為客戶提供采集線路規(guī)劃、篩選待標注數(shù)據(jù)方法,提升了道路采集效率,減少無效采集和標注浪費。此外,接入適合于不同場景的智能化算法,包括自動預標注技術、智能輔助算法與自動化質檢算法等,極大提升了數(shù)據(jù)處理效率和數(shù)據(jù)交付質量。
數(shù)據(jù)資產(chǎn)化進程對企業(yè)帶來的改變,將是具有顛覆與創(chuàng)新意義的,甚至會給企業(yè)帶來“重生”。但目前,企業(yè)在AI數(shù)據(jù)采集、數(shù)據(jù)標注、數(shù)據(jù)管理等方面,還面臨諸多痛點,包括高質量數(shù)據(jù)采集難、多場景數(shù)據(jù)標注難、多類型數(shù)據(jù)管理難等問題。
如何建立起符合自身數(shù)據(jù)特點,與自有業(yè)務相結合的數(shù)據(jù)資產(chǎn)管理體系,是企業(yè)當下及未來需要重點關注的核心問題。
??百度數(shù)據(jù)眾包依托百度10年AI數(shù)據(jù)經(jīng)驗、領先的產(chǎn)品技術能力,以及全國最大的AI數(shù)據(jù)標注基地——百度(山西)人工智能基礎數(shù)據(jù)產(chǎn)業(yè)基地,致力于為客戶提供一站式AI數(shù)據(jù)治理與資產(chǎn)管理方案,幫助企業(yè)對數(shù)據(jù)資產(chǎn)進行規(guī)范化、流程化的管理,讓數(shù)據(jù)增值為企業(yè)帶來 經(jīng)濟 與社會效益。