4月16日,中國科學院主管、科學出版社主辦的核心雜志《互聯網周刊》聯合eNet研究院共同發布了《2019年度大數據產業分薦》榜單。標貝科技憑借專業、高精度的AI數據采標服務,入選“2019年度AI數據綜合采集TOP10”。同時,這也是標貝科技不久前入選以上機構發布的“2020數據標注公司排行”榜單后,獲得的又一行業殊榮。
據了解,《2019年度大數據產業分薦》按照大數據服務、大數據應用、大數據相關/綜這三類劃分,通過對2019年度企業服務能力綜合考量,評選出細分領域的杰出代表。該榜單充分體現了當前人工智能數據產業火熱的發展趨勢,以及企業自身發展實力。
標貝科技專注智能語音交互及AI數據服務,以“語音連接場景,數據服務技術”為理念,創新AI技術應用,打造了包括語音合成、語音識別、NLP、歌曲等采標服務、以及數據可視化眾包平臺-數據工場等在內的數據服務。本次,雙榜單入選,彰顯標貝科技卓越的數據服務能力。
《2019年中國人工智能基礎數據服務行業白皮書》分析指出,2010-2016年為數據服務行業的“初生期”,早期數據標注需求激增,加之入行門檻低,涌入了大量玩家,魚龍混雜。自2017年以來,伴隨著AI深入落地到各個應用場景中,數據標注行業了進入成長期,上層應用端的廠商對數據標注質的要求不斷提高,如自動駕駛、運動圖像、計算機視覺等領域的數據標注難度很高。
標貝科技自成立之初,把數據服務質量及數據安全放在首位,擁有業內領先的AI技術及數據采標服務能力,為客戶提供高質量、安全、專業的數據設計、數據采集、數據加工處理、評測分析等服務。
在安全方面,標貝擁有歐盟GDPR通用數據保護條例、英國ISO信息安全管理體系標準為指導,以數據主體及用戶隱私保護為核心,建立數據信息安全體系。實時嚴格監管數據控制、處理過程,制定數據安全性操作指導規范及應急響應機制,以此保護數據主體及用戶數據隱私安全。
在數據質量方面,經過嚴格專業的立項設計、數據采集加工處理、語音標注校對及結構處理等系列流程,標貝能夠實現快速產出高質量的人工智能數據,與算法、模型、架構等進行深度匹配,形成可進行落地的產品形態。
例如,標貝科技創新打造數據可視化眾包平臺-數據工場。
該產品首次將數據格式算法融入其中,通過操作平臺嚴格控制前端采集格式,大幅度提升了數據的高質量和準確性,確保數據在采集和上傳的過程中無任何壓縮問題。
在數據采集方面,可根據定制化需求,對各類規定文本、指定圖片,各種環境下的語音、視頻進行采集;采集過程中可實現對其內容的篩選、文本化等相關任務。可承載千萬級別以上樣本的收集,單日完成10萬+樣本采集。
在數據標注方面,通過對圖像、文本、音頻、視頻等信息進行搜集、評估、歸類,最終完成標注;標注過程中可實現對內容進行關鍵詞等內容的提取、清洗、脫敏、校驗等相關任務。企業客戶通過使用標貝數據工場采標效率可提升50%。
2020年,國家層面提出“加快新型基礎設施建設進度”。人工智能作為“新基建”七大領域之一,將為經濟增長提供新動力。而數據是人工智能產業的基礎設施,為“智慧應用、萬物連接”落地打下堅實基礎,發揮重要性角色。
未來,隨著AI+5G的不斷融合,數據價值作用會得到進一步釋放。標貝科技將加大技術投入及創新力度,深耕語音及數據產業,打造更為高質量標準的數據服務,為行業發展賦能,也為新基建發展做貢獻。