(資料圖)
在5月26日舉行的中關村論壇人工智能開放生態(tài)建設論壇上,AI訓練數(shù)據(jù)服務商海天瑞聲CEO王曉東發(fā)表題為《共享開放數(shù)據(jù)助力數(shù)字中國建設》的演講,并宣布海天瑞聲將開放多模態(tài)數(shù)據(jù)集。此外,海天瑞聲還將在A館1018中關村科技城展臺展示公司的產(chǎn)品和解決方案。
王曉東表示,作為AI數(shù)據(jù)行業(yè)里首家上市公司,公司肩負開源開放、推進數(shù)據(jù)資源整合共享的社會責任。此次即將開源的多模態(tài)數(shù)據(jù)集(DOTS-MM-0526)涵蓋圖像、語音、文本等多個維度。海天瑞聲希望與全球AI開發(fā)者和研究人員建立更加緊密的合作關系,共同推動人工智能技術的發(fā)展和應用。同時,開源數(shù)據(jù)集計劃亦是公司對于AI開放生態(tài)的一次有益嘗試,是公司在數(shù)據(jù)智能化應用領域持續(xù)發(fā)力的體現(xiàn)。
會上,王曉東還隆重發(fā)布了海天瑞聲企業(yè)品牌煥新戰(zhàn)略:公司將啟用全新Logo,英文名稱將從“SpeechOcean”改成“DataOcean AI”,中文名稱“海天瑞聲”保持不變。
王曉東表示:“此次品牌升級,不僅僅是一次簡單的改名,還代表海天瑞聲將在數(shù)據(jù)科技和人工智能領域進一步發(fā)展和探索?!焙L烊鹇曇騼?yōu)質海量的智能語音數(shù)據(jù)被大家所熟知,但近年來隨著人工智能技術的不斷迭代與發(fā)展,海天瑞聲的業(yè)務已從單純的語音領域服務擴展至提供覆蓋語音、計算機視覺、自然語言處理和多模態(tài)數(shù)據(jù)解決方案及成品數(shù)據(jù)集,未來還將支持以數(shù)據(jù)驅動的生成式AI業(yè)務發(fā)展。為更好地反映公司的業(yè)務范圍和技術實力,海天瑞聲對企業(yè)品牌進行了升級,以更好地滿足客戶的全方位需求。
品牌升級背后,海天瑞聲全新的戰(zhàn)略布局也逐漸清晰。自2005年成立以來,海天瑞聲就一直在為AI產(chǎn)業(yè)鏈上的各類機構提供AI算法模型開發(fā)訓練所需的專業(yè)數(shù)據(jù)集。目前這些數(shù)據(jù)集已覆蓋智能語音、計算機視覺、自然語言等AI核心領域。經(jīng)過多年深耕,海天瑞聲的產(chǎn)品和服務已獲阿里巴巴、騰訊、三星等國內外互聯(lián)網(wǎng)頭部企業(yè)客戶的認可,并在自動駕駛、虛擬主播、聲紋識別、人臉姿態(tài)等眾多人工智能場景及相關算法模型的訓練過程中獲得應用。
自動駕駛領域是海天瑞聲著重進行業(yè)務布局、彰顯其技術實力的核心領域之一。2023年5月18日,海天瑞聲正式推出“DOTS-AD自動駕駛平臺”。據(jù)海天瑞聲CTO黃宇凱介紹,這是一款專為自動駕駛場景設計的全棧式數(shù)據(jù)平臺,能夠支持多維度、全方位的自動駕駛標注任務,數(shù)據(jù)標注效率提升8倍;支持萬人同時作業(yè),能夠解決項目經(jīng)理和標注員的使用痛點,提升標注效能,且支持多元化部署。
特別要提到的是該平臺的四大核心功能:一是全面支持自動駕駛領域各維度2D/3D/4D點云或圖像數(shù)據(jù)標注;二是能針對不同場景支持輔助標注/自動化標注;三是支持項目的柔性管理,支持流程/工具/標簽的自定義;四是可實現(xiàn)對數(shù)據(jù)的智能化管理,確??蛻舻纳虡I(yè)敏感數(shù)據(jù)安全合規(guī)?;谶@些核心功能,海天瑞聲建立起在智能駕駛數(shù)據(jù)訓練領域的核心壁壘,也將賦能自動駕駛技術走邁向新高度。
去年年底以來,ChatGPT、GPT-4等大模型接二連三地發(fā)布,海天瑞聲CTO黃宇凱認為,大模型與其他數(shù)據(jù)訓練不一樣的地方在于,不同企業(yè)關注的側重點不同。比如,大模型主要分為預訓練和強化學習兩個階段,這兩個階段對數(shù)據(jù)都有很高的要求。就前者而言,雖然大模型對應的是大數(shù)據(jù),但并不是數(shù)據(jù)越多越好,還要執(zhí)行數(shù)據(jù)清洗的步驟。數(shù)據(jù)公司必須掌握如何清洗、向哪個方向清洗,才能更好地應用于大模型的基礎能力。對于后者來說,進行強化學習需要撰寫對應的提示詞,這對數(shù)據(jù)標注人員的邏輯思維能力和表達能力也有較高要求。
對于一家數(shù)據(jù)公司來說,數(shù)據(jù)安全與合規(guī)是其底線,也是立身之本。因此,海天瑞聲組建了專門的團隊,對歐盟頒布的《通用數(shù)據(jù)保護條例》、我國頒布的《數(shù)據(jù)安全法》和《個人信息法》等法律法規(guī)進行了深刻研究,制定了更嚴格的數(shù)據(jù)合規(guī)要求。公司要求所有員工,在嚴格遵循當?shù)胤煞ㄒ?guī)的基礎上,開展包括數(shù)據(jù)采集、標注等在內的具體工作。
(文章來源:證券日報)
標簽: