日前,由DataCastle數據城堡聯合深圳國家基因庫、福建省數據治理與數據流通工程研究院、電子科技大學大數據研究中心、山東省數據要素創新創業共同體、亞馬遜云科技、移動云編寫的《人工智能與數據科學競賽白皮書2022》于5月19日正式發布。
《白皮書2022》基于2020-2022年三年來國內辦賽情況,聚焦政府、企業、科研機構各類賽事差異化發展、拆解競賽基本架構、分析競賽業態的發展困境、研判人工智能與數據科學競賽未來趨勢和發展方向。
《白皮書2022》聚焦近三年人工智能與數據科學競賽現狀,通過抽樣調查、訪談、樣本分析等研究方法,積極探索人工智能與數據科學競賽的價值路徑和發展方向,為眾多企事業單位數字化轉型瓶頸提供先決預見,為拓展數據應用方式、推動數據要素流通應用、尋找優秀數據人才提供創新思路。
下本文為概覽:
1.人工智能與數據科學競賽概述及基本價值
1.1概述:
人工智能與數據科學競賽是一種以競賽為形式的數據應用模式,在短時間內聚集大量數字人才,通過合理的賽事設計促進人工智能應用開發和數據要素的價值挖掘。
1.2基本價值:
人工智能與數據科學競賽作為一種創新業態,對內匯聚產學研用多方資源,對外影響、助力整個產業生態。在數據科學生態系統中,政府、企業、技術人才、競賽機構形成了一個良性循環的子系統, 創新系統內數據要素、人才要素流通機制, 賦能數據科學產業發展。
2.發展情況與趨勢洞察
2.1各類賽事差異化發展
2.1.1政府賽事-聚焦公共事業與行業應用,數字孿生賦能智慧城市建設
近年來數據科學賽事市場中專項賽事比例逐漸增加,但在政府辦賽中,綜合賽事仍是主流。同時,數字經濟發展和智慧城市建設成為多地政府部門的重點工作,以數字孿生為代表的人工智能技術在智慧城市建設中發揮著積極作用。
2.1.2 企業賽事-探索競賽與社區深度融合,構建活躍用戶生態
人工智能與數據科學競賽作為技術社區的重要組成部分,被大型技術企業作為社區引流、用戶留存的重要手段,同時通過競賽提升社區用戶參與度,提高用戶粘性和社區技術濃度。
2.1.3 科研類賽事-獨立性減弱,嘗試綁定政企賽事
人工智能與數據科學競賽誕生于學術會議,在出現之初長期作為學術研究活動存在,但近年來學術機構獨立辦賽比例持續下降,與政府、企業合作辦賽逐漸成為科研學術機構辦賽的主要選擇。
2.2賽題趨勢
2.2.1 計算機視覺(CV)賽題是2022年最大熱門
在2022年統計到的635道賽題中,計算機視覺(以下統稱CV)相關賽題占比36.5%,達232道,是占比最大的技術方向。
2.2.2 工業類賽事聚焦應用落地
自2021年起,工業類人工智能與數據科學競賽逐年增多。在2022年的12場工業類賽事中,全部算法賽賽題均圍繞工業生產中的實際問題進行設計,賽題難度適中,賽題方案易落地。
伴隨工業互聯網的普及應用以及傳統工業制造業數字化轉型的趨勢,工業制造企業開始重視對工業數據的全面深度感知、實時傳輸交換、快速計算處理和高級建模分析,實現智能控制、運營優化和生產組織方式變革。
3.賽事主體
3.1主辦方
人工智能與數據科學競賽的主辦方可以分為三大類 :政府、企業與科研機構。
在2022年統計到的211場競賽中,企業辦賽占據主流,共計109場,占比51.7% ;政府辦賽數量多于科研機構辦賽,共計64場,占比30.3%;科研機構(包含高校)辦賽38場,占比18%。
政府
政府辦賽雖然只占據2022年人工智能與數據科學競賽總場次的37%,但在整體競賽生態中具有較大影響力。
政府辦賽現狀分析與趨勢預測:
·探索公共數據應用,推動創新項目孵化
·賽事水準保持高位,賽事吸引力強
·政務數據為主,多種類數據輔助
·能夠提供優質稀缺數據、優質的技術證明、對高水平團隊具有較高吸引力
企業
數據驅動是企業實現數字化轉型的核心方式,人工智能與數據科學競賽可以彌補企業在數字化轉型過程中數據應用環節人力、時間、成本等方面的不足,部分競賽賽題深入到數據處理環節,探索復雜數據處理的新方法。
企業辦賽現狀分析與趨勢預測:
·辦賽兼顧人才儲備與品牌建設
·賽題方向多樣化,數據密集型領域仍是主流
·人工智能與數據科學競賽成為企業公益新路徑
科研機構
科研機構以科研成果產出與科研人才培養為發展重心。其辦賽以精準為重點,吸引領域內頂尖人才參賽是其辦賽的側重點。
企業辦賽現狀分析與趨勢預測:
·科研機構與高校主辦的賽事商業化氛圍較弱,主要集中在學科競賽和跨學科科研攻關兩大方面。
3.2 賽事平臺
人工智能與數據科學競賽需要的賽事設計能力、技術支持能力、賽事運營宣傳能力可能超出部分主辦機構的能力或職責之外。因此賽事平臺成為將數據資源轉化為完整競賽的重要第三方。
賽事平臺的主要職責包括三方面 :賽事設計、技術支撐與賽事運營。
3.3第三方獨立平臺
DC競賽
DataCastle數據城堡平臺于2016年正式上線,由電子科技大學大數據研究中心主任周濤教授發起成立,平臺基于公司多年競賽業務體系得技術沉淀,為用戶提供競賽、實訓、人工智能實驗室、算力資源等服務。
DC競賽以Kaggle競賽模式為藍本,采用平臺化、模塊化、自動化的辦賽方式,同時結合國內具體辦賽需求,基于自研數據科學實訓平臺DCLab與相關專利,為主辦方提供定制化辦賽服務。經過多年辦賽實踐,DC競賽平臺發展成為國內領先的第三方辦賽服務供應商,平臺注冊用戶超過32.5萬人,上線賽題500余道,累計發放獎金9700余萬元。
和鯨社區
和鯨社區(原 “科賽網”)成立于2015年,是中國知名的第三方數據科學社區之一,較早一批專注于大數據算法比賽的平臺,擁有近20萬注冊數據科學家用戶, 輻射超過30萬數據人才群體。
DF競賽
DF競賽(DataFountain)是北京數聯眾創科技有限公司旗下品牌, 是國內領先的數據競賽服務平臺和數據智能協同創新平臺,旨在圍繞協作、數據、知識、技能形成大數據愛好者的專業成長鏈路,為數據科學家及產業賦能。
3.4企業自建平臺
天池
阿里集團于2014年正式推出 “天池” 大數據科研平臺, 該平臺基于阿里云的開放數據處理服ODPS, 面向學術界開放海量數據(阿里數據及第三方數據)和分布式計算資源,平臺業務包括 :天池大數據競賽、數據實驗室、開放式教學、數據人才認證。
飛槳AI Studio
飛槳AI Studio是基于百度深度學習平臺飛槳的人工智能學習與實訓社區, 提供在線編程環境、免費 GPU 算力、海量開源算法和開放數據,幫助開發者快速創建和部署模型。分設飛槳大賽、飛槳常規賽、新人練習賽等賽事分類。
華為云
華為云大賽是華為云開發者平臺打造得開發者綜合賽事平臺,其競賽內容涵蓋機器學習、軟件開發、硬件開發、系統開發、工業互聯網等眾多方向。華為云賽事平臺嚴格來說并非數據科學競賽平臺,而是綜合性開發者賽事平臺,并且只為華為集團自身業務服務。
3.5參賽者
身份特征
學歷特征:在學歷背景方面,參賽者群體中60%左右為碩博人才,本科人才占比37.88%。在人才專業情況方面,其中87%左右的人工智能與數據科學競賽人才來自于理工科背景。由于經濟管理學科與數據密切相關,諸多賽題來自金融領域,因此還有部分競賽人才來自經濟學、管理學專業。
職業特征
學生是競賽人才的主力,占比約64%,在職人員多數將人工智能與數據科學競賽作為技能練兵場和興趣俱樂部,主要人群為IT及相關行業的工作者,以及從事金融、咨詢等與數據相關方面的工作者。
地域特征
參賽者訴求
根據參賽者的典型特征進行歸類總結能夠幫助我們更好地進行賽事設計,并分析研判未來賽事的發展方向。
·獎金名譽訴求:以獎金激勵和名譽獲取為核心訴求的參賽者以在校學生和職場新人為主,可支配時間充裕,技術實力較高,有沖擊獎金和 TOP 排名的精力與實力,這些參賽者也是各大競賽前排選手的重要組成部分。
·就業創業訴求:以就業創業為核心訴求的參賽者求具有很強的針對性,主要參與某類垂直領域的專業賽事,如金融、科技、生物醫藥等。
·學習提升訴求:以獲取數據和技能實訓為核心訴求的參賽者主要由數據科學初學者為主,受限于數據獲取困難和實訓機會匱乏而選擇參賽,是各大賽事中占比最高的參與者。這些參賽者技術實力較弱,但學習意愿強,有機會發展為競賽核心選手。
·社交活動訴求:以社交活動為核心訴求的參賽者數量少,影響力大。在競賽社區加速發展的環境下, 部分競賽深度選手開始組建交流社區、俱樂部、自媒體平臺,成為競賽領域意見領袖,對競賽運營招募與輿情風向施加巨大影響力。
4.賽事基本架構拆解
5.前景展望
5.1 平衡數字中國建設區域差異,賦能數字政府生態發展。
5.2 數字中國展開布局,數據要素相關競賽或納入考核指標。
5.3 成果落地案例涌現,價值轉化路徑逐漸清晰。
5.4 解決人才招聘痛點,利用考核操作過程的評分系統精準評估技能。
5.5 科研教學為微型賽事提供落地場景。
5.6 AIGC帶來AI革命,NLP賽題將成為新一階段熱點。
5.7 仿真賽題貼進實際問題,強化學習實現最優解或成為熱門賽題類型。
5.8 線上賽事青睞云端環境,線下賽事追求競技感。
【查看完整高清文件】關注“國家基因庫大數據平臺”公眾號 → 后臺回復關鍵詞“白皮書”→ 即可收到高清文件鏈接
本文為企業推廣,本網站不做任何建議,僅提供參考,作為信息展示!
推薦閱讀:葉紫
網友評論
請登錄后進行評論|
0條評論
請文明發言,還可以輸入140字
您的評論已經發表成功,請等候審核
小提示:您要為您發表的言論后果負責,請各位遵守法紀注意語言文明