GBase活動
【GBASE活動】ICDIS數據庫參數調優大賽開啟報名
7月14日,由南大通用數據技術股份有限公司聯合廣東省安全智能新技術重點實驗室、哈爾濱工業大學(深圳)主辦的“ICDIS數據庫參數調優大賽”開始報名。本次大賽將聚焦于開源數據庫MySQL,以及基于GBase數據庫為數據庫平臺的性能調參技術。賽事依托于ICDIS 2022(The 4th International Conference on Data Intelligence and Security)會議,會議將于2022年8月24日至26日在中國深圳舉行。
賽事背景
傳統數據庫技術往往依賴于啟發式算法或者人工干預,例如數據庫參數調優、故障診斷、索引推薦等。然而在大數據時代,數據庫實例越來越多、場景越來越復雜、數據量越來越大,導致傳統數據庫技術難以滿足大數據的需求。例如云數據庫具有百萬級別的數據庫實例,各個實例的應用場景、用戶的使用水平都可能有很大差別,直接使用傳統啟發式算法難以取得令人滿意的結果,而人工干預也很難管理這么多的實例。機器學習技術因其較強的學習能力,逐漸在數據庫領域展現潛力和應用前景。
數據庫配置中涉及數百個可調的系統參數,控制著數據庫組件的多方面表現。配置優化技術通過選擇合適的參數組合,提高數據庫對當前場景的適應性。比如通過為各類緩存區分配合適的內存空間,盡可能減少磁盤 IO 次數;通過更新優化器估計指標,提高計劃選擇的表現等。隨著算法的改進、計算能力的提升、大數據的變革,深度學習和強化學習為數據庫優化技術帶來了更大的優化空間。
賽程安排
報名以及認證(7月14日-7月31日,UTC+8):
1. 報名方式:登錄比賽官網,完成個人信息注冊,即可報名參賽;
2. 選手可1-5人組隊,每位選手只能參與一支隊伍;
3. 選手需確保報名信息準確有效,組委會有權取消不符合條件隊伍的參賽資格以及獎勵;
4. 選手報名、組隊變更等操作截止時間為7月31日上午8點;
5. 選手以及隊伍信息通過騰訊文檔進行填寫;
6.大賽官方QQ群請掃描以下二維碼加入,最新通知將會第一時間在群內同步。
初賽:2022/07/16 8:00 – 2022/07/31 8:00(UTC+8)
說明:初賽賽題詳情請前往“賽題說明”板塊查看,選手可在初賽環節進行結果提交,結果評審將由評估系統進行。針對選手提交的結果,大賽評審團將會進行復審,最終擇排行前20支隊伍進入決賽,并進行公示。
每天提供一次代碼提交機會,并提供運行日志。
決賽:2022/08/04 8:00 – 2022/08/18 23:59(UTC+8)
說明:決賽賽題詳情請前往“賽題說明”板塊查看,選手可在決賽環節進行結果提交,結果評審將由評估系統進行。針對選手提交的結果,大賽評審團將會進行復審,最終確定獲獎的6支隊伍 ,并進行公示。
每天提供二次代碼提交機會,并提供運行日志。
答辯:2022/08/24 8:00 – 2022/08/26 18:00(UTC+8)
1. 材料準備:參與答辯隊伍需提前準備評審材料,包括代碼、解題思路、PPT材料;
2. 評審會:將以答辯會的形式進行,具體安排另行通知;
3. 最終排名:組委會將根據參賽隊伍的代碼、歷史成績、評委打分,角逐最終獎項,頒發獎金及證書。
參賽對象
面向全社會開放,高等院校、科研單位、互聯網企業等人員均可報名參賽。
獎項設置
一等獎:1支隊伍,每支隊伍獎金壹萬,頒發獲獎證書;
二等獎:2支隊伍,每支隊伍獎金伍仟,頒發獲獎證書;
三等獎:3支隊伍,每支隊伍獎金貳仟,頒發獲獎證書;
優勝將:初賽排名前20,頒發獲獎證書;
參與獎:每個參賽人員均可獲得大賽定制的金士頓32G U盤。
鼓勵師計劃
從大賽上線開始,報名參賽選手成功邀請身邊的小伙伴參賽,將獲得鼓勵師獎勵。邀請達標即可獲取,禮品可疊加不限量。
鼓勵師獎勵——大賽定制電腦雙肩背包 條件——邀請4支隊伍參賽
大賽組織
主辦單位:
廣東省安全智能新技術重點實驗室
南大通用數據技術股份有限公司
哈爾濱工業大學(深圳)
協辦單位:
廣東省計算機學會
深圳市計算機學會
哈工大(深圳)-南大通用數據庫技術聯合實驗室
大賽指導委員會:
黃軒 廣東省計算機學會秘書長
王軒 哈爾濱工業大學(深圳)教授、廣東省安全智能新技術重點實驗室主任
毛睿 深圳大學教授
湯庸 華南師范大學教授
丁明峰 南大通用數據技術股份有限公司董事長
大賽組織委員會:
羅文堅 哈爾濱工業大學(深圳)教授
漆舒漢 哈爾濱工業大學(深圳)助理教授,哈工大-南大通用數據庫技術聯合實驗室副主任
劉洋 哈爾濱工業大學(深圳)助理教授,哈工大-南大通用數據庫技術聯合實驗室副主任
楊偉偉 南大通用數據技術股份有限公司 總工辦主任,哈工大-南大通用數據庫技術聯合實驗室副主任
大賽專家委員會:
夏文 哈爾濱工業大學(深圳)副教授
趙偉 南大通用數據技術股份有限公司 CTO
王雪松 南大通用數據技術股份有限公司 研發部長
崔志偉 南大通用數據技術股份有限公司 產品部長
張加佳 哈爾濱工業大學(深圳)副研究員
唐博 南方科技大學助理教授
秦建斌 深圳大學特聘教授
參賽規則以及注意事項
移動端暫不支持參賽結果提交和成績查看,請前往PC端進行提交和查看。
大賽禁止一切作弊及違規行為,包括但不限于抄襲行為、惡意攻擊行為等,對于涉嫌作弊違規的選手或團隊,經大賽方核實后,平臺會采取限制參賽或直接取消成績排行等處理措施,具體說明請前往“作弊違規說明”查看。
大賽官方有權根據大賽運行情況及相關需求,調整、變更相關比賽規則、獎品信息、比賽時間等全部比賽所涉及的內容,具體以大賽官方最終確認的為準。
初賽賽題說明:
請選手使用以下調參方法提高DBMS(MySQL5.6)在指定負載下的吞吐量(tps),可以使用的方法包括但不限于基于經驗的腳本調參方法,啟發式調參方法,基于傳統機器學習的調參方法,基于強化學習的調參方法等。為了方便參賽者快速熟悉數據庫調參并進行應用,舉辦方將提供專門的數據庫調參系統的鏡像。(詳細情況參見賽題說明)
決賽賽題說明:
本次大賽復賽采用南大通用企業級分布式事務型數據庫GBase8s作為待調優的數據庫。本次復賽請選手使用某種調參方法提高GBase8s在指定負載下的吞吐量(tps),可以使用的方法包括但不限于基于經驗的腳本調參方法,啟發式調參方法,基于傳統機器學習的調參方法,基于強化學習的調參方法等。為了方便參賽者快速熟悉數據庫調參并進行應用,舉辦方將提供專門的數據庫調參系統的鏡像。(詳細情況參見賽題說明)
作弊違規說明:
競賽作弊違規是違反競賽公平公正的競爭宗旨,擅自增加競爭優勢的不良競賽行為。分別為:
(1) 抄襲行為: 凡未能保證原創性的競賽行為均視為抄襲行為。例如:
● 引用他人的成果未在引用處注明來源的;
● 連續引用他人代碼超過代碼總量 30% 的;
● 直接使用他人博客、GitHub等開源平臺,及其他途徑公布的創意、算法、參數配置方式等內容而沒有任何原創性修改或加工的;
● 除引用內容外,其他的內容不足以為方案,算法支撐其主要貢獻與價值的;
● 其他情形滿足將他人成果直接作為價值產出而非方案的中間過程的工具與材料 (如: 已知條件,數據清洗辦法等)的;
● 私自與其他隊伍或非本隊伍成員進行互相抄襲的。
(2) 不正當競爭行為: 凡未遵從競賽宗旨,惡意獲取高分的行為均被視為不正當競爭行為。例如:
● 可以通過除競賽規定途徑之外的其他途徑接觸到競賽相關數據的人員參加競賽的;
● 邀約參賽團隊名單之外的人員參與解題與方案設計,或以外包、求助等形式在參賽團隊之外完成賽題的;
● 參賽者以任何形式使用競賽提供數據之外的任何數據參賽的(大賽主頁明確規定可以使用的除外);
● 人工標注部分或所有測試集,并作為結果進行提交的;
● 使用競賽規定外的計算資源的(大賽主頁未做任何規定的除外);
● 在同一個比賽中,使用多個賬號參賽的;
● 利用平臺或規則漏洞進行參賽的;
● 邀約參賽團隊名單之外的人員參與解題與方案設計,或以外包、求助等形式在參賽團隊之外完成賽題的。
(3)蓄意破壞行為:凡通過惡意手段對比賽平臺、評估系統和環境進行破壞的均視為蓄意破壞行為。例如:
● 蓄意上傳攜帶病毒文件的;
● 蓄意發起對比賽平臺、評估系統的攻擊,擾亂比賽秩序的。
處理方法:
申訴
1. 被判定為作弊的隊伍均有申訴資格,郵箱:dbtune@cs.hitsz.edu.cn;
2. 申訴時,需要提交包括以下但不限于:
● 競賽截圖
● 原因說明(詳細)
● 提交結果的計算代碼
3. 申訴期限定為被判定為作弊的24小時內,過期不受理;
4. 申訴會在24小時內給出結果,但并不會給出判定原因,每支隊伍只允許一次申訴,一次申訴不通過則按作弊處理不再修改;
5. 申訴通過的隊伍會立刻恢復參賽權限并恢復排名;
6. 申訴結果本大會專家判定組有全部解釋權。