赛项:大数据挑战赛

组织架构

主办单位:甘肃省教育厅
承办单位:兰州交通大学
技术支持:中觅科技有限公司、未来教育

参赛对象

大赛的参赛对象是高校所有专业在校生,本研组(本科、研究生)和高职组(高职、高专)分别评奖。

  • 报名时间

    2024/8/1-2024/11/9

  • 区域赛/省赛时间

    2024/10/9 15:00-11/15 24:00

  • 晋级国赛公示

    2024/11/21

  • 国赛时间

    2024/11/25 -11/29

  • 国赛公示

    2024/12/5

*支付方式

报名已截止
报名时间:2024/8/1-2024/11/9
区域赛/省赛时间:2024/10/9 15:00-11/15 24:00

一、赛题背景

随着计算机技术的不断发展,计算机视觉作为在很多领域都有着广泛使用场景的前沿技术,深度学习也迎来了蓬勃发展和创新,但是这些方法都需要大量的数据作为支持,而在某些任务上,数据的获取和标注往往是十分困难的,所以怎么使用少量的样本训练出一个性能较好的模型成为这一问题的关键,而小样本学习正是为了解决这一类问题。

近年来在小样本学习领域虽然有大量的算法被提了出来,但是仍然面临诸多问题,例如样本量过少,类内方差过大等等。这些问题导致小样本学习的实际效果与期望相差甚远。所以进一步研究小样本学习,使其能够真正的产生效果投入使用,成为这一领域亟待突破的关键问题。


二、时间安排

报名时间:2024年8月1日—2024年11月9日

省赛开始时间:2024年10月9日15:00开放省赛数据集下载

省赛作品截止提交时间:11月15日24:00

晋级决赛公示:2024年11月21日

决赛时间:2024年11月25日—11月29日

决赛公示:2024年12月5日

说明:比赛获奖公示后3个工作日内,接受异议、申诉和违规举报。


三、奖项设置

参赛组委会赛区奖项设置与评奖比例,结合我省参赛队伍整体情况,大赛的各个赛项分别组织,独立评比,分别设省赛一、二、三等奖,比例均为参赛队伍数的5%、15%和20%,颁发省级证书,并推荐省级赛一等奖队伍参加全国大赛。

赛设一等奖不超过参赛数的10%、二等奖不超过参赛数的20%、三等奖不超过参赛数的30%获奖师生将颁发电子荣誉证书电子指导老师证书各赛项成绩前三名获奖队伍将获得大赛奖金。颁发奖金1000元/队伍(税前)。


四、参赛规则

1.参赛对象

挑战赛的参赛对象是高校所有专业在校生,本研组(本科、研究生)和高职组(高职、高专)分别评奖。

2.参赛费用

团队赛收取报名、考试及评审费人民币180元/队。挑战赛秉持公益办赛原则,费用仅用于获奖奖金、大赛系统开发、场地、交通、设备、专家评审等。费用由技术支持单位中觅科技有限公司(开户行名称:招商银行股份有限公司合肥三孝口支行  银行账号:551908703110002)代收代付并开具发票,学校有关部门要积极支持大赛工作,对指导教师在工作量、活动经费等方面给予必要的支持。

国赛不再另行收费。

3.参赛组队

参赛学生自行在大赛官网进行报名,缴费考生默认为队长,每支参赛队伍限1—3名队员 (含1名队长) ,队员信息由队长在官网—个人中心处填写,队员无需重复缴费。参赛队伍可设1名指导老师。各高校参赛队数不限,允许跨校组队。


五、赛题和数据

1.任务描述

(1)赛题任务

本次比赛将提供训练集,要求选手根据所给数据集,利用小样本学习的方法建立稳健的图片分类模型。

(2)数据使用规则

*本次比赛只允许参赛选手使用主办方提供的训练数据。

*本次比赛禁止选手使用任何形式的大模型进行比赛。

2.数据集描述

数据集包含训练集和测试集,训练集将在比赛开始前提供给选手下载用于模型训练;测试集不提供下载,保存在服务器后台,用于推理结果的评测。

本次赛题训练集为一批商品图片,每个类别不少于50张,每张大小为224×224,图片以文件夹形式提供,每个文件夹命名为对应的类别标签,数据样例如表一所示:

image.png


省赛测试集为不少于1000个预测任务(以下简称为task),其中每个task(task0、task1、task2...文件夹)都包含对应的支持集(support文件夹)和查询集(query文件夹),其中每个支持集中都包含10个文件夹,每个文件夹代表不同的商品类别,文件夹命名为对应的类别标签,每个类别将提供5张图片,大小为224×224;对应的查询集为同样的10个类别,图像尺寸大小一致,共计20张测试图片。

参赛选手需要根据每个task中给定的支持集和选手自己设计的算法,去预测每个task中查询集中样本所属的类别。查询集和支持集的类别标签空间是相同的,和训练集类别是不相同的。且支持集不可用于模型训练。测试集文件夹结构如图一所示:

image.png 

图一 测试集结构样例

  决赛测试集为不少于1000个预测任务(task),类别空间和数据集结构同省赛测试集。


 六、评价标准

(1)提交次数限制:每支团队每天最多提交1次。

(2)评分指标:

  本次比赛采用预测正确率(accuracy)作为评分指标,计算公式如下: 

 

image.png


七、作品提交要求

提交模型及代码

1.提交说明:提交需为zip压缩包,内部文件编码格式为utf-8,目录结构为:

├─ model

│   ├─ requirements.txt

│   ├─ run.py

│   ├─ model.h5(或者其他模型文件)

│   └─ other_code_files

【requirements.txt】需包含所有依赖包,及其版本

【run.py】按照函数内部需求,不能修改固定区域的文件

【other files or folders】需要包含所有程序文件,如模型文件,如功能函数

 注意:推理环境不支持训练,不支持大型框架pip install方式安装、理论上支持wheel方式安装和python install setup.py方式安装。

2.服务器参数

        python版本:3.8

        NVIDIA-SMI:535.183.06

        Driver Version: 535.183.06

        CUDA Version: 11.3 + 12.1

        推理镜像参考: https://github.com/Datacastle-Algorithm-Department/images/blob/main/doc/py38.md

3.模型输出文件demo:

选手模型需要生成一个.csv格式的结果文件,编码为UTF-8,第一行为表头,如下例:

image.png


数据发布后,会提供submit_example.zip文件。


八、其他规定

1.数据使用有哪些要求?

本次大赛提供的全部数据、信息等。未经允许,任何人不可以任何形式使用、传播、披露、授权他人使用。

2.限制原则是什么?

作品必须健康、合法、无任何不良信息及商业宣传行为,不违反任何中华人民共和国有关法律。须保证原创性,不侵犯任何第三方知识产权或其他权利;一经发现或经权利人指出,主办方将直接取消其参赛资格,主办方保留赛事解释权。

3.关于大模型的限制说明:

    (1)需要使用api的大模型不可使用

    (2)需要网络连接的大模型不可使用

    (3)模型大小(包含权重和代码)不得超过2GB,超过2GB的由于上传大小限制不可使用

    (4)模型使用需要有自己的工作量,比如权重训练,模型结构优化,新模块的使用等等


九、联系信息

信息发布地址:

http://www.ncccu.org.cn/index/Paper/case2.html

 


*支付方式

报名已截止
报名时间:2024/8/1-2024/11/9
区域赛/省赛时间:2024/10/9 15:00-11/15 24:00
piaochuang