近日, 在一场赛事中, 这场赛事是全球顶级数据科学竞赛平台与Deep Past团队联合举办的, 名为“Deep Past挑战赛——将古阿卡德语(楔形文字)翻译成英语”。在该赛事里, 有两位来自重庆邮电大学人工智能学院2023级的本科生, 即王世成与刘洋, 他们携手美国算法工程师杰克, 组建了“M&J&M”团队, 该团队斩获了赛事金牌, 并且在全球排名中位列第六。
王世成在多场国际顶级竞赛中有着累计卓越表现, 此次赛事也在其中, 凭借这些, 他成功获评“竞赛大师”称号, 他成为我市首位获此认证的本科学子。
于4月9日, 记者去到重庆邮电大学访问询问了二人, 他们究竟是以什么样的方式、怎样的途径, 从全球范围内的2673个参与竞赛的队伍中, 成功地崭露头角、获得突出成绩的呢?

将时间设定为4月9日, 重庆邮电大学人工智能学院里, 有两位2023级本科生, 分别是王世成与刘洋, 此刻他们正在进行研究工作。拍摄者是记者郑宇所摄。
挑战:让AI破译距今数千年的楔形文字
“Deep Past挑战赛”到底比的是什么?
王世成说, 你用过豆包吗, 这项赛事就如同我们要构建一个和豆包相似的模型, 随后借助语言处理, 规定它把距离现今两千多年的古阿卡德语变为现代英语, 选手需运用数据资源, 使AI破解距离现在数千年的楔形文字起步网校,这属于典型的低资源语言挑战。

可是, 目前所存的古阿卡德语文献仅仅大概有100本, 尽管竞赛给出了大概4000条文档(这相当于30本书的数量规模)作为测试集, 然而参考资料依旧是十分缺乏的, 远远比不上主流语言。不仅是这样, 古文字资料居然还存在各类问题, 像是格式混乱、拼写有误差等等, 就好像是一片偌大无比的“数据沼泽”, 使得翻译工作遭遇到了极大的困难。
比赛于去年12月底起始, 为冲击更高目标, 同班同学王世成与刘洋组团, 在竞赛平台联系上擅长数据分析的美国资深算法工程师杰克, 形成远程协作且高效配合的竞赛团队。
不过, 竞赛远比所设想的要繁杂得多, “怎样将一大批杂乱无章、质量参差不齐的资料, 切实整理成模型能够‘学会’的事物。”这是王世成所说的。
当面临困境之际, 团队作出了至关重要的战略转向, 即舍弃仅仅追求模型精密调试, 而是转向着重聚焦于“将数据做得厚实、做得精准”。
怀揣着“一旦察觉到问题便着手矫正, 倘若成效不尽人意即重新开展, 一旦分数陷入停滞就转变思维方式”这般坚韧不拔的劲头, 团队逐个击破技术层面的重重困难障碍, 成功锁定了位居全球第六的优异成绩。
“在翻译的进程当中, 我们发觉几千年前的楔形文字里面, 竟然还记载着商队进行讲价、债务凭证这类平常琐事。”王世成讲道, 这场技术方面的挑战也使得他们直观地感触到了古代文明的脉动句号。
收获:善用等AI工具,降低实现想法的阻力
“早在初中的时候我就已经对计算机产生兴趣了, ”今年处于大三阶段的王世成讲述道, 而实际上真正明确人工智能同数据科学方面的方向, 那是在进入大学以后方才出现的情况。

讲起学习方法, 王世成说了他的体会: “刚开始碰到机器学习时觉得特难, 我更改了办法——先从一个特定的小项目着手,可以去实践, 一边实践一边反过来推导理论。”他倡导“先达成, 再提升, 再回顾”的流程, 防止掉进“想得太繁杂, 实际去做的却很少”的状况里。
刘洋还分享了他的那个“利器”。那就是要善于运用诸如等之类的AI工具, 以此来降低实现想法时所遭遇的那种阻力, 它的关键之处在于理解代码以及方案背后所蕴含的逻辑, 而非单纯地去依赖工具。
对于那些有志参与 AI 竞赛的学弟学妹而言, 王世成提出想法认为, 要“先开始”, 并且强调“不要由于感觉自己不够强大, 就总是迟疑而迟迟不敢登上赛场。而真正能够使差距被拉开的, 并非起点有多高, 而是有没有坚决持续地走下去。”这是王世成所说的。
落地:将高水平国际竞赛纳入实践教学
王世成这份成绩的背后, 有着重邮人工智能学院定制化拔尖人才培养的支撑, 刘洋这份成绩的背后, 同样有着重邮人工智能学院定制化拔尖人才培养的支撑。王世成所在的数据科学与大数据技术拔尖班, 是学校面向AI算法岗位打造的特色班型, 刘洋所在的数据科学与大数据技术拔尖班, 也是学校面向AI算法岗位打造的特色班型。
学院副院长王进作出介绍, 那个班级运用的是小班化教学方式, 它最为突出的特点是把处于同等水平的国际竞赛归入实践教学的关键核心环节, 并且设定了一种考核机制, 叫做“银牌必修、金牌培优”, 学生唯有拿到超出银牌的成绩才能够获取对应的学分。
王进作介绍, 拔尖班的教学重庆邮电大学排名,是把时间给予项目实战以及竞赛, 使得学生从大一开始, 就置身于数据与模型里, 并且积极去对接互联网大厂的现实需求, 学院每年还针对本科生开放免费竞赛训练, 覆盖将近40%的学生重庆邮电大学排名,从零基础入门直至实战指导, 降低学生参与顶级赛事的门槛, 这种“以赛促学、产教融合”的模式成效明显, 技术拔尖班的学生进入头部大厂算法岗位的比例接近40%。那以王世成、刘洋作为代表的学子, 已然吸引了腾讯、华为、美团好些企业主动抛出实习邀请。
当下, 于中国电信人工智能研究院进行实习的王世成, 正专注于把赛场技术落实至真实产业场景之中。他讲道: “金牌并非终点所在, 而是深入钻研自然语言处理的全新起始点。”。