首页>>新闻资讯>>云计算

第五届“一带一路”国际大数据竞赛闭幕 重庆邮电大学参赛队夺得唯一特等奖重庆日报2023-11-07 20:29重庆日报2023-11-07 20:29

2023-12-04 09:31:46 11

11月6日,第五届“一带一路”国际大数据竞赛暨第九届百度&西安交大大数据竞赛,在首届“一带一路”科技交流大会上举行决赛,并于7日举行颁奖仪式。全球3809支队伍共4147人参加,涵盖548所高校(其中海外院校89所,覆盖19个国家和地区),最终来自重庆邮电大学的参赛队夺得唯一特等奖。其余来自福州大学、哈尔滨工业大学、中国科学院大学等高校的15支参赛队伍分获一二三等奖。
▲11月6日,重庆悦来国际会议中心,第五届“一带一路”国际大数据竞赛暨第九届百度&西安交大大数据竞赛现场。记者 郑宇 摄/视觉重庆
AI助力社交网络虚假信息甄别
本届大赛由联合国教科文组织国际工程科技知识中心(IKCEST)、中国工程科技知识中心(CKCEST)、西安交通大学和百度公司联合举办。大赛聚焦当前社交网络虚假信息泛滥的现状,以“社交网络中多模态虚假信息甄别”为题,助力社交网络实现“AI虚假信息甄别”。
目前,网络空间的谣言辨别和治理已成为亟待解决的突出问题。一段文字、一张图,往往就可以编造出一段耸人听闻的谣言。据统计,光是新浪微博在2022年处理的虚假信息,就超过8万条。今年以来,部分虚假信息在网络上引起热议,而面对层出不穷的谣言,单靠人力排查效率不高。
目前AI已在虚假信息的识别上得到应用,主要涉及自然语言处理技术,对纯文本型的谣言有一定效果。然而社交网络的谣言已呈现多模态趋势,除了文字,还有配图,甚至配上视频,导致眼见也未必为实。
今年国际大数据竞赛赛题,正是针对这一现状,鼓励选手采用多模态的技术手段,融合自然语言处理技术、计算机视觉技术建立模型,以应对图文形式的谣言。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,在过去半年里,大语言模型所展现出来的智能涌现能力,让机器具备跨越文本和图像等多种模态的复杂场景的理解与生成能力,今年大赛聚焦社交媒体网络中的多模态信息,更具现实意义。
据介绍,国际大数据竞赛提供从公开平台上获取的数据集,涉及文娱、经济、健康、时事、国际等多个领域,同时公开中英文验证集供选手优化模型。大赛采用分类任务主流的评价指标F1对预测结果进行自动评价。
百度高校合作部总监李轩涯表示,本次竞赛历时4个月,参赛人数达到历史最高,经过初赛、复赛的激烈角逐,共产生16支队伍进入决赛,进行技术方案展示和答辩。今年竞赛中百度旗下飞桨平台、文心大模型能力的使用,也为竞赛队伍的技术方案提升了不少技术效果。
▲11月6日,竞赛现场,选手正在进行展示。记者 郑宇 摄/视觉重庆
重邮团队“火眼金睛”,甄别成功率达91.76%
获得特等奖的重庆邮电大学“与自己和解”队,参赛的5名选手全是研一学生。该队队长彭浩介绍,这次比赛要求各参赛队基于官方指定数据集,通过构建同一事实跨模态数据之间的关系(文本和图像),实现对任一模态信息进行虚假和真实性的检测。
打个比方来说,就是各方选手先要创造出一个能够辨别虚假信息的“火眼金睛”框架(建模),然后给“火眼金睛”提供文字和图片信息进行训练,不断提高“火眼金睛”的辨别能力。
“主办方提供了1200条中英文和图文混合的信息,我们最终达成的甄别成功率是91.76%,相当于可以从1200条信息中成功鉴别出1100多条,这在所有参赛队中是最高的。”彭浩表示,该参赛队首先是对数据梳理得比较好,其次是模型结构做得比较好。
他介绍,这次竞赛课题难度在于数据是多模态的,文字、图片都有,而且需要进行文字和图片间的交叉印证和判断,因此他们采用了一个双流的模型结构,能够让输入的文本和图像进行很好的交互融合。
此外,绝大部分用来鉴别的图文信息里,都会出现许多“噪音”,例如啰嗦、重复的话,错别字或语序不当等,这都会严重干扰“火眼金睛”的判断,因此如何去除这些“噪音”也非常重要。
在竞赛中,上述团队采用较为先进的算法,先将这些“噪音”提取出来后化繁为简,计算它们的相似度,再把十分相似的内容剔除掉,从而解除了“噪音”,只提取最主要的信息,大幅提高了检测虚假信息的效率和准确度。
提到自己特征鲜明的队名“与自己和解”的由来,彭浩有些腼腆地笑了笑。“在以前的学习和这次竞赛中,大伙有时感到压力很大,也有感到迷茫的时候,当时取这个名字也是想抛开不必要的思想包袱,专注于当下该做的事。”彭浩说,最终他们都做到了与自己和解,也赢下了这场竞赛。
创新思维比名次更重要
在本次竞赛决赛评委、华东师范计算机科学与技术学院副院长贺樑看来,这届竞赛选手总体水平很高,获奖队伍提出的方案也是各有特色。“有些队伍虽然并非经常参加比赛,但也能突出重围且成绩靠前,部分参赛队伍对题目有深层次的理解、剖析,想法有创新,这是特别值得推广的。应该让更多的学生认识到,参加比赛不应执着于名次,而是要善于激发创新思维和原创方法。”
贺樑表示,这次题目是与虚假信息检测相关,这是个有挑战性的、在我们身边的问题。谣言如何才能被快速发现?当人都难以判别时机器如何判定?机器给出的是谣言可能性的概率是否对大众有用?一条信息被判断为谣言时是否要给出理由?赛题除了比拼技能,还给了选手思考和探究的空间,这也是大赛选题的精彩之处。
“本次竞赛中不同队伍展示的虚假信息检测方案大都有实用价值,当然实际投入运用时,还需要关注用户在使用过程中对产品的需求特点。”贺樑认为,大赛成果对正在开展面向虚假信息检测产品的企业会带来启发和帮助。
西安交通大学副校长洪军表示,此次竞赛充分体现了产学融合、产教融合的巨大潜力。每一支参赛团队都是“信息清理大师”,用大数据和人工智能帮大家筛选出真实、有价值的信息,为社会治理提供了新的思路和方案,“期待通过国际竞赛等平台进一步深化产学研合作,一起推动人才培养的创新发展。”
中国工程院副院长王辰表示,今年的竞赛聚焦于跨学科复合型数字化人才的培养,强调选手解决复杂问题的综合能力与创新意识,从获奖选手身上,人们看到了人工智能和大数据发展的未来希望,“竞赛举办5届以来,选拔了大批人工智能创新人才,为人工智能与大数据技术在共建‘一带一路’国家和地区的共享与发展贡献了一份力量。”
市人大常委会副主任屈谦参加了7日举行的竞赛闭幕式和颁奖活动。
举报/反馈

相关标签:

发表评论:

评论记录:

未查询到任何数据!