5月19日,在第七届世界智能大会上,由国家超级计算天津中心“天河E级智能计算开放创新平台”训练研发的“天河天元大模型”正式发布。该模型是立足国产天河超级算力和智能算力,汇集构建中文大数据集,由平台自主训练研发的大型模型。
生成式通用智能是重大变革性突破。以ChatGPT为代表的生成式智能开启了人工智能发展新阶段。与单一判别式智能工具不同,生成式智能是文本生产、数据分析、代码编写、图像生成等跨媒体多模态领域的通用智能工具,将渗入到生产、教育、工作生活等场景,并对人类生产方式、思想认知、社会治理等带来变革性影响,将重塑人与智能机器生产关系。
训练模型以数据和算力为基础。谷歌BERT、OpenAI的GPT和百度文心大模型其参数规模已提升至千亿、万亿,并随之带来巨大的数据量级需求。
天津依托天河占据了全国超过20%的超级计算算力资源,成为算力赋能科技创新和产业发展重镇。天河E级智能计算开放创新平台将带来突破百亿亿次的多精度融合超级计算算力。
天津超算中心搜集整理了网页数据、各种开源训练数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集,训练打造了自主研发的中文语言大模型——天河天元大模型。同时启动面向医疗、工业、法律等领域专业模型深度训练,模型将作为产业智能化升级基座,用专业数据集,打造更贴合行业领域的智能化高水平“专家”。
未来,以生成式AI为基座的产业链,将成为智能化升级过程中可大规模复用的基础设施。在大模型通用性、泛化性以及降低人工智能应用门槛的优势推动下,人工智能也将会加快落地,形成新的机遇。(经济日报记者 商瑞)
(责任编辑:冯虎)
相关标签: