5月28日,广东省人工智能与机器人产业创新产品与服务发布会(珠海专场)暨珠海云上智城产业发展大会在珠海举行,会场设置了人工智能与机器人创新产品与服务展示区,集中展示了108件珠海人工智能芯片、大模型、机器人及零部件、智能终端等创新产品与服务。

“数据是一切智能的基石,也是制约人工智能落地最后一公里的核心要素。”深译信息科技(珠海)有限公司董事长、CEO林余楚说。在林余楚看来,面对第四代工业革命,中国在模型、算力、数据等方面要有自己的代表企业,大模型出海面对着社会文化背景的差异,如果缺少本地化数据集,会导致难以实现高质量的专业训练及推理。

活动现场,林余楚发布了大模型深数引擎。据介绍,深数引擎包括国际化众包平台,数据合成增强平台,AI 预标注等系统工具,涵盖了“采、洗、标、测、用” 五位一体的数据采标体系, 构建了闭环数据采标 SOP 流程。为 AI 数字底座提供高质量数据集和数据服务的技术保障,实现数据生产及服务降本增效,提质提量,助力AI 产业高质量发展。

高质量数据如何助力大模型出海?林余楚以此前发布的葡语大模型为例,通过自研小参数模型和DeepSeek-32B 基座二次训练调优,再通过深译科技算料数据资产包的训练,大模型不仅可以对大三巴牌坊等文化遗产进行更专业解说、互动问答,还能在外贸公司外贸业务员与葡语国家客户沟通、谈判、签订合同时进行服务。

文 | 记者 许张超 李旭 实习生 杨蔚钧

责编: 校对: 审签:
本文记者
版权申明

羊城晚报·羊城派原创,未经授权不得转载