中国电信将于年内开源千亿级参数大模型

admin 轻心小站 关注 LV.19 运营
发表于站长交流版块 新鲜事

近日中国电信开源了 12B 参数规模星辰语义大模型 TeleChat-12B。相较于 1 月开源的 7B 版本,内容、性能和应用等方面整体效果提升了 30%。其中,多轮推理、安全问题等领域提升超 40

近日中国电信开源了 12B 参数规模星辰语义大模型 TeleChat-12B。相较于 1 月开源的 7B 版本,内容、性能和应用等方面整体效果提升了 30%。其中,多轮推理、安全问题等领域提升超 40%。另外,据了解,中国电信将于年内开源千亿级参数大模型。

根据介绍,TeleChat-12B 将 7B 版本 1.5T 训练数据提升至 3T,优化数据清洗、标注策略,持续构建专项任务 SFT(监督微调)数据,优化数据构建规范,大大提升数据质量;同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。

TeleAI 通过更彻底地开源推动大模型技术进步和大模型国产化进程。此次开源提供基础模型以及基于相应版本的对话模型、不仅支持传统的全量参数更新还支持 LoRA 等只更新部分参数的高效微调方法、支持 Deepspeed 微调、支持 int8、int4 量化和国产芯片训练推理,推动大模型国产化进程。

与此同时,星辰大模型也在深入推动人工智能与各行各业的融合,积极探索新兴的应用场景。星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景。行文写作方面,平均生成字数超过 1500 字,有效采纳率为 85.7%。

早在 2023 年年报中,中国电信就表示,2024 年公司将把握以人工智能为代表的新一轮科技革命和产业变革趋势。

开源项目地址:https://gitee.com/Tele-AI/tele-chat

文章说明:

本文原创发布于探乎站长论坛,未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,探乎站长论坛平台仅提供信息存储空间服务。

评论列表 评论
发布评论

评论: 中国电信将于年内开源千亿级参数大模型

粉丝

0

关注

0

收藏

0

已有0次打赏