中广格兰旗下网站:中广互联  格视网  卫星界  社区
登录注册

登录X

没有账号?  快速注册>

首页新闻正文

重庆首个自主研发大语言模型发布

导语:在研发过程中,研究团队把该模型的小型化部署作为研发重点,大幅降低了模型训练和推理成本。

  记者7月15日获悉,上海交通大学重庆人工智能研究院“兆言”大模型发布会日前在西部(重庆)科学城召开,会上发布了该研究院最新成果——“兆言”大模型产品(以下简称“兆言”大模型),这是重庆首个自主研发的大语言模型。

  据了解,“兆言”大模型是上海交通大学重庆人工智能研究院基于其AI大模型技术研发出的最新成果。它通过积累海量数据,运用独特的数据处理和AI训练技术,达到了精准、专业的文本输出,实现了以自然语言选择、调用应用程序。

  “和通用大模型相比,‘兆言’大模型拥有领域精调效率高、训练推理成本低、人机交互能力强的特点。”上海交通大学重庆人工智能研究院院长、首席科学家金石介绍,通用大模型在行业落地方面面临许多困难。比如,未经行业精调的通用大模型在行业应用中表现不佳、通用大模型需要的算力资源不易进行私有化部署、自然语言转应用程序接口(API)调用不稳定等。

  “兆言”大模型较好地解决了这些问题。该模型采用启发式数据过滤及增强、模型预训练和精调自适应比例混合、人工和自动评测相结合等方法对模型进行垂直领域精调,解决了精调中的数据质量差、模型训练效率低等行业难题,使模型答案质量有了较好保障。

  在研发过程中,研究团队把该模型的小型化部署作为研发重点,大幅降低了模型训练和推理成本。在商业化所需特定任务上,该模型在不降低回答质量的前提下,调用成本仅为小型化前的四百分之一,从而保障了以该模型为基础的产品在市场上的竞争力。

  为解决在自然语言转API调用任务上模型发挥不稳定的问题,研发团队还建立了专有的自然语言调用语料和指令数据集,从而实现了大语言模型对其他系统的精准调用。

【责任编辑: 王熙雁 】

推荐阅读

热门标签

作者专栏更多

关注我们

    中广互联
  1. 大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。

  2. 电视瞭望塔
  3. 集合电视台、网络视听、潮科技等各种好玩信息。

  4. 5G Plus
  5. 专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。

  6. 4K8K
  7. UHD、4K、8K的最新资讯和最深入的分析,都在这里。

  8. 中广圈子
  9. 视频产业的专业圈子,人脉、活动、社区,就等你来。

  10. 格兰研究
  11. 我们只沉淀有深度的信息和数据。

  12. 卫星界
  13. 致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。