大模型训练 - 智算网络联盟

当前位置：首页 > 新闻动态 > 大模型训练 >

2022

03/28

奇点智源携手阿里云助力开发者应用AI大模型

2020年美国非营利人工智能研究组织OpenAI发布了GPT-3超大规模预训练语言模型,并于当年6月开放了GPT-3 API接口。成千上万的中小开发者通过大模型训练

2022

03/25

性能最高提升 6.9 倍，字节跳动开源大模型训练框架 veGiantModel

机器之心编辑部字节跳动 AML 团队内部开发了火山引擎大模型训练框架 veGiantModel，比 Megatron 和 DeepSpeed 更快。背景近些年，NL 大模型训练

2022

03/25

Swin Transformer迎来30亿参数的v2.0，我们应该拥抱视觉大模型吗？

2021年，获得 ICCV 最佳论文奖的 Swin Transformer，通过在广泛的视觉问题上证明 Transformer 架构的有效性，加速了计算机视觉领域基大模型训练

2022

03/24

中国信通院启动大模型系列标准编制工作

2021年12月，国务院印发《十四五数字经济发展规划》，指出要增强关键技术创新能力，提高数字技术基础研发能力，加快创新技术的工程化和产业大模型训练

2022

03/23

超级大脑!AI大模型有望重塑信息产业格局

《经济参考报》记者近日调研获悉，AI（人工智能）大模型相当于超级大脑，正成为人工智能新高地。AI大模型有望实现人工智能从感知到认知的跃大模型训练

2022

03/22

解读预训练大模型的2021年：人们正在逐渐驯服这些“庞然大物”

作者 | 曾冠荣，OPPO小布智能中心 NLP算法工程师审校 | 刘燕宝剑锋从磨砺出，预训练大模型持续发力。概述距离 BERT 发布至今已经大模型训练

2022

03/22

AI大模型：为产业智能化升级“开闸放电”

来源：科技日报人工智能作为新一代产业变革的核心驱动力之一，其发展已经从大炼模型逐步迈向炼大模型的阶段。通过设计先进的算法，整合尽可大模型训练

2022

03/19

字节跳动开源大模型训练框架

来源:科技日报作者:刘艳科技日报记者刘艳近日，字节跳动应用机器学习团队开源veGiantModel大模型训练框架。该训练框架主要应用于自然语言大模型训练

2022

03/18

国家超算济南中心：以济南为中心构建世界超算互联网

国家超级计算济南中心科技园是以超算为主题的科技园，其全力打造中国超级计算大科学装置和大科学平台，提出以济南为中心，连接国内外超算中大模型训练

2021

12/10

全球首个知识增强千亿大模型——鹏城-百度·文心：不止于拼参数量，更有内涵和根基

作者 | 青暮编辑 | 岑峰知识是内涵，算力设施和训练框架是根基。或许很难想象，从晶体管的每个具有确定性的0和1之间的变换，到最后也能大模型训练

2021

11/12

512颗GPU、10万亿参数！阿里达摩院发布全球最大AI预训练模型

来源: 站长之家11月8日，阿里巴巴达摩院公布了多模态大模型M6的最新进展，其参数已从万亿跃迁至10万亿，成为全球最大的AI预训练模型。作为大模型训练

2021

04/27

中国AI研究新突破，鹏城实验室发布首个全开源两千亿参数中文预训练语言模型——“盘古α”

2021年4月26日，在深圳召开的HDC全球开发者大会上，鹏城实验室鹏城云脑技术总师、北京大学教授田永鸿发布了业界首个全开源2000亿参数中文预大模型训练

公告 & 通知

智算网络联盟标准第二次讨论会议通知
22-03-18
智算网络联盟标准第一次讨论会议通知
22-03-18