当前位置:首页 > 新闻动态 > 大模型训练 >

2022
03/28
奇点智源携手阿里云助力开发者应用AI大模型
2020年美国非营利人工智能研究组织OpenAI发布了GPT-3超大规模预训练语言模型,并于当年6月开放了GPT-3 API接口。成千上万的中小开发者通过 大模型训练
奇点智源携手阿里云助力开发者应用AI大模型
2022
03/25
性能最高提升 6.9 倍,字节跳动开源大模型训练框架 veGiantModel
机器之心编辑部字节跳动 AML 团队内部开发了火山引擎大模型训练框架 veGiantModel,比 Megatron 和 DeepSpeed 更快。背景近些年,NL 大模型训练
性能最高提升 6.9 倍,字节跳动开源大模型训练框架 veGiantModel
2022
03/25
Swin Transformer迎来30亿参数的v2.0,我们应该拥抱视觉大模型吗?
2021年,获得 ICCV 最佳论文奖的 Swin Transformer,通过在广泛的视觉问题上证明 Transformer 架构的有效性,加速了计算机视觉领域基 大模型训练
Swin Transformer迎来30亿参数的v2.0,我们应该拥抱视觉大模型吗?
2022
03/24
中国信通院启动大模型系列标准编制工作
2021年12月,国务院印发《十四五数字经济发展规划》,指出要增强关键技术创新能力,提高数字技术基础研发能力,加快创新技术的工程化和产业 大模型训练
中国信通院启动大模型系列标准编制工作
2022
03/23
超级大脑!AI大模型有望重塑信息产业格局
《经济参考报》记者近日调研获悉,AI(人工智能)大模型相当于超级大脑,正成为人工智能新高地。AI大模型有望实现人工智能从感知到认知的跃 大模型训练
超级大脑!AI大模型有望重塑信息产业格局
2022
03/22
解读预训练大模型的2021年:人们正在逐渐驯服这些“庞然大物”
作者 | 曾冠荣,OPPO小布智能中心 NLP算法工程师审校 | 刘燕宝剑锋从磨砺出,预训练大模型持续发力。概 述距离 BERT 发布至今已经 大模型训练
解读预训练大模型的2021年:人们正在逐渐驯服这些“庞然大物”
2022
03/22
AI大模型:为产业智能化升级“开闸放电”
来源:科技日报人工智能作为新一代产业变革的核心驱动力之一,其发展已经从大炼模型逐步迈向炼大模型的阶段。通过设计先进的算法,整合尽可 大模型训练
AI大模型:为产业智能化升级“开闸放电”
2022
03/19
字节跳动开源大模型训练框架
来源:科技日报作者:刘艳科技日报记者 刘艳近日,字节跳动应用机器学习团队开源veGiantModel大模型训练框架。该训练框架主要应用于自然语言 大模型训练
字节跳动开源大模型训练框架
2022
03/18
国家超算济南中心:以济南为中心 构建世界超算互联网
国家超级计算济南中心科技园是以超算为主题的科技园,其全力打造中国超级计算大科学装置和大科学平台,提出以济南为中心,连接国内外超算中 大模型训练
国家超算济南中心:以济南为中心 构建世界超算互联网
2021
12/10
全球首个知识增强千亿大模型——鹏城-百度·文心:不止于拼参数量,更有内涵和根基
作者 | 青暮编辑 | 岑峰知识是内涵,算力设施和训练框架是根基。或许很难想象,从晶体管的每个具有确定性的0和1之间的变换,到最后也能 大模型训练
全球首个知识增强千亿大模型——鹏城-百度·文心:不止于拼参数量,更有内涵和根基
2021
11/12
512颗GPU、10万亿参数!阿里达摩院发布全球最大AI预训练模型
来源: 站长之家11月8日,阿里巴巴达摩院公布了多模态大模型M6的最新进展,其参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型。作为 大模型训练
512颗GPU、10万亿参数!阿里达摩院发布全球最大AI预训练模型
2021
04/27
中国AI研究新突破,鹏城实验室发布首个全开源两千亿参数中文预训练语言模型——“盘古α”
2021年4月26日,在深圳召开的HDC全球开发者大会上,鹏城实验室鹏城云脑技术总师、北京大学教授田永鸿发布了业界首个全开源2000亿参数中文预 大模型训练
中国AI研究新突破,鹏城实验室发布首个全开源两千亿参数中文预训练语言模型——“盘古α”