当前位置:首页 > 新闻动态 > 大模型训练 >

2022
09/02
WAIC2022|华院计算宣晓华:算法技术可持续发展,需要产业和基础设施支撑。
21世纪经济报道记者江月 上海报道让数字人专业导引客户、让机器视觉在工业生产线上发挥监测功能……人工智能正在生产、生活中大量进行应用 大模型训练
WAIC2022|华院计算宣晓华:算法技术可持续发展,需要产业和基础设施支撑。
2022
09/01
通用多模态基础模型BEiT-3:引领文本、图像、多模态预训练迈向“大一统”
大数据文摘转载自微软研究院AI头条近年来,基础模型(foundation models,也被称为预训练模型)的研究从技术层面逐渐趋向于大一统(the b 大模型训练
通用多模态基础模型BEiT-3:引领文本、图像、多模态预训练迈向“大一统”
2022
09/01
模型开源还强大?神秘公司成了吊打巨头和学阀的AI “第三极”
AI 生成图片,最近超级火的一项尖端技术。火到什么程度,以至于已经有公司开始套个壳就出道了……本周有消息曝出,一家创业公司 WriteSon 大模型训练
模型开源还强大?神秘公司成了吊打巨头和学阀的AI “第三极”
2022
09/01
DeeCamp2022 结营:蛋白质组学 AI 大数据模型夺冠
【TechWeb】8 月 31 日消息,DeeCamp2022 人工智能训练营总冠军答辩暨结营典礼今日在创新工场北京总部举行。经过精彩答辩,挑战大规模 大模型训练
DeeCamp2022   结营:蛋白质组学 AI 大数据模型夺冠
2022
08/24
空天•灵眸:首个面向跨模态遥感数据的生成式预训练大模型
文章转载自微信公众号空天信息,内容由中国科学院空天信息创新研究院地理与赛博空间信息技术研究部(二部)提供,版权归原作者及刊载媒体所 大模型训练
空天•灵眸:首个面向跨模态遥感数据的生成式预训练大模型
2022
08/22
消费级GPU成功运行1760亿参数大模型
在消费级 GPU 上运行大规模模型是机器学习社区正面临的挑战。  语言模型的规模一直在变大,PaLM 有 540B 参数,OPT、GPT-3 和 BLO 大模型训练
消费级GPU成功运行1760亿参数大模型
2022
08/20
中国推出全新预训练深度势能模型DPA-1,对分子模拟产生深远影响
DPA-1 模型的提出证明了基于大模型实现‘预训练+少量数据微调’流程的可行性。这是是势能函数生产的新范式,也是未来一系列工作 大模型训练
中国推出全新预训练深度势能模型DPA-1,对分子模拟产生深远影响
2022
08/17
大模型时代,那些一起训练AI模型的企业是怎么应对数据顾虑的?
机器之心原创作者:张倩为训练数据建一个TB级计算「飞地」,联邦学习的靠谱实现方式了解一下?2017 年,著名杂志《经济学人》发表封面文章 大模型训练
大模型时代,那些一起训练AI模型的企业是怎么应对数据顾虑的?
2022
08/13
百度CTO王海峰:以飞桨为基攀登大模型技术高地
人工智能已经成为新一轮科技革命和产业变革的重要驱动力量。在近日举办的中国自动化大会上,百度首席技术官、深度学习技术及应用国家工程实 大模型训练
百度CTO王海峰:以飞桨为基攀登大模型技术高地
2022
08/11
ECCV 2022 Oral | 自反馈学习的mixup训练框架—AutoMix
论文标题:AutoMix: Unveiling the Power of Mixup for Stronger Classifiers作者单位:浙江大学,西湖大学论文链接:https: arxi 大模型训练
ECCV 2022 Oral | 自反馈学习的mixup训练框架—AutoMix
2022
08/10
会写代码的AI开源了!C语言写得比Codex还好,掌握12种编程语言丨CMU
推荐语:近期,代码的大型语言模型 (LM)在完成代码和从自然语言描述合成代码方面显示出巨大的潜力。然而,当前最先进的代码 LM(例如 Co 大模型训练
会写代码的AI开源了!C语言写得比Codex还好,掌握12种编程语言丨CMU
2022
08/10
如何高效、精准地进行图片搜索?看看轻量化视觉预训练模型
你是否有过图像检索的烦恼? 或是难以在海量化的图像中准确地找到所需图像,或是在基于文本的检索中得到差强人意的结果。 对于这个难题, 大模型训练
如何高效、精准地进行图片搜索?看看轻量化视觉预训练模型
2022
08/09
首次入选OSDI顶会!腾讯提出超大规模推荐系统的模型低延时更新方案
022-08-09 12:10论文标题:Ekko: A Large-Scale Deep Learning Recommender System with Low-Latency Model Update收录会议:OS 大模型训练
首次入选OSDI顶会!腾讯提出超大规模推荐系统的模型低延时更新方案
2022
08/08
Meta开放大语言模型OPT-175B,被用于蛋白质设计、量子物理学
据了解,自 Meta 在 2022 年 5 月宣布大语言模型 OPT-175B 以来,已收到全球超过 4500 名个人和机构的访问请求。OPT-175B 是首 大模型训练
Meta开放大语言模型OPT-175B,被用于蛋白质设计、量子物理学
2022
08/08
超越CLIP的多模态模型,只需不到1%的训练数据,南加大最新研究来了
羿阁 发自 凹非寺量子位 | 公众号 QbitAI火爆全网的AI绘画你玩了吗?女娲无限版、DALL·E2、Imagen……这些通过文字生成图像的AI绘画 大模型训练
超越CLIP的多模态模型,只需不到1%的训练数据,南加大最新研究来了
2022
08/01
基于昇腾AI的“紫东太初”大模型获中国算力大会大奖
7月29-31日,首届中国算力大会在济南举行。大会现场,基于昇腾AI基础软硬件平台、由中国科学院自动化研究所联合华为打造的紫东太初人工智能 大模型训练
基于昇腾AI的“紫东太初”大模型获中国算力大会大奖
2022
07/21
世界首个航天领域大模型问世 AI入团深空探测
科技日报记者 刘艳 实习记者 都芃世界首个航天领域大模型——航天-百度·文心大模型在21日举办的2022百度世界大会发布,这项我国预训练 大模型训练
世界首个航天领域大模型问世 AI入团深空探测
2022
07/21
人人都能用的多语种大模型来了,支持59种语言,参数1760亿,1000名科学家联合发起
丰色 发自 凹非寺量子位 | 公众号 QbitAI一直以来,很多大模型都由造它们出来的大型私营科技公司垄断着。比如GPT-3等,对于普通人来说 大模型训练
人人都能用的多语种大模型来了,支持59种语言,参数1760亿,1000名科学家联合发起
2022
07/20
运营商AI机遇:以大模型拓展全新赛道
东数西算正在成为各行业的普遍机遇,对于运营商来说也是如此。东数西算带来了全新的算力网络建设需求,以及各行业普遍的网络升级需求。在这 大模型训练
运营商AI机遇:以大模型拓展全新赛道
2022
07/13
1块GPU+几行代码,大模型训练提速40%!无缝支持HuggingFace
明敏 发自 凹非寺量子位 | 公众号 QbitAI不得不说,为了让更多人能用上大模型,技术圈真是各出奇招!模型不够开放?有人自己上手搞免 大模型训练
1块GPU+几行代码,大模型训练提速40%!无缝支持HuggingFace
2022
07/04
剪掉ImageNet 20%数据量,模型性能不下降!方法来自Meta斯坦福等
明敏 发自 凹非寺量子位 | 公众号 QbitAI这两天,推特上一个任务悬赏火得一塌糊涂。一家AI公司提供25万美金(折合人民币约167万元), 大模型训练
剪掉ImageNet 20%数据量,模型性能不下降!方法来自Meta斯坦福等
2022
07/02
谷歌、DeepMind发现大语言模型突现能力,可推动自然语言处理研究
关于 AI 未来发展的一个关键话题是,扩大规模是否会导致模型的质量产生较大变化。最近,来自谷歌研究院、斯坦福大学、北卡罗来纳大学教堂 大模型训练
谷歌、DeepMind发现大语言模型突现能力,可推动自然语言处理研究
2022
07/01
OPPO小布推出预训练大模型OBERT,晋升KgCLUE榜首
近日,OPPO小布助手团队和机器学习部联合完成了十亿参数模型OBERT的预训练,业务上取得了4%以上的提升;在行业对比评测中,OBERT跃居中文语 大模型训练
OPPO小布推出预训练大模型OBERT,晋升KgCLUE榜首
2022
06/27
可翻译语言的模型也会“胡言乱语”? 大型多语言模型BLOOM拥有1760亿个参数,可有效避免偏见产生
在计算机领域,作为算法的其中一类,大型语言模型的用途日益广泛。它可以学习数十亿个单词和短语之间的统计关联,并完成语言翻译、摘要生成 大模型训练
可翻译语言的模型也会“胡言乱语”? 大型多语言模型BLOOM拥有1760亿个参数,可有效避免偏见产生
2022
06/26
深度报告:大模型驱动 AI 全面提速,黄金十年开启
深度报告:大模型驱动 AI 全面提速,黄金十年开启三起三落后,AI行业能否一飞冲天?智东西2022 06 26 11:03浏览 4 2w编辑 | 智东西内 大模型训练
深度报告:大模型驱动 AI 全面提速,黄金十年开启