当前位置:首页 > 新闻动态 >

2022
05/05
深层解析符号模型与深度学习预训练模型
分享嘉宾:李维博士NLP scientist编辑整理:陈昱彤 纽约大学出品平台:DataFunTalk导读:NLP (自然语言处理) 技术的深入发展主要有两条 综合新闻
深层解析符号模型与深度学习预训练模型
2022
05/04
千亿参数大模型首次被撬开!Meta 复刻 GPT-3“背刺”OpenAI,完整模型权重及训练代码全公布
千亿级参数 AI 大模型,竟然真的能获取代码了?!一觉醒来,AI 圈发生了一件轰动的事情:Meta AI 开放了一个重达1750 亿参数的大语言 大模型训练
千亿参数大模型首次被撬开!Meta 复刻 GPT-3“背刺”OpenAI,完整模型权重及训练代码全公布
2022
04/29
Transformer论文引用破4万,两位作者离开谷歌创业
原创 Synced 机器之心机器之心报道编辑:张倩「在谷歌,我们训练出了越来越大的 Transformer,梦想着有朝一日构建一个通用模型来支持所 综合新闻
Transformer论文引用破4万,两位作者离开谷歌创业
2022
04/29
“混元”AI大模型刷新CLUE分类榜历史记录
4月29日,腾讯混元AI大模型在CLUE(中文语言理解评测集合)分类榜中取得第一名,分数突破 80 888分,接近人类语言理解能力,刷新该榜单历 大模型训练
“混元”AI大模型刷新CLUE分类榜历史记录
2022
04/29
超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 1
文章简介本文从视觉问答(VQA)任务出发,讲述了 2015 年任务的定义开始,接踵出现的各种多模态技术。从无注意力机制的深度学习模型,发 综合新闻
超50篇论文串联起从VQA到多模态预训练大模型的前世今生—Part 1
2022
04/29
以多样性计算,构建算力网络坚实根基
华为第19届全球分析师大会(HAS2022)在深圳召开。大会聚焦未来探索、产业创新、数字化与低碳化等话题,与全球行业分析师、财经分析师、意 运营商算力网络建设
以多样性计算,构建算力网络坚实根基
2022
04/29
中国信通院发布《数据中心白皮书》
数字经济时代,算力正在成为一种新的生产力,为千行百业的数字化转型提供基础动力。数据中心是算力的物理承载,是数字化发展的关键基础设施 运营商算力网络建设
中国信通院发布《数据中心白皮书》
2022
04/29
“东数西算”京津冀国家枢纽节点建设在津启动
中国联通高度重视同天津市政府的合作,双方于2021年3月17日共同签订《十四五时期推动京津冀协同发展打造全 5G 城市战略合作协议》,全面 东数西算
“东数西算”京津冀国家枢纽节点建设在津启动
2022
04/29
工业互联网规模将超11万亿 大数据中心建设加快落地
作为信息技术与制造技术深度融合的重要载体,工业互联网将成为我国制造企业数字化转型升级的必经之路。随着数字化转型浪潮不断推进,工业互 东数西算
工业互联网规模将超11万亿 大数据中心建设加快落地
2022
04/28
中国信通院发布《数据中心白皮书》 2022年04月28日 09:58 来源: 人民邮电报12
  图1 我国数据中心机架规模  图2 我国数据中心市场规模  数字经济时代,算力正在成为一种新的生产力,为千行百业的数字化转型提供 综合新闻
中国信通院发布《数据中心白皮书》 2022年04月28日 09:58 来源: 人民邮电报12
2022
04/28
字节跳动开源 CowClip:推荐模型单卡训练最高加速72倍
在 NLP 和 CV 任务上,为了加速神经网络的训练,借助 32K 的批量大小(batch size)和 8 块 GPU,只需 14 分钟就完成 ImageNe 大模型训练
字节跳动开源 CowClip:推荐模型单卡训练最高加速72倍
2022
04/27
EasyNLP开源|中文NLP+大模型落地,EasyNLP is all you need
一 导读随着BERT、Megatron、GPT-3等预训练模型在NLP领域取得瞩目的成果,越来越多团队投身到超大规模训练中,这使得训练模型的规模从亿级 大模型训练
EasyNLP开源|中文NLP+大模型落地,EasyNLP is all you need
2022
04/22
第二届中国IDC行业Discovery大会顺利召开 院士专家云端热议“东数西算”
来源:金融界  4月21日,一场别开生面的主题为聚光奔赴的数据中心行业大会圆满落下帷幕。由中国通信工业协会数据中心委员会指导,中国IDC 综合新闻
第二届中国IDC行业Discovery大会顺利召开 院士专家云端热议“东数西算”
2022
04/22
大模型 GPT-4 预测长这样:比 GPT-3 略大、纯文本、更注重最优计算与对齐
不久前,谷歌发布基于他们最新一代人工智能架构 Pathways 研发的 5400 亿参数大模型 ——PaLM,具备标记因果关系、上下文理解、推理、 大模型训练
大模型 GPT-4 预测长这样:比 GPT-3 略大、纯文本、更注重最优计算与对齐
2022
04/22
三个关键词阅读中兴通讯:增长动能、第二曲线、新技术
眼下,数字经济正迎来快速和协同发展浪潮,作为基础设施提供商,中兴通讯在期间的定位和成长性备受关注。4月21日下午举行的中兴通讯举行202 运营商算力网络建设
三个关键词阅读中兴通讯:增长动能、第二曲线、新技术