当前位置:首页>焦点 > >正文

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!-全球视点

  • 2023-04-13 11:19:04来源:网易财经综合

(原标题:重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!)

本文来源:AIGC开放社区


(资料图片仅供参考)

用户通过Deep Speed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型,这标志着一个人手一个ChatGPT的时代要来了。

4月12日,微软宣布开源了Deep Speed Chat,帮助用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT!(开源地址:https://github.com/microsoft/DeepSpeed)

据悉,Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。

简单来说,用户通过Deep Speed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型,这标志着一个人手一个ChatGPT的时代要来了。

微软为什么开源Deep Speed Chat

ChatGPT只用了几个月的时间便席卷全球,成为史上用户增长速度最快的消费级应用,对世界的经济发展、科技研发起到了重要的推动作用。很多企业、个人用户纷纷想参与到这场AI技术变革中,但由于庞大的资源、资金投入只能望而却步。

即便开源领域推出了LLaMa、Alpaca、Vicuna、Databricks-Dolly等优秀的类ChatGPT项目,仍缺乏一个支持端到端的基于RLHF的规模化系统,使得训练强大的类ChatGPT模型非常艰难

例如,使用上述开源项目训练一个67亿参数的类ChatGPT模型,通常需要昂贵的多卡至多节点的GPU集群,但这些资源对大多数科学家、小型企业、个人开发者而言难以获取。

即便是拥有这样的资源,现有的开源系统的训练效率通常还不到,这些机器所能达到的最大效率的5%

现在,通过Deep Speed Chat解决资源、算法等难题,轻松、高效的训练数千亿参数的最先进的类ChatGPT模型。

Deep Speed Chat技术简单介绍

ChatGPT模型的训练是基于InstructGPT论文中的RLHF方式,这使得现有深度学习系统在训练类ChatGPT模型时存在种种局限。现在,通过Deep Speed Chat可以突破这些训练瓶颈,达到最佳效果。

Deep Speed Chat拥有强化推理、RLHF模块、RLHF系统三大核心功能。

简化ChatGPT类型模型的训练和强化推理:只需一个脚本即可实现多个训练步骤,包括使用Huggingface预训练的模型、使用DeepSpeed-RLHF系统运行InstructGPT 训练的所有三个步骤,生成属于自己的类ChatGPT模型。此外,还提供了一个易于使用的推理API,用于在模型训练后测试对话性能。

Deep Speed-RLHF模块:DeepSpeed-RLHF 复刻了InstructGPT 论文中的训练模式,并确保包括:a) 监督微调(SFT),b) 奖励模型微调和 c) 基于人类反馈的强化学习(RLHF)在内的三个步骤与其对应。此外,还提供了数据抽象和混合功能,以支持用户使用多个不同来源的数据源进行训练。

DeepSpeed-RLHF系统:将DeepSpeed的训练和推理能力整合到统一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于RLHF 训练。DeepSpeed-HE 能够在RLHF中无缝地在推理和训练模式之间切换,使其能够利用来自 DeepSpeed-Inference 的各种优化。

例如,张量并行计算和高性能CUDA算子进行语言生成,同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE可以自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。

此外,Deep Speed Chat在成本、效率、扩展性等方面非常优秀。

高效且节省成本:在Azure云上只需9小时即可训练一个OPT-13B模型,只需18小时即可训练一个 OPT-30B模型。这两种训练分别花费不到300美元和600美元。

卓越扩展性:能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。因此,即使是一个拥有130亿参数的模型,也只需1.25小时就能完成训练。而对于拥1750亿参数的模型,使用Deep Speed Chat进行训练也只需不到一天的时间。

注意:在Azure上训练时由于GPU不同,所以训练时间和费用也各不相同。

全民ChatGPT时代来了

做个不太恰当的比喻,微软此次开源Deep Speed Chat就像当年的互联网,为了提升发展速率降低了台式机的价格,使得普通用户也能拥有自己的电脑。

只有参与的用户多了,整个行业生态才能快速壮大发展,所以,微软此次开源对整个ChatGPT生态发展起到了至关重要的推动作用,使得人人都能拥有自己的ChatGPT。

目前,ChatGPT处于初级发展阶段,存在安全隐患、数据隐私、道德等问题。相信随着参与用户的增多,这些难题将会被有效的解决,从而为全球经济发展做出贡献。

标签:

延伸阅读

推荐阅读

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!-全球视点

重磅!微软开源DeepSpeedChat,人人拥有ChatGPT!,chatgpt,微软,chat,speed,deep,扩展性

全球快播:山钢集团旗下山信软件产销信息系统助力钢铁主业效益提升

“这个月中厚板库存较少,请加大生产力度,全力以赴排产。”3月23日,看着生产调度室大屏关于中厚板库存告急的提示,山钢集团

美股成交额前20:阿里大跌近6% 软银计划减持大部分持股

【美股成交额前20:阿里大跌近6%软银计划减持大部分持股】第8名阿里巴巴收跌5 93%,成交32 2亿美元。在参加完阿里巴巴云计算峰会后,杰富瑞分

焦点信息:男生过生日送什么礼物好

男生过生日送什么礼物好。我是男生,大学毕业,大家给点建议吧,送什么生日礼物好。是男生,最好不要太贵的,有没有好的建议。

天天新消息丨动力电池年产能达110GWh!贵州省新能源动力电池及材料研发生产基地建设规划发布

国际能源网 储能头条(微信号:chuneng365)获悉,4月12日,贵州省工业和信息化厅发布《贵州省新能源动力电池及材料研发生产基地建设规划(2022-203

有趣的倒顺词相声全部 有趣的倒顺词相声

今天来聊聊关于有趣的倒顺词相声全部,有趣的倒顺词相声的文章,现在就为大家来简单介绍下有趣的倒顺词相声全部,有趣的倒顺词相声,希望对

博思软件(300525):4月12日北向资金减持13.98万股

4月12日北向资金减持13 98万股博思软件。近5个交易日中,获北向资金减持的有3天,累计净减持76 42万股。近20个交易日中,获北向资金增持的有11

阿司匹林能祛痘印吗?阿司匹林祛痘印的好方法是什么? 焦点速看

阿司匹林是一种西药,它里面包含了很多的高分子成分,这种药我们一般是用来治疗感冒、发烧这种疾病的,但是它也存在一定的副作用 [详细]

每日短讯:hpa病毒是什么意思_hpa

1、帕斯卡(符號Pa)是國際單位制(SI)的壓強單位。2、在不致混淆的情況下,可簡稱帕。3、它等於一牛頓每平方米。4、以法國數學家、物理學家

潘树广自选集_关于潘树广自选集介绍 时讯

1、本书共分语言文学篇、文献学篇、辞书学篇、编辑出版篇、散文杂著篇、自序和自述篇六篇。2、主要内容包括:古代文学教学

美国总统拜登:我希望北爱尔兰政府能够尽快恢复。

美国总统拜登:我希望北爱尔兰政府能够尽快恢复

2022长三角区域协同创新指数发布 成果共用指标年均增速达13.98%

2022长三角区域协同创新指数发布成果共用指标年均增速达13.98%,协同创新,共用指标,长三角地区,城市软实力

“骚扰”女下属被停职 高校院长被曝即将回归教学管理工作

封面新闻记者刘虎受访者供图“停职后坐等风平浪静,待被大众遗忘,便卷土重来吗?”4月11日,面对学院即将更换主要负责人的通知,重庆移通...

全球快报:浅谈电能管理系统在智能轨道交通中的设计与应用

朱鹍安科瑞电气股份有限公司上海嘉定201801摘要:城市轨道交通可以市民出行方式的空缺,它的运行需要有持续的电能提供支持。为了给轨道交通营

世界焦点!全球传真丨为何美国控制的生物实验室遍布中国周边国家?

虽然高危病原体泄漏的风险引起国际社会的高度关注,但美国多年来一直是唯一反对建立《禁止生物武器公约》多边核查机制的国家

日本企业物价指数增幅连续第三个月放缓

新华社东京4月12日电日本央行12日公布的初步统计结果显示,今年3月日本企业物价指数同比上涨7 2%至119 4,增幅连续第三个月放缓。  报告显示

两度分拆告吹,2022利润大增1663.98%,中天科技再涨停难? 世界快看点

4月10日盘后,中天科技发布2022年度业绩快报。2022年,公司实现归属于母公司净利润32 14亿元,同比增长1663 98%。公司认为,聚焦主营业务(光

搭载骁龙 695 处理器,售价 1999 元,OPPO A1 开启预售 焦点热文

今日OPPOA15G开启预售。OPPOA1采用了素皮材质后盖,搭载骁龙695处理器,5000mAh大电池+67W超级闪充、120Hz高刷高亮广色域屏,拥有12GB超大运存

郭富城带方媛全家出游购物,翁婿同框差距大,两人聊天不超过三秒 每日观点

郭富城一直站在原地,期间,他曾与一名戴着口罩的中年男子对话,原来对方是城城岳父、方媛的父亲。郭富城与岳父的年龄相差不大,此前,他们的

天天快消息!胎动在哪个位置_胎动在什么位置

1、月经周期正常的女性,在怀孕20周,也就是5个月的时候,可以明显感觉到下腹部宫腔内的胎动。2、因为20周的时候,宫底达

萌娃街头走失 民警暖心救助 环球头条

本网讯(草原全媒·正北方网记者 刘 惠)4月10日17时许,呼和浩特

环球速递!“走神”十几秒,事故一瞬间

“走神”十几秒,事故一瞬间

中石油重大人事变动!焦方正不再担任党组成员、副总经理!

中石油重大人事变动!焦方正不再担任党组成员、副总经理!,相关信息显示,焦方正不再担任中国石油集团党组成员、副总经理一职。目前中国石油官

云南锗业(002428)4月11日主力资金净卖出2138.85万元

截至2023年4月11日收盘,云南锗业(002428)报收于12 25元,上涨3 9%,换手率6 19%,成交量39 86万手,成交额4 81亿元。

全球快播:山东凯马汽车制造有限公司

1、山东凯马汽车制造有限公司占地1100亩,总资产30亿元,员工3000余名,是一家集研发、生产、销售、服务于一体的大型

两头雨中间晴 平均气温超20℃_全球信息

本报讯信息日报全媒体记者王琴红报道:4月10日,记者从江西省气象台获悉,预计4月中旬,旬前期(11日~14日)多降水,旬中期(15日~17日)为晴到

干天麻的保存方法?

1、低温保存法;将干透的天麻用塑料袋装好,放入冰箱冷藏柜内。这样一来可以防天麻在冰箱内受潮,二来也可以避免冰箱内物品串味,或药味走失。

精彩看点:锦江酒店: 锦江酒店第十届监事会第六次会议决议公告

锦江酒店:锦江酒店第十届监事会第六次会议决议公告

猫咪有这几种表现,说明要驱虫了

有朋友跟我说,他家猫咪突然变得嗜睡,以前很爱干饭,但是现在都没胃口吃饭了,是不是受到发情的影响。一般来说,发情的猫咪会更加活跃,所以

光大银行:零售营收占比超40%利润占比仅为14%

由于业务费的居高不下和信用成本的高增长,使得即使零售金融营业收入实现增长,也无法大幅增加光大银行的零售业务利润,导致其零售利润占比仅

猜您喜欢

Copyright ©  2015-2022 北方服装网版权所有  备案号:京ICP备2021034106号-50   联系邮箱: 55 16 53 8@qq.com