万维读者网 > 数码科技 > 正文  

前OpenAI团队打造 ChatGPT开源平替来了

www.creaders.net | 2023-03-13 15:46:24  量子位 | 0条评论 | 查看/发表评论

ChatGPT的开源平替来了,源代码、模型权重和训练数据集全部公开。

它叫OpenChatKit,由前OpenAI研究员共同打造。

效果是这样儿的:

可以用简单的语言解释机器学习的概念,也可以回答测试者提出的第二个小问题。

信息提取也难不倒它,比如将一大段计划用表格表示。

据悉,OpenChatKit一共包含200亿参数,在EleutherAI的GPT-NeoX-20B(GPT-3开源替代品)上进行了微调,还可以连接其它API或数据源进行检索等等。

这不,GitHub刚刚上线,就已经获得了800+标星。

有网友感叹“事情进展得也太快了吧”,作者则回应:

安全带系紧,享受“飙车”吧。

来看看它具体怎么玩?

OpenChatKit,你的平替ChatGPT

据介绍,OpenChatKit一共包含4个基本组件:

1、一个指令调优的大型语言模型。

用EleutherAI的GPT-NoX-20B对聊天功能进行了微调,后者在carbon-negative计算上具有4300万条指令。

调整重点是多轮对话、问答、分类、提取和摘要等几个任务。

2、定制配方(recipe)。

用来帮助微调模型使其能够为特定任务提供高精度的结果,只需要准备自己的数据集。

3、一个可扩展的检索系统。

可以让你在推理时从文档存储库、API或其他实时更新信息源添加信息。

4、一个由GPT-JT-6B微调而成的调节模型(moderation model)。可以过滤模型对一些问题的响应。

这样的OpenChatKit可以为各种应用程序创建专用和通用的聊天机器人。

在GitHub上的仓库,你可以找到它的训练代码、测试推理代码以及通过检索增强模型的代码。

具体如何使用?

首先,在开始之前,安好PyTorch和其他依赖项。

先从作者团队的网站(Together)安装Miniconda,然后用此repo根目录下的environment.yml文件创建一个名为OpenChatKit的环境。

由于repo使用Git LFS来管理文件,所以还需要按照他们网站上的说明进行安装,然后运行git lfs install。

接着,关于预训练权重。

GPT-NeoXT-Chat-Base-20B是GPT NeoX的200亿参数变体,它在会话数据集上进行了微调。

作者在Huggingface上的GPT-Next-Chat-Base-20B发布了预训练权重。

数据集方面,OpenChatKit模型是在LAION、Together和Ontocord.ai共同构建的OIG数据集上训练的。

同样,从Huggingface下载数据集,然后在repo的根目录运行以下命令就行:

python data/OIG/prepare.py。

(你也可以贡献新的数据来改善模型效果~)

然后就可以预训练基础模型了。

方法是在根目录用以下命令下载GPT-NeoX-20B模型:

python pretrained/GPT-NeoX-20B/prepare.py。

它的权重放在pretrained/GPT-NeoX-20B/EleutherAI_gpt-neox-20b目录中。

下载好之后,执行bash training/finetune_GPT-NeoXT-Chat-Base-20B.sh脚本,开始配置和训练。

训练会启动8个进程,管道并行度为8,数据并行度为1。Checkpoints则将保存到repo根目录的model_ckpts目录中。

在推理之前,请务必将模型转换为Hugginface格式。

为了帮助你测试模型,作者也在这里提供了一个简单的测试命令行工具来进行交互,执行命令:

python inference/bot.py。

默认情况下,脚本会在目录下加载名为GPT-NeoXT-Chat-Base-20B model的模型,但我们可以通过—model进行改变。

都弄好之后,在提示符处输入文本,模型就会回复了。

最后,作者还提供了一个用维基百科进行扩展搜索的例子,操作也比较简单,感兴趣的同学可以自行查看。

关于作者

OpenChatKit的归属单位叫Together。

这是一家去年7月才成立的创业公司,专门为AI行业做去中心化的云服务。

CEO是Vipul Ved Prakash,他曾在苹果做了5年高级总监。

CTO是Zhang Ce,苏黎世联邦理工学院计算机专业的助理教授。

据推特博主Itamar Golan称,OpenChatKit的作者包含多位前OpenAI研究员。

总的来说,OpenChatKit开箱即用,擅长多项任务,包括带有上下文的总结和问题回答、信息提取、文本分类等。

但它还不太擅长创意写作(尤其是编长故事)、写代码,以及有时可能会重复响应你的请求、在切换话题时表现迟钝……

不过,正如Together在博客中说的那样:

这个模型不是发布完就完了,它是一个开源项目的开始。

或许我们可以持续关注一波~

那么,如果你感兴趣,传送门在这里:

https://github.com/togethercomputer/OpenChatKit

https://huggingface.co/spaces/togethercomputer/OpenChatKit

   0


24小时新闻排行榜 更多>>
1 新华社捧习文章突然下架… 三中全会出事了
2 中共三中全会闭幕
3 登机前被发现护照上有这东西 情侣被赶出机
4 中国两院27院士候选人 被永久取消资格
5 25岁小伙与50岁大妈交往 结婚之后发现…崩

48小时新闻排行榜 更多>>
1 三中全会召开之际,网传习近平中风且不乐观
2 北大毕业典礼 教授突然叫板中南海
3 疯传习中风?虚虚实实让人无限遐想
4 党媒捧习闹出大笑话 全网围观
5 新华社捧习文章突然下架… 三中全会出事了
6 川普遇刺后最新民调来了
7 又一场大清洗开始了
8 承诺保卫台湾?川普语出惊人
9 小心!中南海这个算计心思太深了
10 信号混乱 中宣部神经错乱还是习幕僚不知所
热门专题
1
美国大选
6
中美冷战
11
中国爆雷
2
三中全会
7
乌克兰战争
12
李尚福出事
3
巴黎奥运
8
中共两会
13
秦刚失踪
4
万维专栏
9
台湾大选
14
火箭军悬案
5
以哈战争
10
李克强猝逝
15
台海风云
一周博客排行 更多>>
1 死于“三个自信”的齐奥赛斯库 阿妞不牛
2 先声夺人、千里摄敌、不战而胜 万维网友来
3 天佑老川,美国必将伟大! 流岛
4 何与怀:他一生短暂,却是世间 万维网友来
5 子弹飞过的瞬间 沐浴神恩 川 雷歌747
6 中美对比:房贷断供后 马黑
7 天恐诗词中断落, 故留嘉莹在人 玉质
8 冬天的童话一㨗克篇(五 野狼巴克
9 恰如预测,杀死川普是最后备案 透視鏡
10 为什么第二次简化字失败了? 乐维
一周博文回复排行榜 更多>>
1 北约正式开启亚太扩容 随意生活
2 来到美利坚的,请珍惜投票的手 阿妞不牛
3 惊醒川普拜登的这一枪 阿妞不牛
4 死于“三个自信”的齐奥赛斯库 阿妞不牛
5 是阴谋,还是 水蛇
6 黔驴技穷的谋杀 石头村
7 中美对比:房贷断供后 马黑
8 政客们把美国变成人间喜剧 巴黎老高
9 中国目前的人口状况 jingchen
10 川普遇刺!差1cm就成烈士.高呼 must
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. Creaders.NET. All Rights Reserved.