“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

2024-04-30 23:30:36 来源:网络

前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。

据现在可以查到的 WizardLM-2 发布信息,这是一个「真正媲美 GPT-4」的开源大模型,在复杂聊天、多语言、推理和代理方面的性能得到了提高。

该系列包括三个模型:WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中:

WizardLM-2 8x22B 是最先进的模型,也是对高度复杂任务进行内部评估后得出的最佳开源 LLM。

WizardLM-2 70B 具备顶级推理能力,是同等规模的首选;

WizardLM-2 7B 是速度最快的,其性能可与现有的 10 倍大的开源领先模型相媲美。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

此外,通过人类偏好评估,WizardLM-28x22B 的能力「只是稍微落后于 GPT-4-1106 预览版,但明显强于 CommandRPlus 和 GPT4-0314。」

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

它会和 LLaMa 3 一样,成为又一开源里程碑吗?

当大家忙着下载模型的时候,团队却突然撤回了一切:博客、GitHub、HuggingFace 全部 404。

图源:https://wizardlm.github.io/WizardLM2/

图源:https://wizardlm.github.io/WizardLM2/

团队的解释是:

所有 Huggingface 的朋友们,大家好!很抱歉,我们删除了模型。我们已经有一段时间没有发布几个月前的模型了,所以我们现在不熟悉新的发布流程:我们不小心遗漏了模型发布流程中的一个必要项目 — 毒性测试。这是目前所有新模型都需要完成的一个步骤。

我们目前正在快速完成这项测试,然后将尽快重新发布我们的模型。不用担心,感谢关心和理解。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

但 AI 社区对 WizardLM-2 的关注和讨论没有停止,疑点有几个:

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

第一,被删掉的开源项目不只是 WizardLM-2,该团队所有的 Wizard 系列工作都不见了,包括此前的 WizardMath 和 WizardCoder。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

第二,有人质疑,删除模型权重的同时,为何连博客也删除呢?如果是只是缺少测试部分,没必要撤回得干干净净。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

团队的解释是:「根据相关规定。」具体什么规定?目前没人知道。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

第三,还有人猜测 WizardLM 背后的团队已经被解雇,撤回 Wizard 系列项目也是被迫的。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

不过,这种猜测被团队否认了:

图源:https://x.com/_Mira___Mira_/status/1783716276944486751

图源:https://x.com/_Mira___Mira_/status/1783716276944486751

图源:https://x.com/DavidFSWD/status/1783682898786152470

图源:https://x.com/DavidFSWD/status/1783682898786152470

而且我们现在搜索作者的名字,也并没有从微软官网中完全消失:

图源:https://www.microsoft.com/en-us/research/people/qins/

图源:https://www.microsoft.com/en-us/research/people/qins/

第四,有人猜测,微软撤回这个开源模型,一是因为性能过于接近 GPT-4,二是因为和 OpenAI 的技术路线「撞车」了。

具体是什么路线呢?我们可以看一下当初博客页面的技术细节。

团队表示,通过 LLM 训练,自然界中人类生成的数据日益枯竭,而 AI 精心创建的数据和 AI Step-by-Step 监督的模型将是通往更强大 AI 的唯一途径。

过去的一年里,微软团队建立了一个完全由人工智能驱动的合成训练系统,如下图所示。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

大概分为几个版块:

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

数据预处理:

数据分析:使用这个 pipeline 来获得新源数据的不同属性的分布,这有助于对数据有一个初步的了解。

加权采样:最佳训练数据的分布往往与人类聊天语料的自然分布不一致,需要根据实验经验调整训练数据中各属性的权重。

“非常接近GPT-4”的WizardLM-2被微软紧急撤回,有什么内幕?

Evol Lab:

Evol-Instruct:投入了大量精力重新评估了最初 Evol-Instruct 方法中存在的各种问题,并对其进行了初步修改,新方法能让各种智能体自动生成高质量的指令。

Evol-Answer:引导模型多次生成和重写回复,可以提高其逻辑性、正确性和亲和力。

AI Align AI(AAA):

协同教学:收集 WizardLM 和各种授权开源和专有的最先进模型,然后让它们协同教学并相互提高,教学内容包括模拟聊天、质量评判、改进建议和缩小技能差距等。

Self-Teaching:WizardLM 可以通过激活学习,为监督学习生成新的进化训练数据,为强化学习生成偏好数据。

学习:

监督学习。

阶段 - DPO:为了更有效地进行离线强化学习,将优选数据分割成不同的片段,并逐级改进模型。

RLEIF:采用指令质量奖励模型(IRM)与过程监督奖励模型(PRM)相结合的方法,使得在线强化学习中实现更精确的正确性。

最后要说的是,任何猜测都是徒劳的,让我们期待一下 WizardLM-2 的复出吧。

,“非常接近GPT-4”的Wizard善用佳软 LM-2被微软紧急撤回,有什么内幕?

相关:

继续硬刚,哥大抗议学生称占领了一座学术大楼

俄军准备进攻哈尔科夫?前线形势严峻,乌克兰武装部队总司令承认乌军“战术性”撤退。据“环球网”4月29日援引乌克兰媒体报道,乌克兰武装部队总司令亚历山大·瑟尔斯基28日承认了乌军的“战术性”撤退。《基辅独立报》称,瑟尔斯基28日在社交媒体上发布消息称,乌克兰军队从顿涅茨克州的三个村落撤退。这三个村落位于波克罗夫斯克地区,瑟尔斯基将该地区和库拉霍韦地区的局势描述为目前“最困难的”。近期,俄军在进攻中使用了一些外形怪异的坦克,在..

中国海警高压水炮摧毁菲船雷达,现场发生剧烈撞击据中国海警4月30日发布消息称,菲律宾再次派遣2艘船只,试图袭扰我黄岩岛,中国海警对这两艘菲律宾船只进行了驱离。整个通告寥寥几字一笔带过,但在黄岩岛附近海域到底发生了什么,还得看菲律宾方面发布的最新视频。(被3305船高压水炮冲的抱头鼠窜的菲律宾船员)当时在黄岩岛附近海域,这艘菲律宾船只试图靠近,但中国海警3305舰的吨位比较大,船体仿佛泰山压顶,对这艘菲律宾小船形成了巨大的威压,随后两艘船相撞。(菲律宾船..

第八届平遥国际电影展将于2024年9月24日开幕2024第八届平遥国际电影展定于2024年9月24日至30日在山西省晋中市平遥古城举办。即日起,第八届平遥国际电影展正式面向全球征片,征片时间持续至2024年7月15日。报名影片可登录平遥国际电影展官方网站影片报名通道(https://www.pyiffestival.com/film)进行网上报名,同时可通过平遥国际电影展官方微信公众平台、官方微博了解更多报名详情。报名影片经平遥国际电影展艺术总监带领的节目策划团队甄选,将有机会入围第八届平遥国..

为什么DRG付费制度会导致医生推诿责任  □刘远举   近年来,多省市改革按疾病诊断相关分组(DRG)付费后,医疗费用增长得到明显控制。但是面对医疗这种复杂问题,这个世界上没有任何完美的监管方法,随着改革的深入,新问题又出现了,那就是部分医疗机构不愿接收病情复杂的病人。   这是因为病人最初主诉只是普通疾病,确定标准后,一查下来发现有多种合并症,就会导致对标DRG后,费用明显超标。费用超标后,医保支付金额超出部分由医院自己承担,有的医院则会..

“五一”假期海南高温天气将缓解  中新网海口4月30日电 (记者 王晓斌)连日来海南高温预警频发,当前的热浪会侵袭“五一”假期吗?海南省气象台首席预报员陈红30日接受记者采访时介绍,今年“五一”假期海南天气总体以多云为主,间歇性雷阵雨将缓解高温,提醒游客带伞出行。 4月28日,海南海口,市民撑伞冒高温天气出行。海南省气象台预测,“五一”假期海南高温天气将得到缓解。 骆云飞 摄   海南省气象台4月30日预计,5月1日~2日,海南岛大部分地..

东航就客机滑梯释放事件致歉:正进一步调查  中新网4月30日电 据中国东方航空微博消息,4月29日公司西安至上海航班在过站准备期间,滑梯释放。公司按程序迅速处置,该航班旅客正常保障。公司对此深表歉意,正对事件进行进一步调查。公司将根据调查结果,依法依规进行处理。 ​​​ 微博截图 【编辑:刘湃】

5G、AI进课堂……京津冀中小学教研实现“一网共研”  央视网消息:京津冀教育协同数字平台日前启动。通过5G、AI等技术赋能,三地义务教育学校教研实现“一网共研”。   北京市育才学校通州分校地理教师:影响我们北方地区农业生产的自然因素有哪些呢?请天津的同学来给我们回答一下。   借助智慧化课堂,京津冀三地的师生们围绕初中地理学科中关于“中国北方的地理特征”的内容,同上一堂课。北京的老师可以随机邀请天津和雄安新区的学生发言,共享的教学资源也让大家彼..

福建海事局:已有146名台胞在闽获发大陆船员证书  【港澳台专线】福建海事局:已有146名台胞在闽获发大陆船员证书   中新社福州4月30日电 (龙敏 叶薇 朱升)据福建海事局30日消息,自2023年6月试点开展大陆首批两岸联合培养国际邮轮船员项目以来,截至2024年4月共举办7期培训班,共有146名台胞获发大陆船员证书。   据介绍,近年来越来越多台湾船员“登陆”寻觅新机遇,逾200人参加多种类船员培训、申办大陆船员证书。   自去年4月探索性开展台胞换发大陆游艇驾驶..

歌唱家魏⼴德领航新时代专辑独唱⾳乐会唱响北京4⽉28⽇下午三点,⻘年男⾼⾳歌唱家魏⼴德在北京海淀区⽂ 化馆(北馆)⾳乐厅成功举办了“领航新时代——魏⼴德专辑独唱⾳ 乐会”,演出现场座⽆虚席,热情⾼涨,现场观众对魏⼴德充满魅⼒ 的声⾳和富有激情的演唱报以雷鸣般的掌声和呐喊声!这场⾳乐会暨北京⾳乐厅交响独唱⾳乐会、德州⼤剧院独唱⾳乐会、灵璧回报家乡独唱⾳乐会之后的第四场独唱⾳乐会。本场⾳ 乐会的最⼤亮点就是听完激情澎湃、热⾎沸腾、感情真挚充沛。..