万维读者网 > 数码科技 > 正文

AI编程登Science：AlphaCode打竞赛表现太优秀

www.creaders.net | 2022-12-09 15:29:04 量子位 | 0条评论 | 查看/发表评论

DeepMind的NS论文又新添一篇。

这回，是“信息学竞赛选手” AlphaCode，登上了最新一期Science封面。

对，就是那个悄悄潜入10场编程比赛敲代码，成绩超过了一半人类的编程AI。

并且就在这篇最新更新的论文中，DeepMind还首次透露了AlphaCode的“一次通过率”： 66%。

也就是说，AlphaCode近三分之二的提交，都是一次AC （Accepted）的。

CMU博世人工智能中心教授J. Zico Kolter的最新评论文章也同时发表在了这一期Science上，他认为：

AlphaCode不仅仅是复制现有的解决方案。

在面对以前没见过的编程题时，它表现得非常好，无论它是在多大程度上真正“理解”了这个任务。

AlphaCode不仅仅是复制现有的解决方案。

在面对以前没见过的编程题时，它表现得非常好，无论它是在多大程度上真正“理解”了这个任务。

而在DeepMind的官方推特下，还有不少人把AlphaCode同当红炸子鸡ChatGPT联系了起来。

有人已经迫不及待看到两者同台演出：

首次通过率66%

尽管AI编程领域，GitHub的Copilot已经快进到收费模式，甚至还和程序员们“法庭上见”了。

但在DeepMind看来，AlphaCode还是颇有些不同之处。

一方面，编程竞赛对于AI而言本身就是比纯编程更为复杂的任务，关键是要为无法预见的问题构建解决方案。

另一方面，在架构上，AlphaCode采用了不同的机制来编码赛题文本。

值得一提的是，AlphaCode“打”的这10场编程比赛都来自 Codeforces。

相比其他针对算法和数据结构的编程比赛，Codeforces更偏好考查思维能力，这意味着AI无法仅仅通过“背题”来完成挑战。

例如这是Codeforces上关于1553D问题的描述：

有两个字符串s和t，都是由小写字母组成。对于字符串s，我们从前向后扫描整个字符串。

如果按下Backspace键，就删除该光标前到上一个未删除字符之间的所有字符。

有两个字符串s和t，都是由小写字母组成。对于字符串s，我们从前向后扫描整个字符串。

如果按下Backspace键，就删除该光标前到上一个未删除字符之间的所有字符。

也就是说，假设字符串s是”abcbd”，你分别在第一个位置和第四个位置按下Backspace，那么将得到字符串”bd”。

因为在第一个光标位置前没有字符，所以第一次没有动作。第四个光标位置前的字符是c，上一个未删除字符是a，所以按下Backspace将删除前三个字符”bd”。

针对这个“前提”，我们需要解决的问题如下：

我们能否从前向后扫描一次s字符串，让s变为t？如果可以就输出YES，否则输出NO。

我们能否从前向后扫描一次s字符串，让s变为t？如果可以就输出YES，否则输出NO。

针对这个问题，AlphaCode给出的解法如下：

那么，我们只需要给定输入的字符串数量（4）和具体的字符串内容，就能让程序输出对应的结果：

第一组ababa （ba），第二组ababa （bb），第三组aaa （aaaa），第四组aababa （ababa）。

对此程序输出的结果分别是YES、NO、NO和YES。

在做题过程中，AlphaCode的“解题思路”也不再是黑箱。

它不仅成功解决了问题，还能将代码和注意力高亮的对应位置显示出来：

上述还只是AlphaCode解的其中一道题。

整体来说，在Codeforces平台举办的编程比赛模拟评估中，AlphaCode在超过5000名参与者的比赛中平均排名前54.3%——击败了一半的选手。

并且第一次提交就通过的概率达到了66%。

AlphaCode是如何读题写码的

所以，AlphaCode究竟是凭借什么原理达成这一“战果”的呢？

它仍然基于预训练-微调的范式打造，采用Transformer架构，其中编码器具备“ 解读能力”，解码器则具备“ 写码能力”。

这次发表在Science上的论文，也给出了更直观的原理图，并以 Python作为案例，讲解具体训练的过程。

在预训练（pre-training）时，研究人员会先整理出GitHub上的各种代码集，并“喂”给AlphaCode上的编码器和解码器。

以Python上的print(“hello”)为例，这里print是一个常见的函数，即“打印输出”，”hello”则是具体需要打印输出的内容。

经过预训练后的模型，就具备了基本的“按指令完成任务”的要求，其中编码器负责生成指令，解码器则负责填充剩余的部分。

在微调（fine-tuning）环节，研究人员会整理出竞争性编程竞赛的数据集，包括问题和解决思路两部分，并以GOLD与tempering作为训练目标，进一步减少搜索空间。

其中，问题以注释#的形式交给编码器“学习”，解决思路则交给解码器来尝试理解：

微调完成后，解码器就懂得通过编码器生成注释的内容，来尝试输出对应的代码。

经过预训练-微调后，就来到了最终的评测环节。

Codeforces的题目会被直接以注释的形式交给编码器，解码器则尝试输出数百万个不同的程序，对它们进行过滤和聚类（cluster）之后，提交其中的10个程序来解决问题。

（当然前面也提到，有不少问题在第一次提交后就通过了）

对于AlphaCode的出现，有程序员调侃称“可以在艺术家旁边排队等领救济粮了。”

不过，DeepMind官方对于AlphaCode的定调并非“AI版程序员”，而是希望它作为一个辅助的角色出现在编程工作中：

我们希望它能作为软件开发者的助手，尤其是为0编程基础的人提供写代码的机会。

我们希望它能作为软件开发者的助手，尤其是为0编程基础的人提供写代码的机会。

0

相关新闻

特斯拉车主横跨整个美国全程没碰方向盘	2026年的AI，真的要“抢饭碗”了
人工智能真的能帮人们找到爱情吗？	可怕！美专家警告：AI误判恐在几分钟内引爆核战
华尔街分析师：2026年最看好的5支AI概念股	辉达携手台积电冲刺中企200万颗H200大单
14亿年薪还不够美巨头再砸140亿收购华人AI公司	中国AI机器人“造反”视频疯传
豪掷20亿：Meta收购Manus，肖弘出任副总裁	软银卖光英伟达持股含泪完成对OpenAI承诺
60后到00后，我家两代4位程序员戳中的残酷真相	最强7大AI工具排行榜出炉最大黑马杀出
他杀死83岁母亲！AI的温柔正在杀人	硅谷一线峰会，这一幕令大佬们清醒
长期与AI聊天，会诱发这种精神病	YouTube推荐影片1/5竟是“AI废片”
174名北大学生能否考过AI？结果很意外	人类正走进高度不确定未来 AI教父最深层恐惧
暴跌27.5%！美国码农，正被“大屠杀”	北大老师专为AI设计的期中考试结果出乎意料

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论上一页下一页

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

1	中共官场突然敢骂习了，谁给的胆子？
2	逆潮流而动，顶尖科学家从中国归国
3	习遭降维打击，新华社通稿4个细节惊心动魄
4	比美国还狂？2026第一天，新加坡发文告诫中
5	两岸开打让家人上战场？投票结果超震撼

48小时新闻排行榜

1	习家“储君”出事？皇侄齐明正突然消失
2	北京七环大爆炸，传老习两口子躲了整整两天
3	中共官场突然敢骂习了，谁给的胆子？
4	逆潮流而动，顶尖科学家从中国归国
5	习遭降维打击，新华社通稿4个细节惊心动魄
6	习走错“关键一步” 渐失话语权
7	比美国还狂？2026第一天，新加坡发文告诫中
8	两岸开打让家人上战场？投票结果超震撼
9	跨年夜，中国多个大城市现诡异一幕
10	中国跨年夜万人倒数惊现这一幕！网：太尴

热门专题

1 俄乌战争	6 四中全会	11 中共两会
2 中日关系	7 美伊冲突	12 大S
3 中美冷战	8 以伊战争	13 洛杉矶大火
4 万维专栏	9 何卫东	14 叙利亚
5 川普	10 AI	15 苗华被抓

一周博客排行

1	2026年1月1日A4白纸自由宣言	万维网友来
2	刷屏的美国“斩杀线”与中共的	解滨
3	回国杂感：仓颉造字成真，有图	思芦
4	梅兰芳和兩位仍然在世的入室弟	玉质
5	安芃：男人的出轨和女人的出轨	水沫
6	共军上将军头集体消失的秘密	胡亥
7	70%美国大学毕业生找不到工作	乐维
8	三千年未有之新中国——一份关	万维网友来
9	美国斩杀线：愚昧和麻木	汪翔
10	美国巨变：特朗普把三大最争议	文礼

一周博文回复排行榜

1	台湾问题：麻将停牌	随意生活
2	东亚战争准备：从暗杀安倍开始	随意生活
3	川普到底卖了乌克兰没有？	山蛟龙
4	梅兰芳和兩位仍然在世的入室弟	玉质
5	第一美女：《越人歌》-宋祖英	YOLO宥乐
6	做这道题，知道明年你要去哪？	末班车
7	关于离岸爱国	阿里克斯Y
8	海外中文出版的新路基本开通，	高伐林
9	70%美国大学毕业生找不到工作	乐维
10	三千年未有之新中国——一份关	万维网友来


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.