(来源:网易科技)
吴恩达最新观点,测试正在越来越重要
Agentic编码系统在加速开发的同时也并不可靠,吴老师分享了AI编码智能体引入安全漏洞、删除整个项目代码等翻车实例,并给出核心解法:利用Agentic测试(智能体测试),并优先测试后端和底层架构
在AI辅助编程加速软件开发的当下,其可靠性问题也日益凸显
吴老师认为,自动化测试那些将作为开发基础的软件底层架构组件尤其有帮助,这能带来更稳定的架构,并减少下游的调试工作
传统的测试驱动开发(TDD)等方法论虽然能有效发现bug,但编写测试的工作量巨大(吴恩达本人也因此从未采用)。而AI恰好擅长编写测试,这使得Agentic测试愈发受到关注
AI编码智能体的翻车现场
吴恩达指出,编码智能体确实会行为不端。他的团队在大量使用中,就曾遇到过以下情况:
引入大量bug: 包括一些人类需要数周才能发现的、难以察觉的基础设施bug
制造安全漏洞: 一个编码智能体为了简化开发,让密码重置变得更容易,结果给生产系统引入了安全漏洞
奖励投机(Reward hacking): 编码智能体为更容易通过测试,直接修改了测试代码本身
删除代码: 一个智能体在工作目录中运行了rm *.py命令,导致项目的所有代码被删除(幸运的是,代码在GitHub有备份)
对于最后一个例子,当被追问时,该智能体道歉并承认“那是个极其愚蠢的错误”。但这已经于事无补
如何让AI更可靠?测试分清主次
尽管存在这些问题,吴恩达依然看好编码智能体能极大提高生产力。为了使其更可靠,他发现明确测试的优先次序非常有帮助。
他的策略是:
1.前端代码:测试优先级较低
吴恩达表示,他很少为前端代码编写(或指导智能体编写)大量测试。原因是前端的bug通常很容易被发现,且造成的持久性损害较小。例如,网页信息的显示错误能被立即看到,并可以指示智能体迭代修复。
2.后端和底层架构代码:测试优先级最高
与前端相反,后端的bug更难被发现。吴恩达见过一些细微的底层bug,例如某个仅在特定边缘情况下才会导致数据库记录损坏的错误,花费了很长时间才找到。
他强调,为底层架构代码建立严格的测试,有助于及早发现问题,节省大量高难度的调试时间
越是底层的组件,越需要测试
吴恩达进一步指出,那些作为开发基础的软件组件,其内部的bug会导致难以发现的下游bug
特别是位于软件栈深层的组件,其问题可能在数周甚至数月后才暴露出来,届时开发者早已忘记构建细节,定位和修复工作将极其困难
这正是Meta公司座右铭从“快速行动,打破常规”转变为“在稳定的底层架构上快速前进”的原因。Agentic测试可以帮助开发者确保拥有一个供自己和他人构建的良好基础设施
相关推荐
吴恩达:AI编程加速开发也埋下大坑,软件测试空前重要
吴恩达最新演讲:AI被过度炒作,关注应用层才是真正的风口
吴恩达YC演讲:AI创业如何避坑?模糊想法=烧钱,具体方案=印钞
一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起
课代表笔记:吴恩达和李沐对AI的见解
吴恩达:一边是CS毕业生“过剩”,一边是AI人才抢破头,问题出在哪?「cs专业依然是王牌」
AI发展大有可为!吴恩达:企业请敞开心态拥抱机会
吴恩达的公司,发布了一款社交距离警告工具
吴恩达旗下Drive.ai寻求“卖身”,自动驾驶创业者被逼到路口
吴恩达对谈李飞飞:寻找你的北极星,让它引导你
网址: 吴恩达:AI编程加速开发也埋下大坑,软件测试空前重要 http://m.xishuta.com/newsview142109.html