近日,网络上流传着一张原阿里首席 AI 科学家贾扬清的朋友圈,称某国产大模型实际上是抄袭的LLaMA,然后更换了几个变量名就宣称是自己研发。
有国外开发者直接点名,这个抄袭的模型就是李开复旗下的“零一万物(Yi-34B)”。
具体来看,在Yi-34B 的Hugging Face开源主页上,开发者ehartford质疑称该模型使用了Meta LLaMA的架构,只对两个张量(Tensor)名称进行了修改。ehartford表示,开源社区肯定会重新发布 Yi 大模型,并重命名张量以符合 LLaMA 架构。
据悉,零一万物的首款预训练大模型 Yi-34B 在本月初正式开源,根据Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可,成为全球开源大模型“双料冠军”
针对抄袭一事,有媒体求证了零一万物,得到回复称:
“GPT 是一个业内公认的成熟架构,LLaMA 在 GPT 上做了总结。零一万物研发大模型的结构设计基于GPT 成熟结构,借鉴了行业顶尖水平的公开成果,同时基于零一万物团队对模型和训练的理解做了大量工作,这是我们首次发布获得优秀结果的地基之一。与此同时,零一万物也在持续探索模型结构层面本质上的突破。”
发布于:北京
相关推荐
李开复旗下“零一万物”大模型被指抄袭LLaMA
李开复筹办的AI大模型公司“零一万物”上线,百亿级模型已内测|钛媒体焦点
李开复大模型公司“零一万物”官网上线:打造全新的 AI 2.0平台
阿里云领投李开复 AI 公司新一轮融资,首款大模型正式发布
微软全球合伙人姜大昕被曝大模型创业
开源大模型LLaMA 2会扮演类似Android的角色么?
650亿参数大模型预训练方案开源可商用,LLaMA训练加速38%,来自明星开源项目
谁在“吊打”ChatGPT?
微软牵手Meta,大模型竞争来到新起点
中国大模型“顶流群聊”笔记
网址: 李开复旗下“零一万物”大模型被指抄袭LLaMA http://m.xishuta.com/newsview97876.html