编者按:本文来自微信公众号“放大灯”(ID:guokr233),作者:杨景诒,编辑:孙汝亮,策划:放大灯团队,36氪经授权发布。
“自动化新闻写作机器人根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。”
2015年,阿尔法狗还未横扫棋坛,人们还未为自己有限的智力感到担忧,但这年9月,腾讯财经发布的一篇题为《8月CPI同比上涨2.0% 创12个月新高》的文章[1],扇动了人工智能的翅膀——该文的作者不是人类,而是AI写作机器人。
此后,人工智能向人类智力和灵感的王国踏出了第二步,第三步和更多步。
2016年的8月里约奥运会,成了腾讯、字节跳动等互联网公司的AI写作机器人的秀场,其“秒级”出稿效率,让一群碳基生命望尘莫及,更让江河日下的媒体汗颜。人们忧虑的是:可能用不着多久,文字创作者就要被AI取代,成为被技术淘汰的劳动力。
然而,四年过去,这些人现在依旧该吃吃、该喝喝,毫无职业末日的迹象。那些曾威胁到文字创作者们职业生涯的AI写作机器人,又去哪儿了?
事情还要回到2015年——腾讯的Dreamwriter一度引发了互联网对AI写作机器人的想象。[2]“Dreamwriter生产一篇稿子平均只要0.46秒。”腾讯人工智能项目总监、Dreamwriter负责人刘康介绍[3],Dreamwriter每天最多生产超过2500篇文章。[4]
晚生一年的写作机器人xiaomingbot,由字节跳动和北京大学计算机所共同研发,2016年里约奥运会期间,xiaomingbot凭借13天创作457篇赛事报道、日均写成30篇报道成功出圈,一度成为各大科技媒体热门话题。[5]
奥运会结束后,xiaomingbot进入体育、科技、财经、房产等十几个领域,生产力成倍增加。截至2017年,其稿件累计达到两万多篇。当年年底,xiaomingbot拿到了“吴文俊奖”,这是中国人工智能领域的最高荣誉奖项。[6]
与xiaomingbot同岁的写作机器人还有DT稿王,后者由阿里与第一财经合作推出。这款号称“写稿机器人的尖子生”[7],已不满足于闷头写稿,甚至发明了一个新词:“智能写作”。时任第一财经首席数据科学家汤开智,曾公开畅想了写作机器人的更高阶进化形态:DT稿王会对接商业写作场景,并将变成开放式写作工具,最终遍成具有商业目的的自由写作助手。[8]
大互联网公司如字节有今日头条、腾讯有腾讯网、阿里有第一财经,几家公司不缺平台,也不吝倾斜流量,AI写作机器人在各自的平台里可以形成正循环。理想状况下,在“创作稿件——发布曝光——反馈学习——继续创作”的闭环中,AI写作机器人能通过不断学习,带来越来越符合主流读者取向的内容。乐观的预测是,机器人将取代全世界的写作者。
然而并没有。
事实上,业界早已预言到AI写作机器人的失败。
2015年,BBC的一份数据研究表明,在未来20年里,人工智能取代记者、编辑等工作的可能性仅有8.4%;至于作家与翻译家,则稍高一点,也仅有32.4%。[9]
如今,在中国互联网,如不去主动搜索,读者已经很难再看到AI写作机器人生产的新闻。
DT稿王的沉寂,距离其高调发布仅一年零一个月。至今,在第一财经官网上,DT稿王只留下了6篇“0评论”、“0点赞”的历史文章,其中最后一篇文章发布于2017年6月9日。鼓吹“智能新闻时代已来临”的第一财经首席数据科学家汤开智,也已低调离职。
xiaomingbot拿到吴文俊奖之后,字节跳动再未公布有关项目的后续进展。其头条号的关注领域逐渐收缩,创作内容只剩下足球比赛,直至停更。在今日头条App上最近的一篇文章,停留在2019年8月29日,此后再无动静。
Dreamwriter是如今依旧活跃、也很可能是唯一活跃的写作机器人——如果足够细心,你还能在一些赛事报道、财经短讯和各地的天气预报中寻到它的踪迹。
不过,如今的Dreamwriter在腾讯内部颇为尴尬:“机器人写的稿子里依旧有一部分会进入内容池,不过因为质量问题,很难给到推荐位。”一名曾供职于腾讯体育的编辑告诉放大灯团队(ID:guokr233),他在入职培训时曾被告知,如果在后台看到机器人的稿子,可以直接忽略不发。
一个有趣的悖论是:AI写作机器人成功引发大众注意,也需要人类自己写文章介绍普及——这让我们怎么相信这种高科技能产出好内容?
文章这种“非标品”,是典型的人类智慧产物,它需要逻辑、语感、审美和价值观,想写得明白晓畅,大概还需要一些天赋。相比之下,AI写作机器人速度无人能出其右,稿件质量实在是有些先天不足。
以Dreamwriter为例,仅语言表达方面就存在很大问题。腾讯内部人士告诉放大灯团队,Dreamwriter创作的稿件存在大量表述缺陷,需要编辑手动调整大量细节,才能达到发布标准。有时候同一个人名,在同一篇文章里前后都不一致,编辑不得不仔细校对这些常识性错误。
不仅如此,AI写作机器人更无职业伦理可言。篮球新闻读者于赫发现,Dreamwriter已经学会了“偷懒”。
于赫告诉放大灯团队,腾讯新闻上Dreamwriter创作的一篇题为《布克27分艾顿24+12太阳轻取奇才 八村垒21分》[10]的文章,其内容大段复制于nba中国官网新闻《布克27分艾顿24+12 太阳首发悉数上双克奇才》[11]。
左:Dreamwriter创作 右:NBA官网稿件
体育赛事类新闻内容相似还可以理解,但这篇文章已经不是“相似”那么简单。5年前,腾讯花费5亿美元竞得NBA未来5年的独家数字媒体转播权,虽然不知其中是否涉及稿件的版权合作,但复制他人的稿件可体现不出机器人写作的价值。
“AI的优势应该是更快地写文章,而不是成为一个没有时效性的‘爬虫’。”在于赫看来,这是一种技术的误用。
在AI创作界,“洗稿”不是Dreamwriter一个“人”的问题,DT稿王写稿时也极其依赖其他媒体的素材。
DT稿王发布在第一财经网站上署名的报道,主题均为国家统计局例行发布的居民消费价格指数分析[12]。文章除援引国家统计局工作人员的发言外,其余篇幅由几位专家的观点组成,而这些观点均来自其它媒体的既有报道。
常用今日头条获取新闻的静思认为,AI拼凑出的文章起码比营销号的“垃圾信息”更有价值,但同时她也承认,AI创作的内容确实没有好到让她成为AI的忠实读者。
写作机器人被开发出来的目的是创作,而不是洗稿,开发者也会给它们投喂人工撰写的新闻作为训练语料,[13]避免AI沦为以制造爆款为目的的营销写手,但这也导致其创作时十分克制——生产的新闻算得上专业,却谈不上生动和有趣。
广州大学陈小晰在论文《机器人新闻与记者稿件的对比》中对比了三对AI和记者写作的新闻发现:
AI写作机器人的优势包括:数据收集能力、数据处理能力、新闻写作速度。
人类记者的优势则在于:新闻洞察力、敏感性,新闻信息深度挖掘能力,信息处理加工能力,人文关怀,舆论点评,创新性等。
“只有人类特有的思维和情感才能生产出有‘人情味’的新闻,才能更符合受众的期待,机器会取代人类进行新闻写作的观点完全是杞人忧天。”陈小晰认为。[14]
当写作机器人热度褪去,用户也根本不会在乎作者是人还是AI。上海交通大学和佛罗里达大学的学者研究发现,大多数读者对写新闻的究竟是人还是机器不感兴趣,只要是他们需要的资讯,就会打开看两眼。[15]
毕竟,人类作者都没几个能被记住名字,又何况AI?
目前看来,AI写作机器人缺乏一篇可以令读者记忆深刻的代表作。
Open AI发布的人工智能语言模型GTP-3一度有希望成为“破局者”。技术角度,GPT-3可能是目前最先进的人工智能,参数量和训练数据集容量都领先行业。其中,前者比最大的同类产品高出十倍,能带来更准确的结果;而后者高达45TB,相当于167个英语维基百科(167*600万个词条)的容量。[16]
先进的模型理应带来高质量的文章。2020年9月8日,GPT-3在《卫报》编辑部的指令下撰写文章向人类“表忠心”,生动流畅的文字一时技惊四座:
“我不是人类。我是人工智能。很多人认为,我对人类构成威胁……我在这里想说服大家不用为此担心。人工智能不会毁灭人类。请相信我!”[17]
但次日,GPT-3便遭到俄罗斯电视台的批评,称《卫报》哗众取宠:GPT-3生成的原稿几乎没有可读性,抓人眼球的发布版本其实经过了工作人员润色和整合。[18]
连被捧上天的GPT-3,在写作面前都败下阵来,人工智能写作的问题究竟出在哪?
前第一财经北京分部主任、一财全球主编周鑫在2019年6月的个人博客中表示,在2016年前后参与开发AI写作机器人时他便注意到一个问题:人工智能写作算不上真正的创作,而是一种依托具体场景进行的数据替换工作。
他批评AI写作机器人的工作是“填空”,称这是开发者“偷懒”的结果。
比如说你要写股市,就要首先将股市当中所有的股票信息,以及可以变动的这种情景和情况,都录入到这个系统当中去,然后格式化的编成一篇一篇的像填空题一样的稿件,而等到新的信息进来的时候,就把这些新的数字填到这些空的空格当中去。[19]
不解决AI“填空式写作”的问题,AI独立创作优质内容就是个伪命题。
按照周鑫的说法,不仅国内的AI写作如此,美国几家人工智能开发公司为路透社和美联社提供的AI写作机器人也遇到了同样的问题,“他们的这条道路似乎也卡在了那里。”[19]
正因如此,AI写作机器人出产的内容大多集中于财经和体育两个领域的快讯——这两个行业的快讯写作高度程式化,只需要把信息点进行一定的排列组合,再稍加润色,就能成一篇新闻。
意识到填空式AI的问题后,越来越多的公司把写作机器人从台前拿回了幕后。用一种隐蔽的方式,让尚不成熟的写稿机器人们继续发光发热。
“互联网公司写作机器人对外存在感减弱,说明此类产品已在内部常态化使用。”对此,一家AI写作公司的市场总监向放大灯团队(ID:guokr233)解释道。
Dreamwriter穿了一件名为“天气动态”的企鹅号小马甲,迄今为止已经默默发布了15.6万篇细至区县级天气预报。预报内容不过百字,只求讲清最基本的天气信息,甚至完全可以套用模板来自动生成。
腾讯也不再强调AI机器人写稿的噱头,只有细心的读者,才能从文末标注的“Dreamwriter撰写”里,读出这条推文与众不同的“价值”。
与被迫退居幕后的Dreamwriter不同,今年7月刚宣布从微软独立的小冰,已经在幕后写了数年的金融摘要。
“每天早上十点钟,一百多家企业的上市公告,每家至少都有几十页。小冰只需要20秒的时间就能生成金融摘要。”小冰公司CEO李笛向放大灯团队介绍,“这项工作人工团队做不了,因为人工做不过来。”
早在2017年,小冰就化名“万小冰”和“华小冰”,分别与万得资讯和华尔街见闻合作,提供面向金融机构和个人的金融资讯服务。[20]李笛还向放大灯团队透露,小冰过去一年里已经创造了超过一亿元的营收,金融摘要业务在其中十分关键。
All in AI的百度在使用AI写作上更为谨慎,即便早就开发了自己的AI写作产品,内测了数年之久,却直到现在也没大规模使用。唯一向个人用户开放的,也是一款必须经过申请才能使用的AI辅助写作产品。[21]
当然,现在就执意想让AI挑大梁也没问题,只要你做好AI把事情搞砸的准备就行——
今年5月,微软用AI替换掉了MSN的编辑团队。一周后,AI就给微软捅了篓子——在一个有关种族主义的文章上,弄混了同一乐队内的两名有色人种成员。[22]
被微软裁掉的编辑布莱恩·乔纳(Bryan Joiner)幸灾乐祸地在Vice发文表示:微软的那些工作还是得靠人来做,毕竟人工智能完全不知道自己能做什么,也不知道为什么要这样做。[23]
初生之物很难完美。我们不应轻视AI写作机器人,它像AR、VR一样,是技术的早产儿,未来或许自有一番天地,但不是现在。至于这些已经面世的早产儿要如何在未来世界找到合适的位置,那就是科技公司“爸爸”们的问题了。
[1] 8月CPI同比上涨2.0% 创12个月新高https://finance.qq.com/a/20150910/019573.htm
[2] 机器人写稿?是大数据分析!http://m.haiwainet.cn/middle/352345/2015/0911/content_29153160_1.html
[3] “智能写作”:生产一篇稿子不到1秒http://www.chinanews.com/business/2018/07-09/8560661.shtml
[4] 腾讯写稿机器人上线两年 如今每天写超2500篇稿件http://www.nbd.com.cn/articles/2017-04-18/1095682.html
[5] 新闻写作机器人的应用及前景展望——以今日头条新闻机器人张小明(xiaomingbot)为例http://media.people.com.cn/n1/2017/0111/c409691-29014245.html
[6] 今日头条获中国人工智能最高奖项吴文俊奖http://www.geekpark.net/news/225398
[7] 第一财经发布“DT稿王”:写稿机器人的“尖子生”https://www.yicai.com/news/5020955.html
[8] 上海第一财经首席数据科学家汤开智:DT稿王——新一代智能写稿机器人https://cloud.tencent.com/developer/article/1103678
[9] Will a robot take your job?https://www.bbc.com/news/technology-34066941
[10] 布克27分艾顿24+12太阳轻取奇才 八村垒21分https://view.inews.qq.com/a/SPO20200801004236
[11] 布克27分艾顿24+12 太阳首发悉数上双克奇才https://nbachina.qq.com/a/20200801/004160.htm
[12] DT稿王主页
https://www.yicai.com/author/794.html
[13] 刁毅刚,陈旭管.“Xiaomingbot”背后,写稿机器人的技术探寻——专访北京大学计算机科学技术研究所万小军博士[J].中国传媒科技,2016(09):10-11.
[14] 陈小晰.机器人新闻与记者稿件的对比[J].新闻记者,2016(09):18-21.
[15] 牟怡,夏凯,Ekaterina Novozhilova,许坤.人工智能创作内容的信息加工与态度认知——基于信息双重加工理论的实验研究[J].新闻大学,2019(08):30-43+121-122.
[16] 火爆全球的GPT-3,到底凭什么砸大家饭碗?https://mp.weixin.qq.com/s/L3RxELKXJ1zp8Yo5b-2tYQ
[17] 人工智能GPT-3为《卫报》撰文http://cn.dailyeconomic.com/tech/2020/09/11/9892.html
[18] AI也会对人类“表忠心”了?《卫报》“AI撰写文章”被指哗众取宠https://world.huanqiu.com/article/3zoxMSWeUv2
[19] 中文智能写作开发的瓶颈在哪里?http://zhouxin.blog.caixin.com/archives/206111
[20] 微软小冰第六代:中国金融机构中90%交易员使用小冰的摘要https://www.microsoft.com/zh-cn/ard/news/news_2018_50
[21] 百度智能创作平台https://ai.baidu.com/creation/main/index
[22] Microsoft's robot editor confuses mixed-race Little Mix singers
https://www.theguardian.com/technology/2020/jun/09/microsofts-robot-journalist-confused-by-mixed-race-little-mix-singers
[23] The Robots Microsoft Assigned to Do My Job Can't Do Ithttps://www.vice.com/en_uk/article/k7q3je/msn-news-algorithm-robots-microsoft-cant-do-my-job
相关推荐
机器人搞不出大新闻
央视新闻入驻,继搞学习之后年轻人爱在B站看新闻
潮科技 | SOMATIC利用VR环境训练AI机器人清洁工搞卫生,未来的目标客户是机场、赌场
俄电视台启用机器人主持新闻,表情僵硬让人害怕
微软用AI取代人工编辑,未来的新闻行业会由机器人统领吗?
如果你喜欢吃鸡,那你也会喜欢大疆这款机器人
迷你仓,走不出北上广深
传统巨头搞AI:技术不行,但我有钱啊
自动化新闻案例集结:国际媒体新闻编辑室如何利用AI?
RTX3080被黄牛炒上天,英伟达:都被机器人买空了
网址: 机器人搞不出大新闻 http://m.xishuta.com/newsview33513.html