当前机器写作已经进展到什么阶段?
高考语文考试刚结束,百度公司的数字人“度晓晓”就拿出了自己的答卷,名叫《苦练本手,方能妙手随成》。一时间众人称奇,有的评分老师还给出48分。
其实,“度晓晓”是一款互动软件,写文章并非主业。百度为它花费的主要精力是制作外形,设计互动手段。即使如此,作为一个附带功能,“度晓晓”仍然能迅速生成一篇读得通的文章。
AI真的已经发展到代替人类写作吗?
了解AI的朋友都知道“图灵测验”:让测试者在分隔的情况下向被测试者提问,根据对方的回答判断是人还是机器。一旦测试者混淆不清,就意味着机器行为已经能与人类行为混同。按照这个标准,专门用于写文章的程序早在十几年前就暗地里通过了图灵测试。
想当年,美国麻省理工学院计算机专业三位研究生编出一个“论文自动生成软件”,代号SCIgen。他们给它赋予学术论文规范,让它从词库里随机抽取专业术语,自动生成论文,里面还有图表和引文,很是像模像样。
他们用SCIgen生成很多“论文”,到处钓鱼。终于在2005年,第九届系统论、控制论与信息论多学科国际会议收录了其中一篇。这3个人并非骗子,而是想以此证明很多学术论文都是形式主义的产品,毫无创见也可以录用。所以文章被收录后,他们立刻公布了真相。
图灵当年提出“图灵测试”的想法,还附带一个比率为标准。如果测试者对30%的结果判断失误,才可以认为机器通过了图灵测试。据统计,SCIgen生成的论文中,在全球各学术期刊上发表了十几篇。但由于不知道始作俑者究竟生成并投送了多少篇,没法统计成功比例。
不管怎么样,这已经算是近似地通过了图灵测验。SCIgen虽然是个闹剧,但它说明,在某些有严格规范的文体中,计算机程序已经可以代替人工来创作。“度晓晓”所模仿的高考作文,恰恰属于规范严格的文体,程序能够生成已经不算意外。
和论文相似,新闻报道也有公式可循,特别是体育赛果,或者股票分析,基本都是套话,只需要把具体结果填进去。最近几年,有些媒体开始用程序创作这些不需要文采,但极需要时效性的新闻。