大模型进入网文行业,最终会替代作家吗?

来源:《财经》杂志 2024-06-22 19:53:45

来源 | 财经E法 文| 邓思邈 编辑 | 郭丽琴

大模型正通过AI翻译、协助作家创作、丰富粉丝文化活动这三方面赋能网络文学行业发展。

过去两年,AIGC浪潮不断刷新人们的认知和想象。

随着技术的纵深发展,大模型究竟有没有用、怎样为行业公司解决现实业务问题被摆上桌面。

不同的业务场景需要不同的大模型发挥作用,例如医疗大模型、能源大模型、金融大模型、网文大模型等等。IDC中国研究总监卢言霞表示,不同的大模型——即便是一个行业里的不同场景大模型差别都会很大,而共同之处是简单推理、情绪识别等基础语言能力。

接下来,本文将从火爆的网络文学行业切入,观察AI大模型是否能赋能该行业,并引导行业走向新的发展阶段。

大模型进入网文行业

中国社会科学院2月发布的《2023年中国网络文学发展研究报告》指出,当前AIGC在网络文学海外出版、创作辅助、同人粉丝活动中的应用,已经对行业的发展产生了极其深远的影响,未来更有可能利用其强大的多模态转化能力,在IP前置开发等领域大显身手。

从业内公司披露的最新进展来看,应用场景确实集中在前述三大板块。那么,目前涌现出了哪些垂直大模型?各自能力表现又如何?是否真的能够满足实际需求?

首先来看AI翻译助推网文出海这一场景。

区别于一般的AI翻译,专为网文翻译设计的大模型有何优势?A股上市公司中文在线在其2023年年报中表示,可深入理解源语言和目标语言的文化背景与语境差异,从而实现更为精准和自然的本土化翻译,确保了内容在跨文化传播中的精准性和本土性。

在这一领域,已出现专业服务提供商。为内容出海提供AI解决方案的推文科技在其官网称,迄今已有包括中文在线、掌阅科技、纵横文学、磨铁阅读、咪咕阅读在内的90多家文学网站加入其发起的“中国网文联合出海计划”,已有超过6000部中文作品经由其AI服务翻译出海。

根据检索,目前已经涌现的网文翻译大模型包括:Webnovels AI、YesChat、Abderrahman Alami-Afilal为网文翻译打造的ChatGPT自定义版本等等。

阅文集团副总裁黄琰近日透露,阅文花了近9个月开发出AI翻译引擎,该公司目前已经有超过30%的海外收入来自于AIGC和大模型的翻译。他表示,专注于网文翻译的大模型要想做好,前提是必须得深刻理解内容的世界观,如果按照常规方式翻译,会出现翻译的每个字都对,但读完以后发现丢失了作者表达内涵的情况。

黄琰以网文里常见的“坐忘道”一词为例,该词最早出现在阅文旗下起点中文网平台的小说《道诡异仙》里,在小说中坐忘道是一个特殊的门派,以捉弄人、骗人为乐,寻得越多乐子便可越快提升功力。后来这个词被网友演绎成某种“整活”或“愚人玩笑”的代名词,常规的翻译软件很难用确切的单词将其表达出来。

中文在线2023年年报显示,已将超过2500万字的中文网络小说IP内容转化为外语版本,并推向海外市场;截至2023年12月31日,阅文旗下海外门户“起点国际”(WebNovel)已上线约3800部中国网文的翻译作品,平台累计访问用户约2.3亿;纵横中文网官方微信公众号2023年9月披露,近3年来纵横累计出海作品数量达到近400部,涉及13个翻译语种。

随机查阅WebNovel、TapRead等平台上翻译自中国网文的作品列表,国外读者评价参差不齐,正面评价包括“小说的写作方式让我完全沉浸其中”“非常感谢把这部小说翻译成英文”“感谢与我们分享这个精彩的故事”等,但也有评价说“有些小说翻译质量挺差的”。

来源:来自WebNovel平台,小说名为《From CEO to Concubine》

2023年12月发布的《2023中国网络文学出海趋势报告》提到,2022年中国网络文学全行业海外营收规模达40.63亿元,同比增长39.87%。中国网文作品的翻译语种达20多种,涉及东南亚、北美、欧洲和非洲的40多个国家和地区。据此报告,在内容题材方面,海外网文作品已形成15个大类、100多个小类,网文前5大题材类型为都市、西方奇幻、东方奇幻、游戏竞技、科幻。

再看大模型辅助作家进行创作这一应用场景。

现有的AI辅助网文创作工具,功能类似之处,以百度作家平台、阅文集团的“作家助手妙笔版”、中文在线的“逍遥”大模型、星火网文助手这几个为例,功能都包含根据文字指令生成细节(为人物起名,生成动作、人物、环境描写等等),主要作用是为作家提供灵感和素材。

当我们把同一个问题拿去问这几个大模型,问题为“描写一个东方、古代的青年村姑形象,需要有容貌和衣着描写,需要刻画出人物的亲切感”,得到的答复对比如下。

百度作家平台生成的文字较长,共有520个字,以长句为主:

(篇幅较长,未作完整展示)

“作家助手妙笔版”对于这一问题,给出的答案较为简洁:

而星火网文助手给出的答案达到601个字:

(篇幅较长,未作完整展示)

秘塔科技旗下的“秘塔写作猫”,回复一共515个字:

(篇幅较长,未作完整展示)

而OpenAI最新的GPT-4o回答的内容包括682个字,并将答案分为“容貌”“衣着”“性格与亲切感”“总结”四部分。

(篇幅较长,未作完整展示)

值得注意的是,中文在线的“中文逍遥”大模型于2023年10月13日发布,据称可实现一键生成万字小说,一张图写出一部小说,一次读懂100万字小说,该大模型于今年5月通过备案,目前仅向部分作者开放使用。

这些大模型对于网文写作有用吗?据阅文2023年年报,作家助手中AI功能的周使用率已达30%。但畅销网文作家公子衍则表示,AI暂时只能作为辅助,例如想要描写人物或者给人物取名字时,想不到词汇了,就可以借用一下。

最后是关于AIGC在粉丝文化活动中的应用,这一点侧重于读者端。

目前,一些网文中的人物角色已经被制作成了AI聊天机器人,例如阅读平台掌阅科技聚焦阅读过程中的“聊书”“聊人”两个场景,面向读者群体推出了AI应用“阅爱聊”,据其财报称,目前该应用尚未对公众开放,正在小范围用户测试中。

而阅文2023年推出了筑梦岛App,据应用官方介绍,不但可以与虚拟人物对话,还可以由用户自主创建出想要的人物角色,这款App在苹果App Store的评分情况显示为4.4分(满分为5分)。筑梦岛总经理葛文兵在4月的发布会上表示,在原创角色、游戏角色、动漫/影视角色、网文角色这几项里,AI角色的制作难度呈现出逐渐递增的趋势,而随着用户对AI角色质量的苛刻程度逐级提升,网文IP角色定制很难做,因此筑梦岛选择与商汤科技合作,主要是基于商汤的商量拟人大模型为用户提供PUGC(专业用户生产内容)的AI角色生产流程。

卢言霞认为,网文大模型背后,技术上可能需要基础大模型厂商帮助其预训练,或者基于基础大模型进行再次训练和调优。

黄琰透露,阅文拥有充足的算力基础,在不同的场景里会选择不同的合作伙伴,在不同的地方有不同的匹配。而据中文在线年报数据,2023年该公司用于“中文逍遥”大模型的研发支出约为309万元,可应用于AI大模型训练的数据集已超过60TB,并且为自有大模型“中文逍遥”设立了专门的数据标注团队。百度副总裁王颖在2023年9月的百度联盟峰会上透露称,“百度写作助手”主要依托于百度文心大模型。

AIGC会颠覆网文创作吗?

AIGC的浪潮势不可挡,各行各业都在极力拥抱。中国工程院院士邬贺铨在IDC机构发布的《2024年AIGC应用层十大趋势白皮书》中表示,大模型、AIGC是当前全球数字经济发展的热点和趋势,也是人工智能重要的核心技术;面对AIGC技术既要抓住机遇立即行动,也要为人工智能的长跑做长期打算,从长布局。

网文行业当然也不例外。掌阅科技在2023年年报中表示,该公司将会推动AIGC在内容生产、营销推广、产品创新等领域深化应用。中文在线更是在年报开头用了4页的篇幅阐述怎么利用好AI赋能内容行业。中文在线董事长兼总裁童之磊提到,AI不仅仅是一个提高生产力的工具,也是一个满足所有人自我需要的工具。黄琰则在在近期表示,阅文集团将会关注IP和AI结合的具体落地应用场景。

卢言霞认为,网文领域的业务都是文本,确实有极大可能被大语言模型彻底变革,有实力的网文公司可以考虑推出自己的专属大模型。自有大模型有助于提质增效,甚至可能改变其业务模式。

但AIGC目前在网文行业激起的水花还不大,AI也尚未发展到取代作家地位的程度。

关于这一点,黄琰表示,现在或未来几年的大模型,单纯文字创作写不出什么好作品,阅文也不鼓励网文作家完全依赖大模型来写原创小说。中文在线CTO吴疆在接受媒体采访时曾表达了类似的观点,“‘中文逍遥’大模型的作用不是取代创意,而是辅助有创意的作者更省力地写出好内容”。

不过已经有作家更积极地拥抱大模型。今年2月,日本文学大奖芥川奖得主九段理江承认,其获奖作品《东京都同情塔》有5%是AI直接生成的,并称AI有助于释放创造力。

卢言霞表示,未来大模型和小说作家的关系是融合、互补、并行的,人有人的情感等优势,大模型则可能会有成本优势。网文大模型未来理应有更多想象空间,例如进行独立创作,甚至赋能每个人创作作品。

她认为,包括网文大模型在内的垂直大模型,要想形成自己的技术壁垒,需要积累丰富的数据,降低成本,不断打磨并做好工程化。