论智能新闻的法律保护模式
【作者与文章来源】
作者:陶乾,中国政法大学法律硕士学院副教授。
文章来源:《中国编辑》2022年10期。
摘要:当下,人工智能技术已经在新闻生产领域应用。一家媒体发布智能新闻之后,其他媒体能否无偿转载,取决于智能新闻是否属于法律所保护的财产以及其权利归属于谁。法律上肯定智能新闻的经济价值、保护投入者的相关权益,能够促进智能新闻的消费与传播,符合当下传媒业与数字经济的发展态势。对智能新闻提供法律保护,需要考虑协调智能新闻与人类记者创作的新闻的保护力度以及平衡各方主体的利益。根据智能新闻的生成机理,可将其定性为在算法运用之下基于原始数据而生成的衍生数据。在保护模式的选择上,应当根据新闻的具体内容,对人工智能参与生产的创作型、分析型和描述型新闻进行类型化处理。
关键词:人工智能;智能新闻;财产权;作品;数据成果;版权保护
当下,人工智能与新闻产业的融合不断走向深入。智能新闻是计算机通过基于算法设计的人工智能软件自动生成新闻以及推送新闻的一种新闻生产形式[1]。在财经、体育、天气、健康等领域的新闻生产过程中,国内外一些媒体引入人工智能“机器写作”。人工智能依托大数据、算法、深度学习等先进技术所产出的智能新闻与人类记者创作的新闻在外在表现形式上差别甚微,这引发了智能新闻是否受法律保护、保护模式与强度的探讨。我国的知识产权司法实践已出现了因被告未经许可使用原告传播的智能新闻引发的法律纠纷。在腾讯诉上海盈讯公司著作权侵权案中,深圳市南山区人民法院认为,腾讯公司推出的Dreamwriter生成的财经报道文章具有一定的独创性,能够反映原告主创团队相关人员个性化的安排与选择,故属于文字作品,著作权属于腾讯公司[2]。在该案之前,北京互联网法院在另一起案件中认为人工智能自动产出的研究报告虽有受法律保护的必要,但其不属于著作权法意义上的文字作品[3]。两起有冲突的判决表明法律界对于是否应当保护智能新闻、如何保护以及权利人是谁这些问题存在争议。智能新闻在法律上的定位是新闻传播业革新发展需要面临的重要问题。
一、法律保护智能新闻的必要性
人工智能程序生成新闻的过程大致包括以下三个步骤:第一步,通过人工神经网络从大量数据中发现潜在的新闻线索,对相关新闻素材进行清洗和标准化处理。第二步,通过算法,对基础数据进行自动分类、标引和关联,并结合历史新闻数据,构建数据和目标对象之间的函数关系模型[4]。通过应用深度学习技术,人工智能新闻生成软件从海量新闻示例中提取表达方式、学习写作方法和语言风格。第三步,根据使用者输入新闻的要素并下达的创作要求,或者将前述满足触发条件的新闻数据自动输入写作模版,自动生成新闻内容。人工智能软件能够根据智能评估系统和区块链技术对传播效果进行反馈,不断学习新的内容并优化其新闻生成体系。智能新闻与其他类型的人工智能生成内容一样,其“创作”过程是在深度学习的基础上形成的一种有目的的产出逻辑[5]。
智能新闻以其强大的时效性、精准性和数据挖掘能力,从量化新闻信息内容采集,到新闻生产效率的大跨度提升,再到新闻时空价值的扩展,都能够发挥重要作用,智能新闻助力媒体抢占受众市场,不断带来新的经济利益增长点。在新闻采集环节,人工智能的信息采集和数据挖掘能够为记者提供强有力的工具支持。从新闻的生产端来看,运用算法对大数据进行量化分析,挖掘信息内在联结特征,使用人工智能提取热点和生成新闻的速度是人类记者所不能及的。从新闻的消费端即用户的视角来看,模块化的新闻稿确实难免生硬和高度同质化,但是这种颇有“八股文”之风的内容也能提升用户提取有效信息的速度,换言之,一些文本的最大价值就在于有效信息的快速传递,这种场合下智能新闻无疑与这一价值高度契合。总之,人工智能在新闻生产领域的应用能够节约新闻采编的人力成本,有利于新闻产生效率的提升。
智能新闻作为人工智能生成成果,具有经济价值,在产业界已然成为事实上可交易的财产权客体。如果其权属处于不确定的状态会带来时间和成本的浪费,没有被精确界定的财产权会增加法律上的不确定性,进而会增加交易成本,最终将阻碍创新[6]。如果将人工智能生成的新闻作为公共领域的内容,可以被无偿地自由转载使用,则会产生一些负面影响。在利益驱使下,诸多“搭便车者”将会出现。第一,有人会对智能新闻进行改动后以作者身份将其发表,或者创作了部分内容的权利人将对整个新闻内容主张版权。这不仅扰乱了版权市场秩序,还会阻碍智能新闻本身的消费功能的实现。第二,著作权法保护人类创作的新闻作品,即便是不构成作品的事实报道,媒体之间的转载也受到一些法律限制。如果智能新闻不受法律保护,那么,充斥网络的将是智能新闻,久而久之,将会导致那些由人类记者撰写的、更能体现人文关怀的深度报道被排除在大众使用范围之外,人类作者渐渐失去了创作欲望,甚至被迫退出作品市场[7]。
保护智能新闻投入者的相关权益能够带来积极的效果。一方面,能够促进智能新闻的消费与传播,让公众获取更丰富的知识产品。虽然审理上述两起纠纷的法院对于人工智能生成内容的可版权性问题的意见不同,对人工智能生成内容的创作主体、人工智能生成内容的过程及其“非工具性”的认定存在分歧,但均认可应对人工智能生成成果予以法律保护,以促进对生成内容的传播与利用。另一方面,对智能新闻给予法律保护,能够鼓励人工智能技术与新闻产业的融合发展,符合当下传媒业发展态势而且有利于推动人工智能技术本身的开发与优化。
二、法律保护智能新闻时应考量的因素
通过财产权机制保护智能新闻,需要考虑到智能新闻区别于人类写作的新闻的特殊之处。从传播学的角度看,需要权衡对于智能新闻予以财产权保护是否动摇了新闻的本质和价值,是否加剧新闻伦理风险的形成,是否会削弱媒体承担的公共信息服务功能,是否会造成新闻传播秩序的混乱以及给文化产业带来冲击。具体而言,需要从以下四个方面进行分析。
第一,人工智能无法像人类作者那样完成新闻文化价值的创造与传递,在缺乏编辑记者的参与下,完全由人工智能通过主动学习自行决策新闻的内容和新闻的呈现方式,将会造成新闻传播秩序的紊乱。就智能新闻的发展现状来看,新闻生产传播处于人类智能与弱人工智能共同协作的阶段[8]。一个事件该不该报道、选择哪些信息报道、什么时间发布、通过什么渠道发布,需要记者基于新闻价值的判断来对此进行决策。根据新闻“把关人”理论,新闻并非“有闻必录”,而是一个根据一定标准、立场和传播政策进行信息取舍的过程。人工智能技术虽然可以准确传递事实,却无法“计算”某个新闻的社会效应与舆论影响,不能进行议程设置与价值引导,从而推动社会朝着更理性的方向发展。因此,“记者和编辑在使用智能平台引用数据或新闻资料进行新闻内容生产的过程中,不得不需要针对智能媒体生产方式和产出结果在新闻伦理方面的弊端进行价值加权”[9]。《销声匿迹》一书在梳理了漫长的机器代替人力的历史后提出“最后一英里悖论”,意指使人类免于劳动的愿望却总是给人类带来新的任务,无论技术如何发展,永远需要人类在背后补足机器智能的最后一英里,永远需要人类的创造力和活力来补足机器智能出现的问题[10]。不可否认的是,人工智能生成内容同样会面临“最后一英里悖论”,也就是说,虽然人工智能可以生成新闻,但是需要人类来为人工智能提供训练数据、筛选数据、审核文本、更新程序,等等。那么,在考察每一则人工智能参与下的新闻是否应受法律保护时,就需要类型化地分析在该新闻的生成过程中,人类扮演的是创作者的主要角色还是补充技术不足的次要角色。
第二,人工智能的准确性高度依赖其“学习”的基础数据。在新闻领域,借助智能监测识别技术与信息追踪等技术,人们获取数据的能力大大增强,新闻“嗅觉”也更加灵敏,能够在庞杂的网络信息中发现潜在新闻线索。然而,网络空间充斥着网络用户的个人言论,信息的真假无法辨别,人工智能系统只是自动地从大量数据中寻求符合设定条件的新闻消息来源,总结规律与模型,缺少对消息来源的核实,这就影响了其所生成的数据的准确性。人工智能所采集的新闻基础数据如果不够客观和全面,将会导致隐性偏见。另外,智能新闻生成过程中,不可避免地会对供给数据进行存储和加工,这可能会触及他人的著作权。因此,需要厘清人工智能“挖掘”使用海量数据的行为性质,通过制度来保障人工智能采集数据的全面性与准确性。
第三,人工智能赋能于新闻内容生产的同时,也给“新闻洗稿”行为提供了便利。所以,法律保护智能新闻的同时,也需要规避智能新闻本身的侵权风险。此外,新闻领域的事实消息不受著作权保护。为智能新闻赋权,则使得人工智能生成的事实消息在通过媒介“二次售卖”进行内容变现的同时,还可以通过财产权获得回报。智能新闻在内容独创性上弱于人类记者创作的内容,却获得更多的保护,这亦不合乎逻辑。因此,需要有类型化的思路,明确哪些是法律保护的对象,从而解决人工智能生成内容的传播逻辑与财产权保护逻辑的冲突。
第四,智能新闻不仅关乎人工智能程序的开发者与使用者的利益,还关乎人类记者、社会公众与媒体的利益,所以对智能新闻的保护力度应当控制在合理适度的范围内,合理考量智能新闻的财产权收益分配,划定智能新闻私有权与公共领域的边界。如果对智能新闻的保护力度过强,将对创作内容多元性和文化多样性造成致命冲击。一方面,智能新闻的格式相对固定,只有形式美感,难以出现有思想、有温度、有品质的新闻作品。在话语表达与文本结构上,智能新闻趋于公式化、浅表化和同质化,缺乏对事件的立体描述和深度分析[11]。相比而言,人类能够更加巧妙地运用文字语言进行更多元的表达。另一方面,人工智能内容生产的原理是对人类作品的深度学习,人类原创性作品的匮乏也会影响到人工智能生产新闻的质效,造成新闻表达趋向单一性、结构化的恶性循环。智能新闻在内容独创性上弱于人类记者采编的新闻作品,但若二者所获得的法律保护力度相同,会挫败人类记者的积极性,那么未来“优秀新闻人”将越来越少,而完美的“写作机器人”将占据新闻市场。因此,认为“具备独创性的智能新闻当属新闻作品,并应当享有著作权”[12]的观点并不可取。为化解智能新闻与人类创作新闻共存下的冲突,对智能新闻的法律保护,需要把握“三个度”:对智能新闻的保护力度不应当高于对人类独立创作的新闻作品的保护力度;对智能新闻应当有强制登记与强制标识要求;特定情形下,未经许可使用智能新闻不构成侵权。以此,方能解决智能新闻与人类记者的新闻作品共存引发的冲突。
三、智能新闻在民法上的数据属性
回顾智能新闻的机理可以发现,人工智能本质上是一种以大数据为基础的算法程序。在深度学习模型下,程序通过构建具有很多隐层的机器学习模型和海量的训练数据来学习更有用的特征。相应地,人工智能自动生成的新闻本质上也是一种对基础数据进行记录、存储、加工、计算和分析后所产生的具有经济价值的衍生数据,属于《民法典》第一百二十七条规定的“数据”的一种。在数据成为社会重要的基础资源的情况下,建立数据财产制度,赋予数据财产权,保护数据财产具有必要性[13]。因此,应当将智能新闻的法律保护模式置于数据保护模式这一大的范畴之下。
对这类衍生数据成果,有必要在法律中创设衍生数据权,又称为数据处理者权,即“数据处理者对其以数据为基础并通过技术获得的数据成果享有的财产权”[14]。这项新权利的创设,能够通过新设规则来划定其权利行使边界。继而,跳出著作权法为人类新闻作品提供的保护框架,赋予智能新闻弱于保护人类创作新闻的保护力度。为保证数据获取的全面性与结果的准确性,缓解人工智能编创过程中的隐性偏见,则需要制定规则将机器学习中的作品利用行为纳入合理使用的范畴 [15],明确何种情况下的文本与数据挖掘不需要基础数据权利人的授权。
从制度效果的角度来看,这一权利的创设既能够为衍生数据的初次传播提供支持,也有利于人工智能投资者回收前期的投资。对初次传播者而言,可以从人工智能所生成的新闻中直接获得传播收益。对投资者而言,只有具有明显可预期的经济回报,面对耗资巨大的人工智能技术的开发才有充足的动力。在麦克卢汉“媒介即讯息”的媒介理论中,真正有意义的讯息并不是各个时代的媒介所提示给人们的内容,而是媒介本身。只有人工智能技术不断在新闻创作、新闻传播领域发展应用,才会更好地促进优质新闻的不断涌现以及新闻产业在智媒体时代的繁荣。此外,这项新权利的创设,能够通过新设规则来划定其权利行使边界,继而跳出著作权法为人类新闻作品提供的保护框架,赋予智能新闻弱于保护人类创作新闻的保护力度。
智能新闻涉及多方主体,包括人工智能程序的开发者以及这一程序的使用者,这些主体身份之间可能存在重叠与交叉。通常情况下,智能新闻的使用者大多为媒介组织,因为其不仅拥有强大的新闻素材数据库,可以为人工智能程序提供源源不断的“养分”,而且其还拥有具备媒介素养的记者,可以对新闻内容进行审核把关。而智能新闻的算法程序大多数为媒介组织委托计算机公司设计开发,媒介组织在传播与投资方面具有主导作用,故一般而言,媒介组织作为人工智能程序的投资者和使用者,当然的成为智能新闻的权利主体,除非当事人之间对人工智能生成内容的权属有不同约定。
需要注意的是,与其他数据成果不同,新闻是一种时事性的内容,新闻的广泛传播是对公众知情权的一种保障。所以,著作权法不保护事实消息,并且为时事性文章设定了合理使用制度。当我们在衍生数据权之下为智能新闻提供保护时,也需要考虑到新闻的传播价值,在保护期限、合理使用等方面为权利设立更加严格的行使限制。对于人工智能生成的关于政治、经济、宗教问题的时事性文章,除非衍生数据持有者明确声明不许刊登和播放的,其他媒体进行刊登或者播放,应当不需要获得数据持有者授权,也不需要支付报酬。
四、类型化视角下对人工智能参与生产的新闻的保护
智能新闻的生成与发布离不开人类的参与,但是对于不同类型的新闻,人类在新闻生成与后续传播环节介入的程度有所差异,并非所有的人工智能技术参与生产的新闻均是智能新闻。所以,在人机协同参与新闻生产的情况下,还需要根据新闻的具体内容以及人类在新闻生产中的角色,在保护模式上进行类型化区分。
在所有的新闻类型中,最具有独创性的是创作型新闻,即媒体对某新闻事件在相对集中的时间和板块中,运用广视角、大容量、深层次、多手法的思想视域与报道方式所进行的专门话题或问题研究报道,包括新闻调查性报道、解释性报道及预测性报道等[16]。深度报道以问题为导向,其所关注的是有具有时代性的、大众普遍关注的社会热点问题。算法作为一种数据驱动式的“直觉雷达”可以在深度挖掘潜在热点问题方面发力。但是,就智能新闻发展现状来看,人工智能还无法生成深度报道,必须由人类记者通过独立思考、追根溯源,揭开社会事件的迷雾,还原事件的真相,阐述问题的本质。如果说问题是深度报道的基础,那么思想上的深度分析和阐述便是其灵魂所在。创作型新闻的采写不是各方观点的简单罗列,而是需要在逻辑链条中进行价值判断。一篇深度报道呈现深刻的分析内容,体现记者思考的科学性,传递特定的公共利益,无疑构成《著作权法》上的文字作品。人工智能在深度报道生成的过程中“仅仅在选题策划、信息采集、文本处理以及后期加工等方面表现出智能化新特点”[17],起到了工具性的辅助作用,帮助记者发现潜在问题,更快速精准地掌握数据和资料,但体现报道思想性的部分仍是由人类记者主导完成,故该作品的生成虽然有人工智能的应用,本质上仍是人类作品,作者属于人类记者。如果未来人工智能有能力生成深度报道,那么,该深度报道是基于对海量数据的深度学习,属于衍生数据,对该智能新闻的生成进行投入的数据处理者享有前文所述的衍生数据权。
最能发挥人工智能技术优势的新闻是分析型新闻。依托人工智能对大数据的抓取、挖掘、统计来展示数据背后的关联与意义的新闻报道形式,也被称为“数据新闻”。在此种新闻报道中,人工智能进行数据采集、挖掘、分析,从而形成可视化的指数型、预测型、统计型报告。如果该统计结果仅仅为记者写作分析型新闻的素材,记者根据报告来梳理数据之间的关系、讲述背后的逻辑链条,新闻中能够体现出记者的个性化表达,那么,该分析型新闻属于记者创作的作品,受《著作权法》保护。但是,如果此分析型新闻基本上是由人工智能自动生成,人类参与的程度极低,那么,应当将其作为前文所述的衍生数据进行法律保护。未经首次生成该智能新闻的媒介组织的同意,其他媒体不得进行传播。
在诸多新闻中,独创性最低的是描述型新闻。人工智能在海量数据库中搜索新闻要素,结合给定的分析撰写模型,在极短的时间里实现新闻报道的自动化生产。描述型新闻既包括纯粹的事实消息,也包括在事实消息基础上加工的新闻。目前人工智能生成的纯粹的事实消息大部分是财经、体育、房地产领域的消息,仅仅包含了何时、何地、何人、何事、何故、如何等要素。这种内容相对模块化、结构相对固化的事实消息,即便是由人类记者写作完成,也无法构成作品受到保护,那么,人工智能生成的事实消息就不应给予赋权保护了。但是,根据最高人民法院《关于审理著作权民事纠纷案件适用法律若干问题的解释》,传播报道他人采编的时事新闻,需注明出处。同理,转载其他媒体利用人工智能生成的事实消息,也应当注明出处。对于在事实消息基础上进一步加工形成的新闻,如果是由人工智能自动生成,则落入衍生数据的讨论范畴;如果是人类记者在人工智能生成内容的基础上经过加工、整理和汇编而成,则可以作为著作权法上的作品进行保护。
五、结论
法律作为调整社会生活的规范体系,是实现一定价值的手段。从宏观层面,制度保护智能新闻的同时,亦需要起到推动新闻成果传播、多元开放的效果。面临新闻内容生产格局的巨大改变,法律制度设计需要考虑到专业媒介工作者的作用和价值,考察人工智能“创作”与人类创作的和谐共生。从微观层面,制度发挥私权激励作用的同时,需要控制私权对其他主体利益以及作品创作环境的影响。应当根据新闻的内容与类型,结合人类在新闻生产过程中的参与程度,准确地区分智能新闻与人类创作的新闻作品。一般来说,创作型新闻构成文字作品,作为人类作品受著作权法保护;描述型新闻多为事实消息,无论生产主体是谁,均难以受财产权保护,除非是在事实消息基础上进一步加工所得的新闻,可以根据加工过程中人工智能的适用程度选择保护方式;而基于数据挖掘、统计的分析型新闻则最宜设立衍生数据权予以专门保护。通过对数据与算法驱动下所产生的智能新闻的保护,不仅可以凭借人工智能这一产业变革的核心驱动力激活新闻生产生态,还能激励投资者推进人工智能技术深化发展,让更多优质的新闻故事与更多的受众见面。
注释:
[1] 杨保军,杜辉.智能新闻:伦理风险·伦理主体·伦理原则.西北师大学报(社会科学版),2019(1).
[2] 参见广东省深圳市南山区人民法院(2019) 粤 0305 民初 14010 号民事判决书。
[3] 参见北京市互联网人民法院(2018)京0491民初239号民事判决书。
[4] LECUN Y,BENGIO Y,HINtON G.Deep learning.Nature,2015 (521).
[5] 梅傲,郑宇豪.人工智能作品的困境及求解:以人工智能写作领域第一案为考察中心. 出版发行研究,2020(12).
[6] HELLER M. the gridlock economy:how too much ownership wrecks markets,stops innovation,and costs lives.New York:Basic Books,2008:22.
[7] 孙山.人工智能生成内容的著作权法规制:基于对核心概念分析的证成.浙江学刊,2018(2).
[8] 杨保军.再论“人工智能新闻生产体”的主体性.新闻界,2021(8).
[9] 薛宝琴.人是媒介的尺度:智能时代的新闻伦理主体性研究.现代传播,2020(3).
[10] 格雷,苏里.销声匿迹:数字化工作的真正未来.左安浦,译.上海:上海人民出版社,2020:40.
[11] 许加彪,韦文娟,高艳阳.技术哲学视角下机器人新闻生产的伦理审视.当代传播,2019(1).
[12] 沈思言,刘建.人工智能数据新闻作品著作权归属问题探析.中国出版,2019(8).
[13] 齐爱民,盘佳.数据权、数据主权的确立与大数据保护的基本原则.苏州大学学报(哲学社会科学版),2015(1).
[14] 陶乾.论著作权法对人工智能生成成果的保护:作为邻接权的数据处理者权之证立.法学,2018(4).
[15] 张颖.人工智能编创过程中的著作权问题探析.中国编辑,2018(9).
[16] 欧阳明.深度报道与写作原理.武汉:武汉大学出版社,2004:5.
[17] 王美儿,王景周,王海蓉.智能软件对新闻内容创作的辅助实践与思考.中国编辑,2021(3).