人工智能的正反两面:能帮原创者维权,也能帮抄袭者侵权业界
题图来自:视觉中国
九月是让人无心工作的一个月,为什么?因为娱乐圈的八卦实在太多了啊!不是节目抄袭,就是艺人行为不端。实际上,2017年自开始以来,娱乐圈就一直没让吃瓜群众闲着。作为文字工作者,在众多火辣辣的爆料中,我们更关注的还是抄袭、维权这些和知识产权相关的东西。
在中国,知识产权侵权成本极低,想要维权则程序复杂。很多时候,都是由网友发掘到抄袭,自发寻找证据并公之于众。可原创者自己站出来维权时,常常要消耗大量精力搜集证据,三番五次的奔波于各种机构,承受着“炒作”、“蹭热度”种种舆论压力。
更多的情况是,很多人在不知情的前提下做着侵权行为,很多人并不知道自己被人侵权。所以,我们今天的主题是,面对这种情况,人工智能可以帮上什么忙吗?
知识产权侵权举证难?AI或许是解决方案
当然可以,而且普及度会越来越高。
首先,人工智能可以解决搜集抄袭证据这件耗费精力最多的事。前一阵广告圈一直在传一篇文章叫《去年使用葛优躺表情包的公众号,今年都被告侵权了》,里面写到了很多品牌方侵权明星肖像权而不自知的案例。
很多人都在困惑,怎么我刚一用图,明星的律所就找来了?难道律师们每天什么都不干,就盯着别人有没有用明星的照片?当然不是啦,直接爬取各个品牌的数据,用图像识别比对明星照片,轻轻松松就能找到谁用了明星的照片。
如果可以直接用 传感器获取明星更详细的人脸数据,相信任何肖像侵权、山寨模仿者都不能再作祟。至于葛优表情包这种一张图片经过简单加工就传播很多次的,想抓包简直是太简单了。
以上只是侵权行为的第一阶,事实上对原创者伤害最大的,是那些模棱两可的“再创作”式抄袭。
上图则是网友制作的调色盘,指出两篇小说的相似之处。在文学抄袭中常常存在这种调换句式和形容词的洗稿式抄袭,很多时候还涉及到情节的抄袭。阅读之后,往往会觉得有哪里不对,却又很难指出来。同时,为这种抄袭方式举证非常麻烦,普通的论文查阅式的程序很难检查出来,需要人为进行一遍遍的阅读和比对。
这时NLP的语义理解能力就可以发挥很大作用,通过语义理解识别出意义相近的词语,再利用LSTM的记忆特征识别出被改变的句子结构,原本需要被人为识别出的相似段落。这样一来,不仅举证的速度会提高,或许还能识别出很多人为难以发掘的相似点。
AI:比抄袭,我不是针对谁……
此外,人工智能和新技术还可以在很多细节方面帮助原创者维护自己的权力。比如简化知识产权申请过程、区块链记录信息防止抄袭修改等等。但另一方面,人工智能很可能会让侵权变得更加容易,或者说让侵权者更容易钻法律的空子。
比如,在字体侵权这件事上,就存在不少问题。很多广告公司都会被告非法商用某某字体,最终要赔付大量费用。不过学界和实务中对于字库大致达成共识是,具有独创性,构成美术作品的字体,才能进行维权。
可对于独创性的标准却相当模糊,如果对某一个字库的字体全部加上一些的细小的改动,是否就可以将其称为自己的原创。如果有读者还记得我们对神经风格迁移技术的讨论,就会发现,用算法为字体进行改动,可能比我们想象中要简单多了。甚至我们可以对字体进行一些人眼难以察觉,只有机器能鉴别出的变化,到时候侵权的界限又该如何限定?
上图,是一位被爆出抄袭的插画家的作品,她抄袭的主要方式是把真人照片经过底片叠加等等方式进行处理,再加入少量手绘内容,就成了一副价值不菲的“插画”。
可即使看过这两张图片的人,也很难明显的感觉到两幅图片有什么相似,可当把两张图片重叠时,就能发现明显的相似。抄袭消息被曝光的年代,作者还只是用PS+手绘板进行操作。可在今天,同样利用神经迁移算法,这样的“再创造”已经可以批量创造,并且可以被创造成各种风格。
而且这种抄袭方式被发现的几率很低,即使是利用图像识别技术,也没有人会为每一幅作品进行全网比对。更可怕的是,我国知识产权保护秉持的是“只保护表达、不保护思想”,也就是说,如果你的画风和某位原创者一模一样,可画的内容是原创,你的行为就不涉及到侵权。
如果大家还记得prisma这款图像加工软件,就会知道,用机器学习模仿某一种绘画风格的成本极低,并且可以批量加工处理。
在未来,当我们发掘一位新锐艺术家的作品时,很可能下一秒就有大企业用神经网络copy了他的风格,制成商品开始售卖。对于原创者来说,人工智能抄袭造成的伤害,往往比人抄袭造成的更大。
AI能否帮助原创者权益范围标准化?
所以,说到最后人工智能对我们的知识产权保护毫无作用甚至有害无益吗?但我们认为,人工智能对知识产权最大的保护,或许是权益范围的标准化。
就像字体里的案例一样,知识产权的保护范围常常是“独创性”这种模糊的概念,无法量化,也导致了侵权案件的最终判决常常不能服众。在音乐作品的知识产品保护中,可以通过音节相似的数量来判断,可在绘画、文字作品中,侵权常常无法量化。可有了人工智能,我们或许可以反向计算出两款作品中有多少相似之处并且用数据呈现出来。
或许未来,我们需要一个知识产权保护平台,发布作品之前,先经过平台中作品进行比对,比对通过后才能通过“原创认证”。还可以对原创作品进行保护,比如他人不可以将作品作为算法模型的训练数据,除非支付给原创者一定分红等等。总之,科技的进步永远都走在法规前面,但利用科技推动法律法规的建设,或许能让技术发挥出更多价值。
1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。