GitHub用AI帮程序员补全代码却惹怒了一群开源作者_伺服电动缸知识_爱游戏体育平台赞助马竞官网|爱游戏官方app登录网站
爱游戏体育平台赞助马竞专业伺服电动缸生产厂家,生产制造电动缸、伺服电动缸、进口电动缸、多级电动缸等产品。
伺服电动缸知识
GitHub用AI帮程序员补全代码却惹怒了一群开源作者
来源:伺服电动缸知识 时间:2024-06-21 18:54:12 浏览次数:18 次

  6 月下旬,微软旗下代码托管平台 GitHub 推出了能够对整行或全部代码给出 AI 分析建议的 Copilot 编程辅助工具。这款工具不仅仅可以支持多种编程语言,还能给出开发者修改意见,甚至根据简单的文字描述生成代码段。然而,这款怎么看都觉得是提升研发人员工作效率的工具,一经推出后,迎来的就没有欢呼,更多的是来自开源作者们的批判。

  “他们不打一声招呼,就直接拿走我们的代码去训练他们的AI模型,这简直太过分了!”

  在Twitter、Hackernews等社交平台和论坛上,慢慢的变多的开发者发出了对GitHub以及微软公司的声讨,更有甚者宣布自己今后将不会再使用GitHub:

  (大意:我不同意 GitHub 没有经过授权和未经许可就使用受版权保护的源代码作为其基于机器学习的GitHub Copilot产品的训练数据。该产品将受版权保护的代码注入其客户的软件中,而无需获取原始代码创作者的许可。

  我认为这是对版权所有者权利的严重攻击,因此我不会接着使用 GitHub 的服务。)

  要了解开发者们的愤怒源头,首先要知道一下GitHub Copilot是什么。

  GitHub Copilot是基于非盈利技术组织OpenAI的一个代码补全项目CodeX创建的。根据官网介绍,Copilot能轻松实现以下功能:

  从功能上来看,这都是一个对开发者很友好的工具,对提升工作效率非常有帮助,这一点在国内外的开发者论坛中也得到了不少的好评。

  既然是AI工具,总得有一个训练数据的来源吧?没错,正如文章开头说的那样:GitHub Copilot的训练数据全都是站内开发者贡献的开源代码,且并未告知开发者,这也是开发者们愤怒直接来源。

  据了解,微软未来还计划将GitHub Copilot做成收费的企业版本,这一点则更让开发者们不爽:“免费拿了我们的代码去训练不说,还想用它来盈利,而且对我们这些贡献者,微软一丁点补偿都没有!”

  (大意:我知道有人对这个工具很兴奋,但是GitHub偷拿了你的代码,用它训练了这个AI,甚至还考虑在未来向你收费。)

  不少开发者认为,这样的行为是很严重的侵权。随着话题不断发酵,GitHub Copilot被“骂上热搜”,甚至一度占据HackerNews热度榜第二的位置。

  起初,还有一些开发者认为,GitHub本身作为一个开源代码托管的平台,应该不至于做出如此过分的事情,然而当他们发送邮件向官方询问后,却得到了令他们失望的回复:

  (大意:这位开发者想知道当GitHub选择代码进行训练时,会不会区分许可证?然而官方的回复是,所有公开的代码都会拿来训练,并不会区分许可证。)

  GitHub官方起初为保护开发者的版权,提供了一套许可证机制(License),这样其他用户在使用开源作者的代码时,就要遵循一定的规则,不能任意使用。

  比如GPL许可,它要求任何人修改了软件后,修改后的内容也必须开源。因此,商业公司在使用此类代码的时候会非常有顾虑,因为一旦公司使用了 GPL 的代码,那么自己辛辛苦苦做出的修改内容也必须要通过 GPL 开源,让竞争对手也可以直接拿来用,很难形成竞争壁垒。这也劝退了一些想要拿开源代码“不劳而获”的公司或组织。

  可是,根据网友的反馈,GitHub Copilot虽然使用了包含GPL许可证的代码,却没有按照自己的规定将Copilot开源,这也同样引起了一些开发者的不满。

  当使用代码补全功能的时候,Copilot提供的代码片段非常有可能是某个开源作者的作品,这相当于未经许可使用了对方的代码,但是,使用者和被侵权者两方有可能都不知情。

  如果一位用户的代码补全采用了其他用户的GPL许可证代码,但因为这个用户不知情,并没有按规则开源自己修改后的代码,一旦后续发生了维权事件,这个责任该由谁来负?而企业开发者一旦使用了这项功能开发产品,并实现了盈利,是否应该给代码的原作者分成?或者应该由GitHub来给开源作者们一些补偿?

  很不幸的是,都没有,至少目前来看,GitHub和微软都没有这方面的考虑。甚至GitHub Copilot官方的声明上明确写着:

  “您在GitHub Copilot的帮助下创建的代码属于您自己......就像编译器一样,您使用GitHub Copilot输出的东西属于您。”

  自己辛苦开源出来的东西被一声不吭地拿走,之后又可能在自己完全不知情的情况下成为他人的盈利工具,难怪开源作者们会如此愤怒。

  一些开源作者们想要联合起来,对微软提起诉讼,可是面对着力量庞大的技术大厂,何容易。

  有关注此事的法律界的人说:关于科技巨头计划怎么样去使用开源资源库,法律上是没有一点规则或规定的。即使开发者们决定起诉微软,这也代表着可能会对怎么样去使用开源软件施加一套新的规则,这反过来又会让人们质疑开源的真正意义。

  总而言之一句话,即便被“喷”得这么惨,微软也未必担心会受到法律制裁,只要GitHub还在他们手里,怎么使用也不过是换一套规则罢了。

  GitHub Copilot带来的版权问题也引起了一些国内技术专家与开发者的关注。

  比如小米集团副总裁崔宝秋就曾在微博上表示:“这确实是新时代的开源面临的一个新挑战。”

  光锥智能也就“开源侵权与维权”的话题跟开发者们聊了聊。综合受访者们的回答,我们总结出新时代的开源难题一般存在于这样几个层面:

  一方面,“侵权”的边界很难界定,“开发者经常有借鉴别人思路的时候,或者参考了其他人的代码结构,在这种情况下,是不是涉及侵权呢?”他补充说,另一方面,即便真的有疑似侵权的情况,谁来判定侵权的事实是否成立呢?

  一位曾经参与创业的受访者告诉光锥智能:“我们以前因为类似的事情跟大厂‘正面刚’过,但是我们没办法证明他们的代码创意来自我们。”对方的回应与前文那位开发者说的情况极为类似,以“撞了思路”为由,将他们拒之门外。

  他补充说:“如果要反编译他们的代码,对方很有可能反过来把我们给告了,所以证据不足的情况下,下一步维权也难以走下去了。”

  综合前面几位开发者的讲述,想必读者们也发现了,开源代码侵权这件事,首先从法律认定上就比较困难。

  根据光锥智能的了解,目前我国暂时没发生过与开源软件许可证有关的诉讼,在法律层面上来说,这一部分也尚属空白。虽然有法律专家这样认为,可以从著作权、专利权等角度入手进行诉讼,但是难度较大,只能在培养法律意识方面多多加强,并呼吁国家尽快在相关领域建立可以借鉴的政策法规。

  另一方面,开源维权往往发生在独立开发者、小型初创团队/公司与一些大厂之间,“人家大厂有资金、有法务,我们就算想打官司,也未必打得过人家”,一位受访者无奈地表示,“对方吃准了你没时间、没精力、没钱,光是从时间成本上来说,我们也耗不过他们。”

  “甚至于”他补充说,“有些大厂因为嫌麻烦,收到维权邮件后,就直接问公司账户是多少,靠砸钱来处理问题,真的是又好气又好笑。”

  而国外的情况,想必大家在前文中也看到了,即便有过一些先例,即便有相对健全的法律,开发者们仍然只能吃哑巴亏,这是很多人非常难以接受,但目前又不得不接受得一点。

  在采访的过程中,光锥智能感觉到开发者们虽然对侵权问题深恶痛绝,但却无能为力;而行业内,也主要是依靠开发者们普遍较高的道德水准,或者公司的严格规定在进行约束。

  某科技公司CTO表示:“严格注意版权问题不止是公司规定,更是行业规定,如果出问题是要有法律责任的。”

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  突然爆雷,凌晨宣布闭店!知名篮球培训机构称“艰难而无奈的决定”,消费者:电话没人接,转课方案不合理

  【“6·26”国际禁毒日】金秀法院“集中宣判+普法宣传”齐上阵, 筑牢“拒毒”防火墙

  签了!108亿美元,航空巨头要买100架国产C919飞机!还获得了较大价格优惠

  一加 Ace 3 Pro 超跑瓷典藏版细节公布,Ace Performance专属标识

  2.73 英寸冷头屏幕,利民推出 Elite Vision 360 ARGB 一体水散热

相关文章