被字節(jié)起訴索賠800萬(wàn)的“投毒”實(shí)習(xí)生,參與項(xiàng)目獲得AI頂級(jí)會(huì)議最佳論文
此前,OpenAI團(tuán)隊(duì)撰寫論文也曾獲得同一獎(jiǎng)項(xiàng)。
12月4日,有消息稱,字節(jié)跳動(dòng)前實(shí)習(xí)生田柯宇與字節(jié)合作的論文被人工智能頂級(jí)會(huì)議 NeurIPS評(píng)為最佳論文(Best Paper)。該事件今日引發(fā)廣泛熱議,一方面因?yàn)镹eurIPS本身在行業(yè)內(nèi)的影響力,另一方面因字節(jié)剛請(qǐng)求法院判令田柯宇賠償公司侵權(quán)損失800萬(wàn)元及合理支出2萬(wàn)元。
據(jù)公開(kāi)信息顯示,NeurIPS(全稱神經(jīng)信息處理系統(tǒng)大會(huì),Conference and Workshop on Neural Information Processing Systems)是專注于機(jī)器學(xué)習(xí)和計(jì)算神經(jīng)科學(xué)的國(guó)際會(huì)議。該會(huì)議由NeurIPS基金會(huì)主辦,通常在每年12月舉行。在中國(guó)計(jì)算機(jī)學(xué)會(huì)的國(guó)際學(xué)術(shù)會(huì)議排名中,被列為人工智能領(lǐng)域的A類會(huì)議。2020年,OpenAI團(tuán)隊(duì)發(fā)表的《DALL-E:從文本創(chuàng)建圖像》也獲得了最佳論文,是文本生成模型領(lǐng)域的重大突破。
此次NeurIPS公布的最佳論文由田柯宇所在的字節(jié)商業(yè)化技術(shù)部門與北京大學(xué)合作發(fā)表,論文題目《視覺(jué)自回歸建模:通過(guò)下一尺度預(yù)測(cè)實(shí)現(xiàn)可擴(kuò)展的圖像生成》,由包括田柯宇在內(nèi)的五人完成,田是第一作者,核心內(nèi)容探討一種可擴(kuò)展的圖像生成方法,通過(guò)下一尺度預(yù)測(cè)(Next-Scale Prediction)來(lái)進(jìn)行視覺(jué)自回歸建模(Visual Autoregressive Modeling,簡(jiǎn)稱VAR),是一種用于創(chuàng)建新圖像數(shù)據(jù)的生成模型。
VAR在圖像生成領(lǐng)域具有創(chuàng)新性,因?yàn)樗状问沟肎PT風(fēng)格的自回歸模型在圖像生成方面超越了擴(kuò)散模型,此前持續(xù)刷屏的DALL-E3、Stable Diffusion3、Sora等模型均屬于Diffusion類型。一位國(guó)內(nèi)頭部人工智能機(jī)構(gòu)負(fù)責(zé)人此前對(duì)記者表示,字節(jié)與實(shí)習(xí)生爆發(fā)的矛盾,本質(zhì)在于技術(shù)路線的爭(zhēng)端引發(fā)的資源分配問(wèn)題。截至發(fā)稿,字節(jié)方面暫未對(duì)矛盾原因進(jìn)行回應(yīng)。
上個(gè)月,字節(jié)跳動(dòng)起訴前實(shí)習(xí)生田柯宇篡改代碼攻擊公司內(nèi)部模型訓(xùn)練一案,已獲北京市海淀區(qū)人民法院正式受理。字節(jié)跳動(dòng)請(qǐng)求法院判令田柯宇賠償公司侵權(quán)損失800萬(wàn)元及合理支出2萬(wàn)元,并公開(kāi)賠禮道歉。
在11月5日的字節(jié)跳動(dòng)《企業(yè)紀(jì)律與職業(yè)道德委員會(huì)通報(bào)》中,官方解釋內(nèi)部模型被“投毒”經(jīng)過(guò):2024年6月至7月,集團(tuán)商業(yè)產(chǎn)品與技術(shù)部門前實(shí)習(xí)員工田某某,因?qū)F(tuán)隊(duì)資源分配不滿,通過(guò)編寫、篡改代碼等形式惡意攻擊團(tuán)隊(duì)研究項(xiàng)目的模型訓(xùn)練任務(wù),造成資源損耗。
但當(dāng)時(shí)的處理方案主要是字節(jié)跳動(dòng)與該實(shí)習(xí)生解除實(shí)習(xí)協(xié)議,同步陽(yáng)光誠(chéng)信聯(lián)盟及企業(yè)反舞弊聯(lián)盟,并同步至其就讀學(xué)校處理。幾個(gè)月后雙方矛盾激化到起訴環(huán)節(jié),字節(jié)跳動(dòng)內(nèi)部人士向記者解釋原因稱:由于田柯宇為在讀博士,公司將其辭退后首先交由校方處理。但在事件處理期間,田柯宇多次對(duì)外否認(rèn),稱攻擊模型訓(xùn)練任務(wù)的不是自己,而是別的實(shí)習(xí)生,甚至報(bào)警稱遭到造謠。考慮到田柯宇完全沒(méi)有意識(shí)到錯(cuò)誤,且涉事行為已觸犯公司安全紅線,公司最終決定向法院起訴,以表明公司嚴(yán)肅態(tài)度、杜絕類似事件再次發(fā)生。
NeurIPS 2024最佳論文披露后,外界猜測(cè)字節(jié)方面的態(tài)度、田柯宇會(huì)否進(jìn)行創(chuàng)業(yè)、相關(guān)技術(shù)的具體落地進(jìn)展等。但目前字節(jié)與田柯宇之間,還有一樁訴訟待解決。
轉(zhuǎn)載原創(chuàng)文章請(qǐng)注明,轉(zhuǎn)載自資陽(yáng)天行健機(jī)車配件有限公司,原文地址:http://dreamscapesoftheperverse.com/post/3319.html