傳微軟聯(lián)手新聞集團旗下哈珀柯林斯 用海量圖書數(shù)據(jù)訓練AI模型
據(jù)知情人士透露,微軟公司(MSFT.US)與新聞集團-B(NWS.US)旗下的哈珀柯林斯出版公司達成協(xié)議,計劃利用后者豐富的非小說類圖書資源來訓練其人工智能模型,以提升模型的質量和性能。這一合作僅限于使用精選的舊書進行模型訓練,并不涉及創(chuàng)作新書,且作者有權選擇是否參與。
具體而言,微軟希望將哈珀柯林斯圖書納入其尚未公布的人工智能模型中,以拓展高質量文本來源,提高模型的準確性和專業(yè)知識提供能力。盡管微軟拒絕置評,但哈珀柯林斯已證實了這一協(xié)議,并表示該協(xié)議將“允許有限使用精選的非小說類舊書來訓練人工智能模型”。
同時,哈珀柯林斯強調,這一協(xié)議的范圍有限,對尊重作者權利的模范產出有明確的限制,作者可以選擇是否參與。
“我們的任務之一是為作者們創(chuàng)造機遇,讓他們深思熟慮,同時確保他們作品的核心價值以及我們共同享有的收入和版稅得到保護,”哈珀柯林斯表示?!斑@份協(xié)議范圍有限,對那些尊重作者權益的杰出作品設定了明確的界限,它成功地實現(xiàn)了這一目標。”
據(jù)了解,科技公司一直在尋找更多高質量文本來源來訓練人工智能模型,微軟等公司也不例外。他們通過獲得許可,使用從社交媒體網站到新聞文章的一系列數(shù)據(jù),以使他們的程序更準確、更好地回答問題或提供特定主題的專業(yè)知識。
值得一提的是,新聞集團此前已與OpenAI簽署協(xié)議,允許其使用旗下多家出版物的內容。微軟也與多家出版商合作開展人工智能項目。
此外,今年早些時候,谷歌與Reddit達成了一項價值6000萬美元的協(xié)議,使得這家搜索巨頭能夠利用大量的subreddits來訓練其AI模型。
然而,一些出版商對人工智能公司未經許可引用內容的行為表示不滿,并提起訴訟。例如,《紐約時報》起訴了OpenAI和微軟,指控其侵犯版權。
綜上所述,微軟與哈珀柯林斯達成的協(xié)議標志著科技公司在尋求高質量文本來源以訓練人工智能模型方面的又一重要進展。然而,如何在利用這些資源的同時尊重作者權利,仍是出版商和科技公司需要共同面對的挑戰(zhàn)。
相關文章
最新評論