青青青久草,四虎永久在线精品,二区免费视频,一级毛片在线直接观看,黄网在线免费观看,美女露全身永久免费网站,色婷婷六月桃花综合影院

OpenAI推出網(wǎng)絡爬蟲機器人GPTBot:收集數(shù)據(jù)改進AI模型

快科技8月8日消息,OpenAI推出了一種名為GPTBot的網(wǎng)絡爬蟲機器人,用于收集信息數(shù)據(jù)以改進未來的AI模型。

據(jù)了解,GPTBot將嚴格遵守任何付費墻的規(guī)則,不會抓取需要付費的信息,并且也不會收集能追蹤到個人身份的數(shù)據(jù)。

不僅如此,OpenAI也把是否要把自己的網(wǎng)站數(shù)據(jù)供GPTBot抓取的選擇交到給網(wǎng)站所有者,他們可自行修改其robots.txt文件?;蛘咄ㄟ^屏蔽其IP地址,來阻止GPTBot從其網(wǎng)站上抓取數(shù)據(jù)。

OpenAI推出網(wǎng)絡爬蟲機器人GPTBot:收集數(shù)據(jù)改進AI模型

這當然仍不足夠,修改robots.txt是一種方式,但它可以更便利和更具透明度,也可進一步告知數(shù)據(jù)將被用于什么用途等等。

此前,OpenAI抓取公開數(shù)據(jù)來訓練專利AI模型的行為備受爭議。Reddit和Twitter等網(wǎng)站,已經(jīng)采取措施打擊AI公司免費使用其用戶帖子的行為,而一些作者和其他創(chuàng)作者也因為涉嫌未經(jīng)授權使用其作品而提起訴訟。