基于“性别偏见”数据的机器学习对神经网络的代表性提出了质疑。

一个国际研究小组分析了来自Google、维基百科和IMDb 的超过 100 万张图像,按性别关联分为 3,495 个类别,发现这些图像中女性的代表性明显不足。

这项研究由加州大学伯克利分校哈斯商学院的研究人员领导,还对这些平台上的数十亿字进行了分析。结果表明,对于传统上与女性和男性相关的类别,性别偏见在图像中比在文本中更常见。

这项发表 在科学杂志《自然》上 的研究的作者表示 ,随着人们花在阅读上的时间越来越少,而花在网上观看图像的时间越来越多,这显着加剧了性别偏见,增加了其普遍性和心理影响。

研究人员还指出,他们获得的有关女性代表性不足的统计数据比之前民意调查和其他来源记录的更为严重和深入。

专家警告说,基于大量“性别倾斜”图像训练的生成人工智能模型可能会进一步强化性别、种族和其他社会刻板印象。

研究作者指出:“解决这一向视觉传播的重大转变所带来的社会后果对于为互联网创造一个公平和包容的未来至关重要。”

文章原文链接:https://www.anquanke.com/post/id/293262