行业洞察 | Web3的另一面与AI的偏见

番摊123
Web3的概念很值得期待,但不能忽视的事实是市场规模仍然相对较小且难以量化,因为Web3生态系统仍处于发展早期,Web3的确切定义仍在不断发展变化中。

360截图16251112669372.png

本文来自微信公众号“出新研究”,作者/番摊123。

AI自出现和普及以来就迅速改变了我们的生活和工作方式。与此同时,AI数据偏见也不能不引起重视。当我们走向Web3,走向未来时,我们自然会看到二者兼有的创新产品、解决方案和服务。而且,虽然有人说去中心化技术可以解决相关的偏见等问题,但事实真的就能如此理想吗?

Web3的概念很值得期待,但不能忽视的事实是市场规模仍然相对较小且难以量化,因为Web3生态系统仍处于发展早期,Web3的确切定义仍在不断发展变化中。虽然2021“元宇宙元年”时的Web3市场规模估计约有20亿美元,但各家分析和研究公司的报告则普遍估计复合年增长率约为45%,再加上Web3解决方案和消费者采用率的快速增长,到2030年,Web3市场的价值将达到至少800亿美元。虽然未来可期,但行业的现状与其他各种各样,不可避免的因素都是AI与数据出现偏见的原因。

01

AI数据的数量、质量与偏见

360截图16251112669372.png

AI的学习系统,以及支持它们运行的算法都需要大量高质量数据集来训练。OpenAI的GPT系列能有今天,大量高质量的数据集功不可没。虽然OpenAI并未透露用于训练的确切数据量,但以GPT-3包含1750亿级的参数反推也可管中窥豹,其训练的数据量应该也是同等的数量级,也可能更多。

说AI会有偏见估计很多人都难以置信,但事实的确如此,ChatGPT就不止一次的出现过这种问题。虽然OpenAI表示“ChatGPT不可以表达政治观点或从事政治活动”,但有研究表明一旦遇到政治声明或投票建议,表明立场等问题时,ChatGPT就有很明显的亲环境主义与左翼自由主义倾向;还有人发现一旦问到与CEO或董事长等相关的模糊描述时,ChatGPT经常会先入为主以白人男性为出发点。仔细观察不难发现,这明显是训练过程中人为操作留下的痕迹,也可能是训练数据的算法偏差导致的。

02

偏见带来的风险

360截图16251112669372.png

很多人之所以对偏见不以为意或视而不见,是因为自己不是被歧视者,这个道理与走进法庭时才理解律师的重要性差不多。2016年微软曾推出一款名叫Tay的聊天机器人,与苹果的Siri类似,但仅仅一天后就被关闭下线了,因为Tay已经说出了一些涉嫌种族歧视的言论。事后调查发现是Tay和网络上一些有偏激言论的人互动后,被刻意教导出来的,而且微软也没有相关的防范机制。虽然作为产品而言Tay很无辜也很可惜,但公众心里的刺一旦长出来就没那么容易被拔掉。

2018年,亚马逊放弃了一款对女性表现出偏见的AI招聘工具。该工具接受的训练包含了过去十年内投递给亚马逊的简历,其中以男性为主,导致AI对含有“女性”和“女人”等词的简历学习程度不足,最终形成偏见。2019年,有人发现一款用于预测患者预后的商用AI算法对黑人患者存在偏见。因为该算法主要针对白人患者数据进行训练,导致其预测黑人患者的假阳性率更高。

Web3主打的去中心化与AI相结合可能带来独特的偏见风险,这种环境中数据的质量和可用性都可能存疑,使得精准训练AI算法变得非常困难。这不仅是因为缺乏切实可行的Web3解决方案,还因为有能力使用它们的人群同样数量有限。

Web3初创行业与企业中性别比例失衡是导致上述偏见的重要原因之一,截至2022年,女性占据的技术职位还不到三成,科技行业的高管职位中女性比例更低。在Web3相关企业中,这种不平衡同样严重。根据一些统计数据与资料,Web3及相关产业的初创企业中,拥有女性创始人的还不到企业总数的5%。这种缺乏意味着AI数据偏见很可能被男性和白人创始人有意无意识地忽视,久而久之就拖成了引人注目的问题。

03

Web3能否解决问题?

360截图16251112669372.png

应对这些挑战的一种解决方案是去中心化的数据与应用市场,允许个人和组织之间安全、透明地交换数据。这的确可能有助于降低数据偏差的风险,因为它允许在训练AI算法时使用更广泛的数据。此外还可以利用区块链技术保证数据的透明性和准确性,使算法不产生偏见。在Web3及相关的解决方案变得更加主流,并将其吸引力和使用范围扩大到更广泛的人群前,尤其是那些对技术有足够兴趣并负担得起相关费用者,获得足够保质保量的数据集来训练AI系统仍然是可望不可即的目标。

虽然Web3和区块链现在时常出现在主流新闻中,但此类产品和服务最有可能吸引的还是初创企业和技术社区的人们,在全球市场中所占的份额始终有限,而且这些社区多样性的缺乏也是肉眼可见的。类似的道理,要准确统计在Web3初创公司工作的人数占全球人口的百分比同样很难。近年来,Web3及相关产业在美国创造了大约三百万个工作岗位,如果算上那些被裁撤掉的岗位这个数字应该更大。如果将这一数字与美国总人口约3.34亿相比还不到1%,因此可以说Web3虽然先进,但远不能代表当前适龄工作的人口数量。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论