SUBSCRIBEto US
2021年人工智能指数(The 2021 AI Index)提供了就业、出版物、多样性等方面的见解。
2021年人工智能指数报告长达222页,如果你还没来得及阅读,别担心,我们已经帮你划重点啦。这份由斯坦福人类中心人工智能研究所(Stanford Institute for Human-Centered Artificial Intelligence)编制的海量文件中,充斥着大量的数据和图表,我们挑选出了15份,提供了人工智能当前状态的快照。
感兴趣的读者可以深入到报告中了解更多信息;它包含关于研发、技术性能、经济、人工智能教育、人工智能应用的道德挑战、人工智能的多样性、人工智能政策和国家战略的章节。
1. We’re Living in an AI Summer
人工智能研究正在蓬勃发展:2019年发表了超过12万篇经同行评审的人工智能论文。报告还指出,2000年至2019年间,人工智能论文在所有同行评议论文中的比例从0.8%上升到2019年的3.8%。
2. China Takes Top Citation Honors
中国研究人员发表了最具同行评议的人工智能论文 — 在2017年率先做到了这一点。今年的消息是,截至2020年,中国研究人员在AI期刊上发表的论文获得的引用比例最大。人工智能指数指导委员会联合主任Jack Clark告诉IEEE Spectrum,“这些数据似乎是中国学术成功的指标,也是不同国家不同人工智能生态系统的反映。”
3. Faster Training = Better AI
这些数据来自MLPerf,这是一种客观地对机器学习系统的性能进行排序的方法。来自不同公司的图像分类器系统在标准ImageNet数据库上进行培训,并根据培训所需的时间进行排名。2018年,用6.2分钟训练出最佳系统;在2020年,只花了47秒。这一非凡的进步是通过采用专门为机器学习设计的加速器芯片实现的。
报告指出了这种加速的影响:“想象一下等待几秒钟系统训练和等待几个小时之间的区别,以及这种区别对研究人员探索的想法的类型和数量意味着什么,以及它们可能有多大的风险。”
4. AI Doesn’t UnderstandCoffee Drinking
5. Language AI Is So Good, It Needs Harder Tests
自然语言处理(natural language processing,NLP)的迅速崛起似乎正跟随计算机视觉的发展轨迹,在过去的十年中,计算机视觉从一个学术子专业发展到广泛的商业应用。如今的NLP也以深度学习为动力,AI Index的Clark说,“它继承了计算机视觉工作的策略,比如对大型数据库进行培训,并针对特定应用进行微调。我们看到这些创新很快就进入了人工智能的另一个领域,”他说。
衡量NLP系统的性能已经变得很棘手:“学者们提出了他们认为没有人能击败的指标,然后一个系统在六个月内出现并击败了它,”Clark说。这张图表显示了两个版本的阅读理解测试的表现,在这个测试中,人工智能语言模型必须根据一段文字回答多项选择题。版本2.0通过包含无法回答的问题使任务变得更加困难,模型必须确定这些问题和回避回答的情况。在第一个版本中,一个模型用了25个月的时间超越了人类的表现,但在更艰巨的任务中,一个模型只用了10个月就击败了人类。
6. A Huge Caveat
是的,用于语音识别和文本生成等任务的语言模型总体上已经非常好了。但它们有一些特定的缺陷,如果不加以解决,可能会影响其商业用途。许多人都存在着这样一种问题 — 带有偏见,比如在一部分人身上表现不佳,或者产生反映历史偏见的文本。这里的例子显示了业内领先公司的语音识别程序的错误率。
这里有一个更大的偏见问题困扰着所有形式的人工智能,包括计算机视觉和决策支持工具。研究人员测试他们的系统的性能,但很少有人测试他们的系统的有害偏见。
7. The AI Job Market Is Global
LinkedIn的数据显示,巴西、印度、加拿大、新加坡和南非的人工智能招聘在2016年至2020年间增长最快。这并不意味着这些国家绝对拥有最多的就业机会(美国和中国继续占据那里的榜首位置),但看看这些国家在大力推动人工智能方面会出现什么,将是一件有趣的事情。LinkedIn发现,COVID-19并没有影响2020年人工智能领域的招聘。
值得注意的是,在印度和中国,只有一小部分员工在LinkedIn上有个人资料,因此这些国家的数据可能并不完全具有代表性。
8. Corporate Investment Can’t Stop, Won’t Stop
资金继续涌入。2020年,全球企业对人工智能的投资飙升至近680亿美元,比上年增长40%。
9. The Startup Frenzy Is Over
上一张图表显示,私人投资仍在逐年增加,但速度较慢。这张图表显示,这些资金正被引导到更少的人工智能初创公司。虽然COVID-19可能对创业活动产生了影响,但创业公司数量的下降是从2018年开始的明显趋势。这似乎是一个产业成熟的信号。
10. The COVID Effect
虽然人工智能的许多趋势基本上没有受到COVID-19的影响,但这张图表显示,2020年的私人投资倾向于在世界应对COVID-19中发挥重要作用的某些行业。制药相关公司的投资热潮最为明显,但edtech和游戏资金的增加似乎也有可能与学生和成年人去年在电脑前花了很多时间有关。
11. Risks? There are Risks?
在电信、金融服务和汽车等行业,企业正在稳步增加对人工智能工具的采用。然而,大多数公司似乎不知道或不关心这项新技术带来的风险。在麦肯锡的一项调查中,当被问及他们认为哪些风险相关时,只有网络安全问题在半数以上的受访者中得到了登记。与人工智能相关的伦理问题,如隐私和公平,是当今人工智能研究中最热门的话题之一,但显然商业界还没有收到备忘录。
12. PhDs Hear the Siren Call of Industry
公平地说,学术工作只有这么多。虽然大学在本科和研究生阶段都增加了人工智能相关课程的数量,终身教职员工的数量也相应增加,但学术界仍然无法吸收每年向世界释放的越来越多的新的人工智能博士。这张仅代表北美博士毕业生的图表显示,这些毕业生中的绝大多数正在获得行业工作。
13. Ethics Matter
企业可能还不那么关心人工智能伦理,但研究人员越来越关心。许多小组正在研究人工智能系统的不透明决策(称为可解释性问题)、嵌入式偏见和歧视以及隐私入侵等问题。下表显示了在人工智能会议上与伦理相关的论文的增加,人工智能指数的Clark认为这是一个令人鼓舞的迹象。他指出,由于参加会议的学生很多,“再过几年,就会有一大批人在这种环境下进入这个行业。” 报告强调,人工智能系统中偏差的定量测试才刚刚开始出现。创建这些评估“感觉像是人工智能科学领域的一个新的部分,” Clark说。
14. The Diversity Problem, Part 1
解决人工智能系统中嵌入的偏见和歧视的一种方法是确保构建这些系统的群体的多样性。这并不是一个激进的概念。然而,在学术界和工业界,人工智能劳动力“仍然以男性为主,缺乏多样性,”报告指出。通过这张图表,加上计算机研究协会年度调查的数据,显示在北美与人工智能相关的博士研究生中,女性只占20%左右。
15. The Diversity Problem, Part 2