人脸识别主要算法原理

人脸识别主要算法原理

主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。

1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果;
2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。
3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。

1. 基于几何特征的方法

人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。
    采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是 :设计一个参数可调的器官模型 (即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。
    这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。 基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 

2. 局部特征分析方法(Local Face Analysis)

    主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的基础。

3. 特征脸方法(Eigenface或PCA)

特征脸方法是90年代初期由Turk和Pentland提出的目前最流行的算法之一,具有简单有效的特点, 也称为基于主成分分析(principal component analysis,简称PCA)的人脸识别方法。
    特征子脸技术的基本思想是:从统计的观点,寻找人脸图像分布的基本元素,即人脸图像样本集协方差矩阵的特征向量,以此近似地表征人脸图像。这些特征向量称为特征脸(Eigenface)。

实际上,特征脸反映了隐含在人脸样本集合内部的信息和人脸的结构关系。将眼睛、面颊、下颌的样本集协方差矩阵的特征向量称为特征眼、特征颌和特征唇,统称特征子脸。特征子脸在相应的图像空间中成子空间,称为子脸空间。计算出测试图像窗口在子脸空间的投影距离,若窗口图像满足阈值比较条件,则判断其为人脸。 
    基于特征分析的方法,也就是将人脸基准点的相对比率和其它描述人脸脸部特征的形状参数或类别参数等一起构成识别特征向量,这种基于整体脸的识别不仅保留了人脸部件之间的拓扑关系,而且也保留了各部件本身的信息,而基于部件的识别则是通过提取出局部轮廓信息及灰度信息来设计具体识别算法。现在Eigenface(PCA)算法已经与经典的模板匹配算法一起成为测试人脸识别系统性能的基准算法;而自1991年特征脸技术诞生以来,研究者对其进行了各种各样的实验和理论分析,FERET'96测试结果也表明,改进的特征脸算法是主流的人脸识别技术,也是具有最好性能的识别方法之一。
    该方法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性,然后再计算出它们的几何特征量,而这些特征量形成一描述该面像的特征向量。其技术的核心实际为“局部人体特征分析”和“图形/神经识别算法。”这种算法是利用人体面部各器官及特征部位的方法。如对应几何关系多数据形成识别参数与数据库中所有的原始参数进行比较、判断与确认。Turk和Pentland提出特征脸的方法,它根据一组人脸训练图像构造主元子空间,由于主元具有脸的形状,也称为特征脸  ,识别时将测试  图像投影到主元子空间上,得到一组投影系数,和各个已知人的人脸图像比较进行识别。Pentland等报告了相当好的结果,在 200个人的 3000幅图像中得到 95%的正确识别率,在FERET数据库上对 150幅正面人脸象只有一个误识别。但系统在进行特征脸方法之前需要作大量预处理工作如归一化等。
    在传统特征脸的基础上,研究者注意到特征值大的特征向量 (即特征脸 )并不一定是分类性能好的方向,据此发展了多种特征 (子空间 )选择方法,如Peng的双子空间方法、Weng的线性歧义分析方法、Belhumeur的FisherFace方法等。事实上,特征脸方法是一种显式主元分析人脸建模,一些线性自联想、线性压缩型BP网则为隐式的主元分析方法,它们都是把人脸表示为一些向量的加权和,这些向量是训练集叉积阵的主特征向量,Valentin对此作了详细讨论。总之,特征脸方法是一种简单、快速、实用的基于变换系数特征的算法,但由于它在本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与训练集比较像,所以它有着很大的局限性。

基于KL 变换的特征人脸识别方法
基本原理:
    KL变换是图象压缩中的一种最优正交变换,人们将它用于统计特征提取,从而形成了子空间法模式识别的基础,若将KL变换用于人脸识别,则需假设人脸处于低维线性空间,且不同人脸具有可分性,由于高维图象空间KL变换后可得到一组新的正交基,因此可通过保留部分正交基,以生成低维人脸空间,而低维空间的基则是通过分析人脸训练样本集的统计特性来获得,KL变换的生成矩阵可以是训练样本集的总体散布矩阵,也可以是训练样本集的类间散布矩阵,即可采用同一人的数张图象的平均来进行训练,这样可在一定程度上消除光线等的干扰,且计算量也得到减少,而识别率不会下降。

4. 基于弹性模型的方法

    Lades等人针对畸变不变性的物体识别提出了动态链接模型 (DLA),将物体用稀疏图形来描述 (见下图),其顶点用局部能量谱的多尺度描述来标记,边则表示拓扑连接关系并用几何距离来标记,然后应用塑性图形匹配技术来寻找最近的已知图形。Wiscott等人在此基础上作了改进,用FERET图像库做实验,用 300幅人脸图像和另外 300幅图像作比较,准确率达到 97.3%。此方法的缺点是计算量非常巨大 。
    Nastar将人脸图像 (Ⅰ ) (x,y)建模为可变形的 3D网格表面 (x,y,I(x,y) ) (如下图所示 ),从而将人脸匹配问题转化为可变形曲面的弹性匹配问题。利用有限元分析的方法进行曲面变形,并根据变形的情况判断两张图片是否为同一个人。这种方法的特点在于将空间 (x,y)和灰度I(x,y)放在了一个 3D空间中同时考虑,实验表明识别结果明显优于特征脸方法。
    Lanitis等提出灵活表现模型方法,通过自动定位人脸的显著特征点将人脸编码为 83个模型参数,并利用辨别分析的方法进行基于形状信息的人脸识别。弹性图匹配技术是一种基于几何特征和对灰度分布信息进行小波纹理分析相结合的识别算法,由于该算法较好的利用了人脸的结构和灰度分布信息,而且还具有自动精确定位面部特征点的功能,因而具有良好的识别效果,适应性强识别率较高,该技术在FERET测试中若干指标名列前茅,其缺点是时间复杂度高,速度较慢,实现复杂。

5. 神经网络方法(Neural Networks)

人工神经网络是一种非线性动力学系统,具有良好的自组织、自适应能力。目前神经网络方法在人脸识别中的研究方兴未艾。Valentin提出一种方法,首先提取人脸的 50个主元,然后用自相关神经网络将它映射到 5维空间中,再用一个普通的多层感知器进行判别,对一些简单的测试图像效果较好;Intrator等提出了一种混合型神经网络来进行人脸识别,其中非监督神经网络用于特征提取,而监督神经网络用于分类。Lee等将人脸的特点用六条规则描述,然后根据这六条规则进行五官的定位,将五官之间的几何距离输入模糊神经网络进行识别,效果较一般的基于欧氏距离的方法有较大改善,Laurence等采用卷积神经网络方法进行人脸识别,由于卷积神经网络中集成了相邻像素之间的相关性知识,从而在一定程度上获得了对图像平移、旋转和局部变形的不变性,因此得到非常理想的识别结果,Lin等提出了基于概率决策的神经网络方法 (PDBNN),其主要思想是采用虚拟 (正反例 )样本进行强化和反强化学习,从而得到较为理想的概率估计结果,并采用模块化的网络结构 (OCON)加快网络的学习。这种方法在人脸检测、人脸定位和人脸识别的各个步骤上都得到了较好的应用,其它研究还有 :Dai等提出用Hopfield网络进行低分辨率人脸联想与识别,Gutta等提出将RBF与树型分类器结合起来进行人脸识别的混合分类器模型,Phillips等人将MatchingPursuit滤波器用于人脸识别,国内则采用统计学习理论中的支撑向量机进行人脸分类。
    神经网络方法在人脸识别上的应用比起前述几类方法来有一定的优势,因为对人脸识别的许多规律或规则进行显性的描述是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达,它的适应性更强,一般也比较容易实现。因此人工神经网络识别速度快,但识别率低 。而神经网络方法通常需要将人脸作为一个一维向量输入,因此输入节点庞大,其识别重要的一个目标就是降维处理。
    PCA的算法描述:利用主元分析法 (即 Principle Component Analysis,简称 PCA)进行识别是由 Anderson和 Kohonen提出的。由于 PCA在将高维向量向低维向量转化时,使低维向量各分量的方差最大,且各分量互不相关,因此可以达到最优的特征抽取。

6. 其它方法:

除了以上几种方法,人脸识别还有其它若干思路和方法,包括一下一些:
1) 隐马尔可夫模型方法(Hidden Markov Model)
2) Gabor 小波变换+图形匹配
(1)精确抽取面部特征点以及基于Gabor引擎的匹配算法,具有较好的准确性,能够排除由于面部姿态、表情、发型、眼镜、照明环境等带来的变化。
(2)Gabor滤波器将Gaussian络函数限制为一个平面波的形状,并且在滤波器设计中有优先方位和频率的选择,表现为对线条边缘反应敏感。
(3)但该算法的识别速度很慢,只适合于录象资料的回放识别,对于现场的适应性很差。

3) 人脸等密度线分析匹配方法
(1) 多重模板匹配方法
该方法是在库中存贮若干标准面像模板或面像器官模板,在进行比对时,将采样面像所有象素与库中所有模板采用归一化相关量度量进行匹配。
(2) 线性判别分析方法(Linear Discriminant Analysis,LDA)
(3)本征脸法
    本征脸法将图像看做矩阵 ,计算本征值和对应的本征向量作为代数特征进行识别 ,具有无需提取眼嘴鼻等几何特征的优点 ,但在单样本时识别率不高 ,且在人脸模式数较大时计算量大 
(4) 特定人脸子空间(FSS)算法
该技术来源于但在本质上区别于传统的"特征脸"人脸识别方法。"特征脸"方法中所有人共有一个人脸子空间,而该方法则为每一个体人脸建立一个该个体对象所私有的人脸子空间,从而不但能够更好的描述不同个体人脸之间的差异性,而且最大可能地摈弃了对识别不利的类内差异性和噪声,因而比传统的"特征脸算法"具有更好的判别能力。另外,针对每个待识别个体只有单一训练样本的人脸识别问题,提出了一种基于单一样本生成多个训练样本的技术,从而使得需要多个训练样本的个体人脸子空间方法可以适用于单训练样本人脸识别问题。
(5)奇异值分解(singular value decomposition,简称SVD)
是一种有效的代数特征提取方法.由于奇异值特征在描述图像时是稳定的,且具有转置不变性、旋转不变性、位移不变性、镜像变换不变性等重要性质,因此奇异值特征可以作为图像的一种有效的代数特征描述。奇异值分解技术已经在图像数据压缩、信号处理和模式分析中得到了广泛应用.

 

7. 面像识别的主要商业系统

90年代中后期以来,一些商业性的面像识别系统开始进入市场。目前,主要商业系统包括:
● Visionics公司的FaceIt面像识别系统,该系统基于Rockefeller大学开发的局部特征分析(LFA)算法;
● Lau Tech.公司的面像识别/确认系统,采用MIT技术;
● Miros公司的Trueface及eTrue身份验证系统,其核心技术为神经网络;
● C-VIS公司的面像识别/确认系统;
● Banque-Tec.公司的身份验证系统;
● Visage Gallery’s 身份认证系统,基于MIT媒体实验室的Eigenface技术;
● Plettac Electronic’s FaceVACS出入控制系统;
● 台湾的BioID系统,它基于人脸、唇动和语音三者信息融合的Biometrics系统。

其中,FaceIt系统是最具有代表性的商业产品,目前已在很多地方得到了应用。去年,它在英国用于被称为“Mandrake”的反罪犯系统中,该系统在144个监控摄像机采集的视频序列中搜索已知的罪犯或者嫌疑犯,如发现可能的罪犯,系统将通知中心控制室的警员。
笔者曾使用过FaceIt系统,并对其进行了各项指标的评测。结果表明,该系统在控制光照、准正面(3坐标轴上的旋转不超过15度)、无饰物的情况下具有较好的识别性能。但在实用过程中也发现,只有训练集人脸图像的采集条件与测试集人脸图像的采集条件基本一致时才能具有良好的识别性能,否则,其性能将急剧下降,尤其光照变化、姿态变化、黑框眼镜、帽子、夸张的表情、胡须和长发等对其性能的影响更大。

面像识别系统的测试
    基于对面像识别技术在军事安全等领域重要性的考虑,美国国防部的ARPA资助建立了一个对现有面像识别技术进行评测的程序,并分别于1994年8月、1995年3月和1996年9月(截至1997年3月)组织了三次面像识别和人脸确认的性能评测,其目的是要展示面像识别研究的最新进展和最高学术水平,同时发现现有面像识别技术所面临的主要问题,为以后的研究提供方向性指南。尽管该测试只对美国研究机构开放,但它在事实上成为了该领域的公认测试标准,其测试结果已被认为反映了面像识别研究的最高学术水平。
    根据2000年公开发表的FERET’97测试报告,美国南加州大学(USC)、马里兰大学(UMD)、麻省理工学院(MIT)等研究机构的面像识别技术具有最好的识别性能。在训练集和测试集摄像条件相似的200人的识别测试中,几个系统都产生了接近100%的识别率。值得一提的是,即使是最简单的相关匹配算法也具有很高的识别性能。在更大对象集的FERET测试中(人数大于等于1166人),在同一摄像条件下采集的正面图像识别中,最高首选识别率为95%;而对用不同的摄像机和不同的光照条件采集的测试图像,最高首选识别率骤降为82%;对一年后采集的图像测试,最大的准确率仅仅接近51%。
    

该测试结果表明,目前的面像识别算法对于不同的摄像机、不同的光照条件和年龄变化的适应能力非常差,理应得到研究者的足够重视。而且值得注意的是,该测试中所用的人脸图像均为比较标准的正面人脸图像,姿态变化非常小,也没有夸张的表情和饰物,以及没有提及面部毛发改变的情况。所以,我们认为,除了FERET测试所揭示的上述面像识别研究需要面对的问题之外,还需要考虑诸如姿态、饰物(眼镜、帽子等)、面部表情、面部毛发等可变因素对面像识别性能的影响。这些因素也是开发实用的面像识别产品时必然会遇到的最关键的技术问题。
为进一步测试商业面像识别系统的性能,并揭示2000年前后面像识别技术的最新进展,美国国防部的反毒品技术开发计划办公室于去年5月和6月对美国的主要商业面像识别系统进行了评测,称为FRVT’2000(Face Recognition Vender Test)评测。该计划邀请了美国所有面像识别系统厂商参加,共24家,但只有8家响应,最终有5家公司参加了评测,而只有3家的系统在规定时间内完成了全部对比实验。可以认为,这3家公司的产品是目前最具竞争力的商业识别系统,它们分别是FaceIt系统、Lau Tech.公司的系统和C-VIS公司的系统。FRVT’2000评估了这些系统对图像压缩、用户-摄像机距离、表情、光照、录制设备、姿态、分辨率和时间间隔等影响因素的识别性能。结果表明,面像识别系统的性能与1997年的测试相比有了一定的进步,但其识别性能对各种条件,如光照、老化、距离、姿态等,仍然离人们的期望值较远。

国内:

中科院-上海银晨

近年来,国内学者在对特征脸技术进行认真研究的基础上,尝试了基于特征脸特征提取方法和各种后端分类器相结合的方法,并提出了各种各样的改进版本或扩展算法,主要的研究内容包括线性/非线性判别分析(LDA/KDA)、Bayesian概率模型、支持矢量机(SVM)、人工神经网络(NN)以及类内和类间双子空间(inter/intra-class dual subspace)分析方法等等。

 近年来,中科院计算所在对特征脸技术进行认真研究的基础上,尝试了基于特征脸特征提取方法和各种后端分类器相结合的方法,并提出了各种各样的改进版本或扩展算法,主要的研究内容包括线性/非线性判别分析(LDA/KDA)、Bayesian概率模型、支持矢量机(SVM)、人工神经网络(NN)以及类内和类间双子空间(inter/intra-class dual subspace)分析方法等等。

推荐文章

目 录摘 要 ........................................................7一、 简介 ....................................................... 9(一) 《国家人工智能研究和发展战略计划》的目的 ............. 9(二) 预期结果 ............................................ 11(三) 利用人工智能推进国家优先事项的愿景 .................. 121、 促进经济发展 ....................................... 122、 改善教育机会和生活质量 ............................. 133、 增强国家和国土安全 ................................. 14(四) 人工智能的现状 ...................................... 14二、 研发战略 .................................................. 18(一) 战略一:对人工智能研究进行长期投资 .................. 211、 提升基于数据发现知识的能力 ......................... 212、 增强人工智能系统的感知能力 ......................... 223、 了解人工智能的理论能力和局限性 ..................... 224、 研究通用人工智能 ................................... 235、 开发可扩展的人工智能系统 ........................... 246、 促进类人的人工智能研究 ............................. 247、 开发更强大和更可靠的机器人 ......................... 258、 推动人工智能的硬件升级 ............................. 269、 为改进的硬件创建人工智能 ........................... 26(二) 战略二:开发有效的人类与人工智能协作方法 ............ 281、 寻找人类感知人工智能的新算法 ....................... 292、 开发增强人类能力的人工智能技术 ..................... 303、 开发可视化和人机界面技术 ........................... 304、 开发更高效的语言处理系统 ........................... 31(三) 战略三:了解并解决人工智能的伦理、法律和社会影响 .... 331、 改进公平性、透明度和设计责任机制 ................... 332、 建立符合伦理的人工智能 ............................. 345 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 3、 设计符合伦理的人工智能架构 ......................... 34(四) 战略四:确保人工智能系统的安全可靠 .................. 361、 提高可解释性和透明度 ............................... 362、 提高信任度 ......................................... 363、 增强可验证与可确认性 ............................... 374、 保护免受攻击 ....................................... 385、 实现长期的人工智能安全和优化 ....................... 38(五) 战略五:开发用于人工智能培训及测试的公共数据集和环境 391、 开发满足多样化人工智能兴趣与应用的丰富数据集 ....... 392、 开放满足商业和公共利益的训练测试资源 ............... 403、 开发开源软件库和工具包 ............................. 40(六) 战略六:制定标准和基准以测量和评估人工智能技术 ...... 421、 开发广泛应用的人工智能标准 ......................... 422、 制定人工智能技术的测试基准 ......................... 423、 增加可用的人工智能测试平台 ......................... 434、 促进人工智能社群参与标准和基准的制定 ............... 44(七) 战略七:更好地了解国家人工智能人力需求 .............. 46三、 建议 ...................................................... 471、 建议一 ............................................. 472、 建议二 ............................................. 47附录:首字母缩写词 ............................................. 48译者注 ......................................................... 506 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 摘 要人工智能(AI)是一种具有巨大社会和经济效益的革新性技术。人工智能有可能彻底改变我们的生活、工作、学习、发现和沟通的方式。人工智能研究可以推进美国的国家优先任务,包括增加经济繁荣、改善教育机会和生活质量,以及加强国家和国土安全。由于这些潜在的益处,美国政府已经对人工智能研究投资多年。然而,与联邦政府感兴趣的任何重要技术一样,指导人工智能领域联邦资助研发的总体方向时不仅具有巨大的机会,还必须考虑到一些注意事项。 2016 年 5 月 3 日,政府宣布成立一个新的国家科学技术委员会(NSTC)机器学习和人工智能小组委员会,以帮助协调联邦在人工智能领域的活动。1 该小组委员会于 2016 年 6 月 15 日,请求网络和信息技术研究和发展计划(NITRD)小组委员会编写《国家人工智能研究和发展战略计划》(以下简称“AI 研发战略计划”或《战略》)。之后成立了一个 NITRD 人工智能工作组,以确定人工智能研发为联邦的战略重大计划,特别关注产业不可能解决的领域。 这项《战略》为联邦资助的人工智能研究制定了一系列目标,既包括政府内部的研究,也包括联邦资助的政府外部研究,例如在学术界。这项研究的最终目标是产生新的人工智能知识和技术,为社会提供一系列积极效益,同时尽量减少负面影响。为实现这一目标,《战略》确定了联邦资助人工智能研究的以下重大计划: 战略一:对人工智能研究进行长期投资。优先投资下一代人工智能,将促进新发现和洞察力,同时使美国在人工智能领域保持世界领先地位。 战略二:开发有效的人类与人工智能协作方法。并非取代人类,大多数人工智能系统将与人类合作以实现最佳性能。需要研究来创建人类和人工智能系统之间的有效交互。 战略三:了解并解决人工智能的伦理、法律和社会影响。我们期望人工智能技术根据我们持有人类同胞的正式和非正式规范表现。需要研究以了解人工智能的伦理、法律和社会影响,并开发设计符合伦理、法律和社会目标的人工智能系统的方法。 战略四:确保人工智能系统的安全可靠。在人工智能系统广泛使用之前,7 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 需要保证系统将以受控、充分定义和充分理解的方式安全地操作。需要进一步加强研究,以解决创建可靠、可信任和可信赖人工智能系统的挑战。 战略五:开发用于人工智能培训及测试的公共数据集和环境。训练数据集和资源的深度、质量和准确性显著影响人工智能性能。研究人员需要开发高质量的数据集和环境,并允许负责访问高质量数据集,以及测试和培训资源。 战略六:制定标准和基准以测量和评估人工智能技术。人工智能进步极其重要的是指导和评估人工智能进展的标准、测试基准、测试台和社区参与。需要进行额外的研究来开发广泛的评价技术。 战略七:更好地了解国家人工智能人力需求。人工智能的进步将需要一个强大的人工智能研究人员社区。需要更好地了解人工智能当前和未来研发人员需求,以帮助确保有足够的人工智能专家能够应对本计划中概述的战略研发领域。 《战略》最后提出了两方面建议: 建议一:开发一个人工智能研发实施框架,以抓住科技机遇,并支持人工智能研发投资的有效协调,与本计划的第一至六项战略保持一致。 建议二:研究创建和维持一个健全的人工智能研发队伍的国家愿景,与本计划的战略第七项保持一致。 8 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 一、简介(一)《国家人工智能研究和发展战略计划》的目的 1956 年,来自美国的计算机科学研究人员在新罕布什尔州的达特茅斯学院会面,讨论一个新兴的计算分支,即人工智能或 AI 的开创性思想。他们想象了一个世界,“机器使用语言,构成抽象和概念,解决现在人类的问题,并改善自己”。2 这次历史性会议为 AI 的政府和行业研究设置了几十年阶段,包括感知、自动推理/规划、认知系统、机器学习、自然语言处理、机器人和相关领域的进展。今天,这些研究进展已经产生影响我们日常生活的新兴经济部门,从制图技术到语音辅助智能手机,到邮件传递的手写识别,到金融交易,到智能物流,到垃圾邮件过滤,语言翻译,甚至更多。AI 进展也为精准医学、环境可持续性、教育和公共福利等领域的社会福利带来巨大的益处。3过去 25 年来,AI 方法的显著增加在很大程度上得益于统计和概率方法的采用,大量数据的可用性以及计算机处理能力的提高。在过去十年中,机器学习的 AI 子领域,使计算机能够从经验或例子中学习,已经表现出越来越准确的结果,引起了人们对 AI 近期前景更多的兴趣。虽然最近注意到例如深度学习等统计方法的重要性,4 但在其他各种领域 AI 也已经取得了影响深远的进展,例如:感知、自然语言处理、形式逻辑、知识展示、机器人技术、控制理论、认知系统架构、搜索和优化技术以及其他更多方面。 (注:深度学习是指使用多层神经网络的一系列方法的汇总,这些方法支持快速完成一度被认为无法自动化完成的任务。)AI 的最近成就对这些技术的最终方向和影响已经产生了重要问题:当前 AI技术的重要科学和技术瓶颈是什么?新的 AI 进展将提供什么积极,需要的经济和社会影响?如何继续安全和有益地使用 AI 技术?如何设计 AI 系统以符合伦理、法律和社会原则?这些进步对 AI 研发人员的影响是什么? AI 研发的情况变得越来越复杂。虽然政府过去和现在的投资造就了 AI 的突破性方法,但其他部门也已成为 AI 的重要贡献者,包括广泛的行业和非营利组织。这种投资环境提出了关于联邦投资在 AI 技术发展中适当作用的重要问题。联邦对 AI 投资的正确优先事项是什么,特别是在行业不可能投资的领域和时间框架方面?是否有机会进行产业和国际研发合作,推动美国的优先事项? 9 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 2015 年,美国政府对 AI 相关技术的未分类研发投资约为 11 亿美元。虽然这些投资已经产生了重要的新科学和技术,但是仍有机会在联邦政府之间进一步协调,使这些投资能够充分发挥潜力。5认识到 AI 的革新性影响,2016 年 5 月,白宫科学和技术政策办公室(OSTP)宣布了一个新的跨部门工作组,以探讨 AI 的利益和风险。6 OSTP 还宣布了一系列四个研讨会, 举办于 2016 年 5 月至 7 月的一段时间,旨在促进 AI的公众对话,并确定其所带来的挑战和机遇。研讨会的结果是伴随公共报告《为人工智能的未来准备》的一部分,与该计划一起发布。 在 2016 年 6 月,新的 NSTC 机器学习和人工智能小组委员会 - 它被特许在联邦政府、私营部门和国际上与 AI 的进展保持同步,并帮助协调联邦在 AI 的活动,任命 NITRD 国家协调办公室(NCO)创建《国家人工智能研究和发展战略计划》。小组委员会指示本计划应传达一系列明确的研发优先重点,以解决战略研究目标,将联邦投资重点放在行业不太可能投资的领域,并解决扩大和维持 AI 研发人才渠道的需求。 本 AI 研发战略计划的输入来自广泛的来源,包括联邦机构、AI 相关会议的公开讨论、投资于 IT 相关研发的所有联邦机构的 OMB 数据呼叫、投资 IT 相关研发,OSTP 信息请求 RFI),该信息请求向公众征询了有关美国如何为未来的 AI7做出最佳准备的意见,以及 AI 公开出版物的信息。 该计划对 AI 8的未来做出多个假想。首先,假设 AI 技术将继续发展至复杂巧妙并无所不在,而这多亏了政府和行业对 AI 研发的投资。第二,本计划假设AI 对社会的影响将继续增加,其中包括就业、教育、公共安全和国家安全,以及对美国经济增长的影响。第三,假设行业对 AI 的投资将继续增加,因为最近的商业成就已增加了研发投资的预期回报。同时,本计划假设一些重要的研究领域不太可能获得来自行业的足够投资,因为它们受制于典型的公共物品投资不足问题。最后,本计划假设对 AI 专业的需求将继续在行业、学术界和政府内部增长,从而对公共和私人造成劳动力压力。 与 AI 研发战略计划相关的其他研发战略计划和方案包括《联邦大数据研究和发展战略计划》、9《联邦网络安全研究和发展战略计划》、10《国家隐私研究和发展战略》、11《国家纳米技术倡议战略计划》、12《国家战略计算计划》、13《推进创新神经技术脑研究计划》14 与《国家机器人方案》。15 涉及某10 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 些 AI 子领域的其他战略研发计划和战略框架处于发展阶段,其中包括视频和图像分析、健康信息技术、机器人和智能系统。这些额外计划和框架将提供补助和详细叙述本 AI 研发战略计划的协同建议。 (二)预期结果 本 AI 研发战略计划超越了近期的 AI 功能,着眼于 AI 对社会和世界的长期变革影响。AI 的最新研究进展让 AI 的潜力更为乐观,使行业得到迅猛发展,并让 AI 方法变得商业化。然而,虽然联邦政府可以利用 AI 的行业投资,但许多应用领域和长期研究挑战不会存在明确的近期利润驱动因素,因此不可能完全由行业进行解决。联邦政府是长期高风险研究计划以及近期发展工作的主要资金来源,以实现部门或机构的具体要求,或解决私营企业并不从事的重要社会问题。因此,联邦政府应该强调重大社会重要性领域内的 AI 投资,这不针对消费市场的领域,如用于公共卫生、城市系统与智慧社区、社会福利、刑事司法、环境可持续性和国家安全的 AI,以及加速 AI 知识和技术生成的长期研究。 跨联邦政府的 AI 协调研发工作将增加这些技术的积极影响,并为决策者提供用于解决与使用 AI 相关的复杂政策挑战的所需知识。此外,协调方法将有助于美国利用 AI 技术的全部潜力来改善社会。 本 AI 研发战略计划定义了一个高级框架,该框架可用于确定 AI 的科学和技术差距,并跟踪用于填补这些差距的联邦研发投资。AI 研发战略计划确定了AI 短期和长期支持的战略优先事项,以此来解决重要的技术和社会挑战。然而,AI 研发战略计划并未为个别联邦机构定义具体的研究议程。相反,其为行政部门设定了目标,在这些目标中,各机构可以根据其任务、能力、权威和预算来决定优先顺序,以便整个研究组合能与 AI 研发战略计划保持一致。 AI 研发战略计划也并未制定 AI 的研究或使用政策,亦未就 AI 对就业和经济的潜在影响作更广泛的探讨。虽然这些议题对国家至关重要,但它们在题为“人工智能的机遇和挑战,这次会有所不同吗?”8 的经济顾问委员会报告中进行了讨论。 AI 研发战略计划侧重于有助定义和推进确保 AI 责任、安全和权益用途的政策的研发投资。 11 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 (三)利用人工智能推进国家优先事项的愿景 推动此 AI 研发战略计划是未来世界充满希望的愿景,AI 将给所有社会成员带来显著益处。人工智能的进一步进展可以提升社会中几乎所有部门的福利,16让国家优先事项获得进展,其中包括促进经济发展、改善生活质量和加强国家安全。这种潜在利益的例子包括: 1、促进经济发展新产品和服务可以创造新市场,并提高多个行业现有商品和服务的质量和效率。通过专业决策系统创造更有效的物流和供应链。17通过基于视觉的驾驶员辅助和自动/机器人系统,18 能更有效地运输产品。通过用于控制制造工艺和调度工作流程的新方法来改善制造业。19如何促进经济发展? (1)制造业:技术进步能在制造业,包括整个工程产品生命周期内引发新工业革命。更多使用机器人技术能使制造业回归陆上。20AI 可以通过更可靠的需求预测、提升运营和供应链灵活性,以及对改变制造业营运的影响进行更好的预测来加速生产能力。AI 可以创造更智能、更快、更便宜和更环保的生产流程,这能提高工人的生产率、提高产品质量、降低成本并改善工人的健康和安全。21 机器学习算法可以改善制造流程的调度并减少库存要求。22 消费者可以从现时的商业级 3-D 打印中获利。23(2)物流:私营部门制造商和托运人可以使用 AI,通过适配调度和路线来改进供应链管理。24通过自动调整天气、交通和意外事件的预期影响,让供应链更加牢固难以中断。25(3)金融:工业和政府可以使用 AI 提供多种规模的异常金融风险早期检测。26安全控制可以确保金融系统自动减少恶意行为的机会,例如市场操纵、欺诈和异常交易。27他们可以进一步提高效率并降低波动性和交易成本,同时预防系统性失效,例如定价泡沫和低估信用风险。28(4)交通:AI 可以增强所有交通方式,实质上影响所有类型的旅途的安全。29它可以用于结构安全监测和基础设施资产管理,提高公众信任,降低维修和重建成本。30 AI 可用于乘客和货运车辆,从而通过增强情景意识来提高安全性,并为司机和其他旅客提供实时路线信息。31 AI 应用还可以改善网络级移动12 美国国家人工智能研究与发展战略计划 中国信通院(CAICT)编译组整理 13 性并减少整个系统的能源使用和运输相关的排放。32(5)农业:AI 系统可以创建通往可持续农业的途径,使农业产品的生产、加工、储存、分配和消费更灵活。AI 和机器人能收集有关作物的特定场所和时间数据,仅在它们需要的时间和地点才应用所需的投入(例如水、化学品和化肥),并填补农业劳动力的紧迫缺口。33(6)营销:AI 方法能使商业实体更好地配合供应与需求,增加用来资助进行中资助私营部门发展的税收。34 其能预测和识别消费者需求 35,使他们以更低的成本获得更好的产品和服务。 (7)通信:AI 技术可以最大限度地有效利用带宽和信息存储和检索的自动化。36 AI 可以改进数字通信的过滤、搜索、语言翻译和摘要,积极影响商业和我们的生活方式。37(8)科学和技术:AI 系统可以协助科学家和工程师阅读出版物和专利,使理论与之前的观察值更一致,使用机器人系统和模拟、进行实验,并设计新的设备和软件。382、改善教育机会和生活质量通过用于制定专有学习计划的虚拟导师来实现终身学习,以此根据每个人的兴趣、能力和教育需求进行自我挑战和参与其中。通过为每个人定做和调整的个性化健康信息,让人们能过上更健康和更积极的生活。智能家居和个人虚拟助手可以节省人们的时间,并减少每日重复任务所损失的时间。 AI 将如何改善教育机会和社会福利? (1)教育: AI-增强的学习型学校随处可见,通过其自动化辅导能衡量学生的发展 16。 AI 辅导员可补充面授教师,还可以因材施教。16 AI 工具可以促进终身学习并让所有社会成员获取新技能。16(2)医学:AI 能支持从大规模基因组研究(如全基因组关联研究,排序研究)中识别出遗传风险的生物信息学系统,并预测新药物的安全性和有效性。39 AI 技术允许进行多维度的数据评估,以研究公共卫生问题,并为医疗诊断和处方治疗提供决策支持系统。40 AI 技术为个人提供药物定制;由此可提高医疗效果、患者舒适度和减少浪费。41(3)法律:通过机器对法律个案史进行分析会变为普遍。42

热门文章

        对数据标注行业稍微有些了解的人都知道数据标注进入门槛低,适合很多人兼职也适合创业。        正是因为数据标注行业的门槛低这个特点最近两年从事数据标注的小公司小工作室如雨后春笋般的遍布全车大大小小的县城。        但是目前有个有趣的现象,那就是有很多进入数据标注行业做了一段时间的人慢慢的感觉数据标注行业就是个坑?为什么有些人会说数据标注就是个坑呢?        其实对与有上述问题认识的人我们认为,这些人多数都是有于对这个行业对自身条件的不了解,盲目的开始进入数据标注行业的。为什么我们会这样说呢?下面就给给大家来分析下到底有哪几方面的原因:        一、有相当一部分人是听了朋友或者网上消息说这行很火爆,好做,门槛低,也有一部分人了因此租办公室买电脑招人,然后就去群里面找分发项目的人就开张干起来了。可实际上这些人他们大多数都没有充分了解数据标注行业,更没有认真仔细得去调查分析,到底自己能不能做好一个项目,到底自己能不能有质有量按时交付的完成一个项目,到底自己有没有这个能力来管理项目。更多的人也没有去用长远的眼光去考虑数据标注项目。        二、数据标注项目虽然入门门槛低,但是相当一部分有于理解认知应变能力上都不能保证去做好数据标注项目,还有一部分人由于自己对标注项目重视程度不足接到项目之后呢?不仔细认真的去阅读理解项目规则,更没有很好的对规则质检标准去培训员工,而对员工的要求主要看重每天的产出效率,从而导致接到手的项目做的质量很差,频繁的返工,有提项目甚至因为质量太烂项目方不给结算或者是结算比例很少,最终的结果就是做好些个项目但基本都是赔钱。        三、虽然业内人都 说数据标注简单,但是标注项目他也是一个系统性的工程,一个项目能不能做好并不简单的看项目好做就能赔钱。实际上决定项目赚不赚钱考验的是一个团队的项目管理水平,质量管理能力,运营能力各方面因素的。一句话再好赚钱的项目也照样有人赚钱也有人赚钱,要赚钱不是那么简单的。        四、还有些工作室 、小公司因为对行业不够了解等他们做了一段时间后发现,自己团队经常会没有项目做,而自己团队接项目的业务能力又不具备,甚至有的时候为了员工有活干去接一些价格极低根本就不赚钱的标注项目,时间稍微一长这些工作室团队就会赔上很多钱最终关门倒闭。        五、下来要说的就是一部分人人兼职人员由于认识不到位,对项目的规则质量要求 文件不认真阅读消化理解导致做的项目质量差返工有的甚至最后不结算,最终退出这行。更有一些人由于经验不足被标注行业的项目骗子给忽悠到辛苦劳动到最后结算时找不到人。        标注行业本身由于进入门槛低,做的人很行业内盲目打价格战,导致很多转手二手三手的项目在质量工期的要求下根本就不赚钱甚至赔钱,所以在这里也提醒大家做任何事都要谨慎而行。