人工智能研究框架国泰君安2023年8月研报人工智能研究框架，搭建了详细的AI知识体系。

AI是研究如何使计算机能够模拟和执行人类智能任务的科学和技术。通过输入大量资料数据，让计算机学习算法，总结出模型，之后再输入相似样本时，就可以识别结果。优势在于模仿人类经验学习的过程，无需人为制定规则，机器学习等算法和自我迭代是AI区别于传统计算机能力的主要因素。

根据《AI：现代方法》，AI有七种分类，分别是推理和问题解决、知识表示、规划和社会智能、感知、机器学习、机器人：运动和操纵，和自然语言处理。

图|AI的七种分类

三、随着各类算法的演绎和迭代，AI的子领域明朗化自然语言处理和计算机视觉等是AI技术的重要子领域。

1.自然语言处理

自然语言处理(Natural Language Processing,NLP)是AI和语言学领域的分支学科，让计算机和系统能够从文本和语音信号输入中获取有意义的信息，理解人类语言，并作出决策。可以从非结构化自然语言中提取信息，处理信息并将其映射到结构化变量。现有的医学信息大多数以非结构或半结构的形式储存在医疗信息系统中，NLP可通过机器翻译将这些数据转化为AI模型可用的结构化数据语言，构造医学词林，实现人机交互、数据管理等。主要有机器翻译、情感分析和信息抽取几大基础任务。

机器翻译，是指通过特定的计算机程序将一种书写形式或声音形式的自然语言，翻译成另一种书写形式或声音形式的自然语言。主要能够实现语音翻译、图像翻译、VR翻译等。

情感分析，即指通过计算技术对文本的主客观性、观点、情绪、极性的挖掘和分析，对文本的情感倾向做出分类判断。情感分析在评论机制的App中应用较为广泛。在互联网舆情分析中，尤其是在选举预测、股票预测等领域，情感分析起着举足轻重的作用。

信息抽取，指从文本中抽取出特定的事实信息。被抽取出来的信息通常以结构化的形式直接存入数据库，可以供用户查询及进一步分析使用，为之后构建知识库、智能问答等提供数据支撑。

图|自然语言处理用于医疗场景

2.计算机视觉

计算机视觉(Computer vision,CV)，是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息，并根据该信息采取行动或提供建议。该技术基于深度学习机器视觉算法的集合，通过构造多层神经网络，逐层完成图像特征的提取，最终将多层级的特征组合，在顶层做出分类。主要有图像分类、目标检测、目标分割和实例分割几大基础任务。

图像分类是判断一张图片的主要类别，是计算机视觉中最基础的任务之一。目标检测是给定一张图像或是一个视频帧，让计算机定位出这个目标的位置并且知道目标物是什么，即输出目标的Bounding Box(边框)以及标签。目标分割是检测到图像中的所有目标，解决“每一个像素属于哪个目标物或场景”的问题，属于像素级的，需要给出属于每一类的所有像素点，而不是矩形框。实例分割是目标检测和目标分割的结合，相对目标检测的边界框，实例分割可精确到物体的边缘，相对目标分割，实例分割需要标注出图上同一物体的不同个体。

图|AI技术的子领域

图|计算机视觉用于医疗影像

四、要解决人类指定的各类任务，先要让计算机模拟人类的学习机制

人类跟计算机的能力维度各有优势，让计算机学习和模拟人类解决问题的方法是各类算法的起点。

人类会非常容易的辨别出垃圾邮件与猫狗，但是让计算机做却非常困难，因为这与发明计算机的最初任务有本质区别。比如对1亿数据进行混合四则运算或大小排序，这些任务让人类执行会非常低效，但计算机却可以快速完成，而AI要处理的任务与计算机最初的任务恰好相反。

这促使人们思考人类的学习机制，理解人类的学习机制，有助于让AI有效复刻这种能力机制。婴儿根本不知道猫狗到可以一眼分辨出猫狗，是一个经验学习过程。首先需要一定的样本资料，从现实中获得大量信息，然后大脑将接受的信息进行学习、归纳、整理、总结，最后形成知识与经验。计算机优势是计算能力非常强，可以处理海量数据。需要给计算机提供成千上万的资料数据(猫狗照片)让它进行学习，然后计算机再面对新样本时才能以较高的准确率进行分辨。

图|让计算机模仿人类来解决问题具备理论上的可行性

五、基于AI习得的能力，AI能处理两大类任务

AI处理的根本任务只有两类，分类与回归，人类大脑每日处理的也是分类与回归问题。分类任务模型输出是对象的所属类别，数据类型是离散数据，回归任务模型输出的结果是一个值，数据类型是连续型数据。

分类任务有二分类和多分类，二分类任务如猫狗图像识别，多分类任务场景包括下棋与自动驾驶等场景。在棋盘上可以落子的个数是有限的，所以每一步阿尔法Go要做的就是根据当前已落子信息，预测出落子在每个可落子位置的胜率，然后选取胜率最高的位置进行落子。自动驾驶车辆上装有多个摄像头和传感器来时刻监视车辆四周的环境信息，可根据这些环境的图像信息让它选择在每种情况下方向盘转动多少角度、油门或刹车踩多深来实现车辆的自动行驶。

以网约车出行预测以及股价预测来说明回归任务，回归任务和分类任务并非严格区分。网约车出行预测，可根据上下车地点、时间、天气情况、人流密度以及历史记录等因素，预测此刻某区域的网约车订单数，并以此为依据进行车辆调度，保证供需平衡。股价预测可根据历史走势、利弊政策、公司财报等因素对股价进行预测。分类问题在某种程度上可以看做为一个回归问题，比如可以定义若一支股票涨幅会大于5%，就把它归为买入类，在-5%至5%之间，就将它归为持有类，跌幅大于5%的话就将它归为卖出类。