思维之海

——在云端,寻找我的星匙。

人工智能小讲座简述

  • 了解人工智能技术的基本内容
  • 现有领域中如何应用(非常规的实现,如数据的深度挖掘)
  • 共同构建在产品设计、制造优化中的应用

知识图谱

  • 决策【增强学习】
    • 算法辅助人工决策
      • 机器学习+专家系统螺旋式上升
  • 知识【知识图谱、贝叶斯网络】
    • 推断预测,分析归因
      • 多维优化,数据可视化
  • 信息【自然语言处理】
    • 机器阅读文本
      • 异常识别
      • 利用NLP从资讯生成投资报告
  • 数据【机器学习、深度学习】
    • 辅助发现关联性(非结构化数据)
    • 时间序列的模式匹配
    • 阿里公安大脑(POI的现实版)
  • 物联网【卷积神经网络】
    • 混沌效应(关键物体)
    • 感知智能

More: 游戏AI,个性化3D服装匹配$\longrightarrow$个性化服饰推荐系统,医学辅助诊断,监督学习式AI教育……

范畴简述

  • AI
    • 符号主义$\longrightarrow$专家系统$\longrightarrow$知识图谱(保真联想)$\longrightarrow$认知智能$\longrightarrow$感知智能【视听味触嗅等】(潜联想)
  • 软件开发
    • 面向对象(初等联想,基础实界生成)
  • 数学$\longleftarrow$物理(宏观、微观)
    • 方差$\longrightarrow$贝叶斯$\longrightarrow$马尔可夫(局部性假设)
  • 哲学
    • 毕达哥拉斯(数化)$\longrightarrow$苏格拉底$\longrightarrow$柏拉图$\longrightarrow$亚里士多德(形式逻辑)【演绎,保真】
    • 中式思维【辩证,不定联想】
  • 历史blablablabla……
  • 佛学
    • 空,0

应用场景

  • 状态优化【节点图】
    • 过程优化
    • 布局优化
  • 异常检测、预测运维
  • 计算机视觉
    • 空间测量
    • 空间建模

多任务的资源最优选择。

  • 任务$\longrightarrow$画像$\longrightarrow$搜索$\longleftrightarrow$布局$\longleftarrow$模板$\longleftarrow$元素。

AI赋能企业

爱智慧简介

  • 华为$\longrightarrow$爱智慧,金融$\longrightarrow$多行业化
  • 专注人工智能(计算机、数学)
  • 深圳市高新技术企业

人工智能:

  • 感知(商汤、科大讯飞……)
  • 认知
  • 自动驾驶

——————统一框架——————

统一框架

具体算法

Pareto优化

多目标优化。

背景:九家物流供应链巨头成立合资公司,需要兼顾九家股东利益。

  • 海外工厂、仓储,清关,国内工厂、仓储,零售,消费者。

使用帕累托最优。(资源分配的一个最基本要求;提高效率)

  • 资源分配可视作一个市场(资源:人、资金、货物……)

  • 设置多个目标函数(九家公司的利益,min、max、不等式……)

    确定多个约束函数(一些参数关联,系统中固有的等式、不等式……)

  • 在约束一定的情况下,找到一个状态,在这种状态下,增加任何一个目标,都会造成其它目标的损失

    ( 帕累托改进:通过改变而使得某一方的福利提高,而没有任何其他一方的福利受损。)

  • 充分利用遗传算法


金融领域的应用

基金收益率排序:按目标函数(区间收益率)排序$N$

影响因素排序:根据多因子,生成多个排序序列$S_i$

——计算序列相似度,选择出最相关、最重要的因子。

粗糙集将股票间的优劣关系通过每只股票的Si的优势类[Si]体现出来。


利用相关性的离散排序:实质就是搜索算法的PageRank(TF-IDF指标)

GP算法

基于单类分类高斯过程(密度)异常序列检测OCC_GP

目标:尽可能早地发现数据流的异常$\longrightarrow$尽可能早地预警。

难度

  • 高维度,小样本
    • 软件工程,程序调试能力(边界情况的预测)
  • 异常类的样本常常很难获取,缺少负例(失败)样本
  • 自适应?
  • 如何利用专业的领域故障分析能力解释结果?

核心:【优化函数】基于4种高斯和函数。(混合高斯:就是叠加的正态函数)

  • 本质:函数变量f的任意组合,服从均值为0的高斯联合分布$p(f|X)=N(o,K)$。

高斯过程GP算法【分类】:

  • 高斯过程即正态随机过程,具有灵活的非参数特性,对预测结果进行有效估计。
  • 基于贝叶斯方法和训练数据来求出高斯和函数的参数(参数估计,同时利用EM算法迭代优化)。
  • 先验传递(转移)

思路:(如图)

时序异常检测

  • 参数离散化,构建样本空间
  • 绘制时序参数包络线
  • 分析异常

一些小问题:

  • 值的归一化(逻辑回归)$\longrightarrow$导向分类问题
  • 包络线与时间序列位置相关,可能要利用(隐马尔可夫建模,以及模式识别的定位)
  • 如何度量不确定性(检测的粗糙度)

发射任务:

  • 恒定路线预测
  • 多路径预测

HTM算法

层级时序存储器算法(Hierarchical Temporal Memory,HTM),皮质算法。

  • 模拟人体大脑新皮质层(noecortex)
  • 时空数据流建模
  • 持续学习(Online)幵依赖于储存的大量模式序列
  • 自调节$\longrightarrow$(新常态?)
  • 主要是检测波动式异常

长期序列高斯分布(基准函数),短期序列高斯分布(异常检测函数)。

  • 若检测到短期异常,还需要验证假阳性
  • 需要调参:短期窗口大小的选择(颗粒度)

分布序列预测

多个分支序列(映射到布隆过滤器?)。

  • 设置多个分支的误差函数(如方差),如果方差过高就异常。
  • 也可以计算两个序列的联合概率异常加权得分。
  • 多个联合相关性模型(短期异常压缩)【高斯协方差核函数】
    • 合并在时间上接近但不完全一致的分支异常

相似模式识别?(比如,设置一个短期窗口的相似哈希队列)

  • 一个混合的序列可能还需要基函数分解(如,Fourier解析。需要专业知识,必须要知道基函数)

领域知识的应用


两类任务:

  • 时序$\longrightarrow$匹配、预测
  • 平面数据(不带时序)$\longrightarrow$数据应用

模拟退火算法

(嵌套多约束条1件。)

数学模型:玻尔兹曼目标函数

使用Metropolis接受准则

例如:C指代了多个约束——6个约束函数。设计总成本函数。

知识图谱/思维导图

即(一阶)联想图。

树结构?最常用。

  • 降低新知识的搜索深度
  • 保留全面性

对于非层次的复杂联想图,知识图谱的表达能力相当有限。(SPARQL)

  • 只保留核心联想(保真联想)

现在没有一个有效的算法来生成联想

当前知识图谱中所有的联想必须人工生成。

但可以基于给定的幻想生成元和一定数量的联想规则,利用NLP基于文献快速生成知识图谱。

机器学习算法分类系统

可采用知识图谱+四象限法。

  • 无监督学习
  • 监督学习
    • 分类
    • 回归

视觉算法

单孔相机成像原理

成像坐标系映射:

  • 图像物理坐标系$\longrightarrow$像素坐标系$\longrightarrow$相机坐标系$\longrightarrow$世界坐标系。

考虑因素:径向畸变和切向畸变。

应用

测量身体尺寸($<1cm$)。(采用低成本紧身衣表面印制编码图【特征点】,利用计算机视觉还原立体尺寸,利用人体测量学,样条插值,最小二乘法,初期校正系统……)

数字孪生:游戏动态捕捉技术


以上。