Om-iDEEP 多模态预测训练大模型

多模态预测训练大模型(Om-iDEEP)是基于大规模自监督学习的多模态人工智能算法,融合语言和视觉模态理解,实现下一代认知域人工智能应用场景落地。已完成基于行业的亿级图片、万级视频、十亿级图文大规模预训练,实现用更小的标注样本数量,融合更多的模态信息,获得更为准确的AI模型,性能国际先进。

核心能力
  • Om-PLM文本语义理解AI算法查看详情

    Om-PLM文本语义理解AI算法
    基于汇自主研发的自监督学习的语言大模型,通过对于行业数据进行无监督自学习,更好的理解行业术语和专业语法信息,从而解决了行业文本深度语义理解、小样本学习等重点难题。  

  • Om-DOF视觉异常检测技术查看详情

     

    Om-DOF视觉异常检测技术
    新一代无监督异常检测系统,在没有任何异常样本的情况下,只对正常数据进行建模即可实现异常检测,并且支持后期以半监督的方式持续提高检测的准确性。  

  • Om-VQL视觉语言AI算法查看详情

     

    Om-VQL视觉语言AI算法
    新一代认知视觉目标识别系统,通过VQL对于图像中的行为属性进行精确的定义和识别,解决了长尾目标识别、小样本识别、语义目标识别等众多世界级难题。  

技术特性

多模态大模型

基于大规模自监督学习技术,已经完成在在上亿图片、数万小时视频和50亿字符上的大规模多模态数据,具有强大多模态认知理解能力。


小样本学习能力

利用多模态协同学习算法,实现基于入门级别标注数据进行快速AI建模,降低人工智能算法的拥有成本。


多模态融合技术

通过收到信息算法进行多模态学习,从向量空间融合各类模态数据,实现多媒体场景下信息融合分析、关联检索、异常发现等核心技术。