OmModel多模态预训练大模型

基于大规模自监督学习的多模态人工智能算法,融合语言和视觉模态理解,实现下一代认知域人工智能应用场景落地。已完成基于行业的十亿级图文、亿级图片、万级视频大规模预训练,实现用更小的标注样本数量,融合更多的模态信息,获得更为准确的AI模型,灵活适配多场景应用需求。

大模型1.jpg

Om-PLM文本语义理解AI算法
基于自监督学习的语言大模型,通过对行业数据进行无监督自学习,更好的理解行业术语和专业语法信息,从而解决行业文本深度语义理解、小样本学习等重点难题。 

大模型2.jpg

Om-DOF视觉异常检测技术
新一代无监督异常检测系统,在无任何异常样本的情况下,只需对正常数据进行建模即可实现异常检测,并且支持后期以半监督的方式持续提高检测的准确性,充分解决异常样本数据获取难的问题。  

大模型3.jpg

Om-VQL视觉语言AI算法
全新认知视觉目标识别系统,通过对图像中的对象、属性、复杂行为等进行精确的定义和识别,解决长尾目标识别、小样本识别、语义目标识别等众多世界级难题。