OmModel多模态预训练大模型

多模态预训练大模型(OmModel)是基于大规模自监督学习的多模态人工智能算法,融合语言和视觉模态理解,实现下一代认知域人工智能应用场景落地。已完成基于行业的亿级图片、万级视频、十亿级图文大规模预训练,实现用更小的标注样本数量,融合更多的模态信息,获得更为准确的AI模型,性能国际先进。

技术特性

多模态大模型

基于大规模自监督学习技术,已经完成在在上亿图片、数万小时视频和50亿字符上的大规模多模态数据,具有强大多模态认知理解能力。


小样本学习能力

利用多模态协同学习算法,实现基于入门级别标注数据进行快速AI建模,降低人工智能算法的拥有成本。


多模态融合技术

通过收到信息算法进行多模态学习,从向量空间融合各类模态数据,实现多媒体场景下信息融合分析、关联检索、异常发现等核心技术。