Meta 开源 I-JEPA,“类人” AI 模型
2023-06-16 12:34:53来源:OSCHINA
(资料图)
Meta 宣布推出一个全新的AI 模型 Image Joint Embedding Predictive Architecture (I-JEPA),可通过对图像的自我监督学习来学习世界的抽象表征,实现比现有模型更准确地分析和完成未完成的图像。目前相关的训练代码和模型已开源,I-JEPA 论文则计划在下周的 CVPR 2023 上发表。
根据介绍,I-JEPA 结合了Meta 首席 AI 科学家 Yann LeCun所提倡的类人推理方式,帮助避免 AI 生成图像常见的一些错误,比如多出的手指。I-JEPA 在多项计算机视觉任务上表现出色,且计算效率比其他广泛使用的计算机视觉模型高得多。
I-JEPA 学习的表示也可以用于许多不同的应用程序,而无需进行大量微调。例如,项目团队在 72 小时内使用 16 个 A100 GPU 训练了一个 632M 参数的视觉转换器模型,I-JEPA 在 ImageNet 上的 low-shot分类中性能表现最优,每个类只有 12 个标记示例。其他方法通常需要 2 到 10 倍的 GPU 时间,并且在用相同数量的数据进行训练时错误率更高。
I-JEPA 背后的想法是以更类似于人类一般理解的抽象表示来预测缺失的信息。I-JEPA 使用抽象的预测目标,潜在地消除了不必要的 pixel-level细节,从而使模型学习更多语义特征。另一个引导 I-JEPA 产生语义表征的核心设计选择是多块掩码策略。具体来说,项目团队证明了使用信息丰富的(空间分布的)上下文来预测包含语义信息(具有足够大的规模)的大块的重要性。
I-JEPA 中的预测器可以看作是一个原始的(和受限的)世界模型,它能够从部分可观察的上下文中模拟静态图像中的空间不确定性。更重要的是,这个世界模型是语义的,因为它预测图像中不可见区域的高级信息,而不是 pixel-level 细节。
为了解模型捕获的内容,团队还训练了一个随机解码器,将 I-JEPA 预测的表征映射回像素空间。这种定性评估表明该模型正确地捕获了位置不确定性并生成了具有正确姿势的高级对象部分(例如,狗的头、狼的前腿)。简而言之,I-JEPA 能够学习对象部分的高级表示,而不会丢弃它们在图像中的局部位置信息。
更多详情可查看官方博客。
责任编辑:hnmd003
精彩推荐
- 物美启用便利店双品牌 北京市场格局生变
- 南水北调河南供水范围将扩大
- 内地房企海伦堡拟赴港上市
- 双“11”大数据出炉了 洛阳人爱买啥?
- 京津冀多地遭遇大气重污染 专家为您详...
- 郑州新密一家具厂发生火灾,厂房被毁
最近更新
- Meta 开源 I-JEPA,“类人” AI 模型
- 2023固态硬盘行业市场规模及竞争格局分析
- 都护府相当于现代什么 全球时快讯
- 怎么治双子座的忽冷忽热?白治百灵!
- 环球滚动:敬真我,共喝彩!
- 【快播报】东方雨虹联合中国公路学会发...
- 今日热闻!选择题又来了, 中概这次是黄...
- 第19届杭州亚运会5克和30克银质纪念币多...
- 天天实时:苏翊鸣获得清华大学保送资格...
- 国际最新研究:全球海藻养殖或难以捕获...
- 热文:抗感染版图再迎利好 健康元注射...
- 环球热议:不断以用户体验为中心,PICO获...
- 风暴中央的肿瘤电场治疗:没做错,有反...
- 麦趣尔所持500万股权被冻结_全球独家
- 每日信息:中国第三方医学诊断市场调查...
- 夏州~庆阳北750kV输变电工程环境影响评...
- 惊人发现!|天天消息
- 炉石传说砰砰博士斩杀视频_炉石传说砰砰...
- 6月16日人民币兑美元中间价上调200个基...
- 市场监管总局出台信用修复新规 鼓励支...
- 焦点热门:汽车查封状态怎么解除
- 哈尔滨市消防救援支队曝光5家存在消防隐...
- 世界快播:民航局:5月份航空运输市场延...
- 落实新业态劳动者权益保障,滴滴推出“...
- 跨境电商行业大展ICBE2023跨交会招商火...
- V观财报|华昌达总裁突然失联!深交所火...
- 再创新高!公牛再次荣登中国500最具价值...
- 当前观察:华发集团10亿元中票将付息 ...
- 讨巧的高德打车,开始“还债”|环球速讯
- 廉颇老矣,尚能饭否?预定利率下调背景...
阅读排行
-
2023固态硬盘行业市场规模及竞争格局分析
上一篇2023-06-16 12:36:25