【公开数据集】Conceptual 12M图像文本对数据集

发布时间：2022-03-07 05:31:07 | 来源：腾讯网

Conceptual 12Mimage-text pairs datasets

Conceptual 12M图像文本对数据集

导读

大规模图像字幕和视觉问答数据集的可用性对最近在视觉和语言预训练方面的成功做出了重大贡献。然而，这些数据集的收集通常具有从其原始目标任务（例如，图像标题生成）继承的过度限制要求，这限制了结果数据集的规模和多样性。

团队通过放宽概念字幕 3M (CC3M) [Sharma et al. 2018] 并介绍概念 12M (CC12M)，这是一个包含 1200 万个图像-文本对的数据集，专门用于视觉和语言预训练。团队对该数据集进行分析，并在多个下游任务上对 CC3M 的有效性进行基准测试，重点是长尾视觉识别。团队的研究结果清楚地说明了扩大视觉和语言任务的预训练数据的好处，正如 nocaps 和概念字幕基准的最新最新结果所示。

关键词：公开数据集Conceptual 12M图像文本对数据集

推荐阅读

九八策略：股票实盘杠杆平台丨国际油价企稳难挽主题基金颓势年内收益全部为负

发布于 2023-06-06 15:04:21

2023卧室投影仪怎么选？三千元推荐当贝D5X Pro、坚果N1

发布于 2023-06-06 10:21:19

多位分频机软件对剪辑规则的干货分享

发布于 2023-05-22 17:04:38

六云多剪仪软件剪辑抓不住重点？那是你不知道这7个技巧

发布于 2023-05-13 21:17:18

回音秒剪仪软件对于做好视频的干货分享

发布于 2023-05-12 17:58:09

好用的回音秒剪仪软件满满干货分享get

发布于 2023-05-12 16:48:09

从无到有，中国资本市场成为全球第二大股票债券市场只花了30年

发布于 2023-04-25 13:00:44

INSEC WORLD世界信息安全大会移师西安，倒计时一个月！

发布于 2023-02-24 17:20:50

什么是软文？软文推广平台有哪些？

发布于 2022-12-26 11:14:57

软文推广要这样刷“存在感”，才能让潜在用户“无处可逃”

发布于 2022-12-13 10:42:13

独家推荐

新闻排行

这款迷你主机太值得入手了 2999元竟配12代标压i7+32GB大内存_天天视点

中国电竞国家集训队杭州亚运会名单公布

环球热消息：因雷达进场控制系统发生火灾美国华盛顿特区所有机场航班停飞

800元左右的迷你主机到底能不能买？

不到4500元的RTX4050游戏本简直不要太香错过等一年全球热讯

瓦格纳雇佣兵集团人员从俄罗斯南部两个州撤离

使用更稳定！戴尔笔记本折扣价3399元_重点聚焦

为什么要买大内存笔记本 16GB对比32GB测试结果一目了然当前热点

世界视讯！差价500元！16GB和32GB内存该如何选择？实际应用实测告诉你答案

苹果教育优惠补贴力度巨大！ MacBook Air 2022款只要8249！

网站介绍 | 版权说明 | 联系我们 | 网站地图

星际派备案号：京ICP备2022016840号-16 营业执照公示信息版权所有邮箱联系：920 891 263@qq.com