比Meta的「分割一切模型」(SAM)更快的图像分割工具,来了!
最近中科院团队开源了FastSAM模型,能以50倍的速度达到与原始SAM相同的效果,并实现25FPS的实时推理。
【资料图】
该成果在Github已经获得2.4K+次星标,在Twitter、PaperswithCode等平台也受到了广泛关注。
相关论文预印本现已发表。
以下内容由投稿者提供
视觉基础模型 SAM[1]在许多计算机视觉任务中产⽣了重⼤影响。它已经成为图像分割、图像描述和图像编辑等任务的基础。
然⽽,其巨⼤的计算成本阻碍了它在实际场景中的⼴泛应⽤。
最近,中科院⾃动化所提出并开源了⼀种加速替代⽅案 FastSAM。
通过将分割⼀切任务重新划分为全实例分割和提⽰指导选择两个⼦任务,⽤带实例分割分⽀的常规 CNN 检测器以⾼出50倍的运⾏速度实现了与SAM⽅法相当的性能,是⾸个实时分割⼀切的基础模型。
意义与动机SAM 的出现带动了 “分割⼀切”(Segment Anything)任务的发展。这⼀任务由于其泛化性和可扩展性,有很⼤可能成为未来⼴泛视觉任务的基础。
FastSAM 为该任务提供了⼀套实时解决⽅案,进⼀步推动了分割⼀切模型的实际应⽤和发展。
本⽂将“分割⼀切”任务解耦为全实例分割和提⽰引导选择两阶段,通过引⼊⼈⼯先验结构,在提速 50 倍的情况下实现了与 SAM 相近的表现。
FastSAM 的优秀表现为视觉任务的架构选择提供了新的视角——对于特定任务,专用模型结构或许在计算效率和精确度上仍具有优势。
从模型压缩的⾓度看,FastSAM 也证明了基于大模型产生高质量数据,通过引⼊⼈⼯先验结构大幅降低计算复杂度的路径的可⾏性。
示例Web DEMO在 HuggingFace 的 Space 中,你可以快速体验 FastSAM 的分割效果。
你可以上传一张自定义的图片,选择模式并设置参数,点击分割按钮,就可以得到一个满意的分割结果。
现在支持一切模式和点模式的交互,其他模式将在未来尝试支持。在 Replicate 上已支持所有模式的在线体验。
多种交互⽅式FastSAM目前共支持三种交互方式。
多点交互模式FastSAM ⽀持多个带有前景/背景标签的点交互模式,可以很好地适应不同场景的应⽤需求。
以缺陷检测场景为例,只需对缺陷部位添加前景点,对正常药丸部分添加背景点,即可准确地检测出物体缺陷。
框交互模式FastSAM 也⽀持框交互模式。也以缺陷检测为例,只需对缺陷⼤致位置进⾏框选,即可准确检测出物体缺陷。
⽂本交互模式FastSAM 也⽀持并开源了⽂本交互模式。通过不同的⽂本提示,FastSAM可以准确分割出不同颜⾊的⼩狗。
工作原理如下图所示,FastSAM 的网络架构可分为两个阶段:全实例分割和提示引导选择。
在全实例分割阶段,FastSAM 使用卷积神经网络来对图像中的所有对象或区域进行划分。
在提示引导选择阶段,它采用包括点提示、框提示和文本提示的各种提示来选出关注对象。
与基于Transformer的方法不同,FastSAM融合了与视觉分割任务紧密相关的先验知识,例如局部连接和对象分配策略。这使得它以更低地参数量和计算量下更快地收敛。
定性与定量分析测试结果表明,FastSAM各方面的表现完全不输于Meta的原始版本。
速度从表中可以看出,FastSAM 取得了远超 SAM 的速度表现,在「分割⼀切」模式下,SAM的速度会受到均匀点提⽰数量的影响,⽽ FastSAM 由于结构的特点,运⾏时间不随点提⽰数量的增加⽽增加,这使得它成为「分割⼀切」模式的更好选择。
同时,由于 FastSAM 在结构设计中利⽤了⼈的先验知识,使得它在实时推理的同时也具备了与 SAM 相当的性能。
边缘检测下图展⽰了具有代表性的边缘检测结果。经过定性观察可以看出,尽管FastSAM的参数明显较少(只有68M),但它也能产⽣很⾼质量的边缘检测结果。
从下表可以看出,FastSAM 取得了与 SAM 类似的性能。与 Ground Truth 相⽐,FastSAM和 SAM 都倾向于预测更多的边缘,这种偏差在表中得到了定量的反映。
物体候选从下表可以看出,FastSAM 在 bbox AR@1000 的表现上超过了计算量最⼤的 SAM 模型(SAM-H E64),仅次于在 LVIS 数据集上监督训练的 ViTDet-H[2]。
可视化结果SA-1B 分割结果:下图展⽰了 FastSAM 在 SA-1B 数据集上不同场景和掩码数量时的分割结果。
下游应⽤对⽐:下⾯三张图对⽐了 FastSAM 和 SAM 在异常检测、显著物体分割和建筑物提取三个下游任务的效果,FastSAM 在不同模式下均取得了和 SAM 相当的表现。
参考⽂献[1] Kirillov A, Mintun E, Ravi N, et al. Segment anything[J]. arXiv preprint arXiv:2304.02643, 2023.[2] Li J, Yang T, Ji W, et al. Exploring denoised cross-video contrast for weakly-supervised temporal action localization[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022: 19914-19924.
论文地址:https://arxiv.org/abs/2306.12156
GitHub项目页:https://github.com/CASIA-IVA-Lab/FastSAM
HuggingFace DEMO:https://huggingface.co/spaces/An-619/FastSAM
Replicate demo:https://replicate.com/casia-iva-lab/fastsam
标签:
-
中科院版「分割一切」模型来了,比Meta原版提速50倍 | GitHub 2.4K+星
比Meta的「分割一切模型」(SAM)更快的图像分割工具,来了!最近中科院
-
公积金缴存上下限新标准公布 月缴存额上限标准为5290元 当前快报
下月起实行泉州网6月28日讯(记者谢曦通讯员周育荃)记者从市住房公积
-
鼎通科技(688668.SH):佛山凯智累计减持1.83%股份 减持数量已过半
格隆汇6月26日丨鼎通科技688668SH公布2023年6月26日公司收到佛山凯智出
-
今日报丨全市开展机动车排放检测机构专项检查
6月27日,记者从市生态环境局了解到,为加强我市机动车排放检验机构管
-
微信回了个“OK”表情手势,他成了被告……|世界观察
6月23日,江西法院微信公众号一篇《回了个“OK”,江西一男子成了被告
-
世界动态:云锋金融澄清“从未收购” 香港中国恒大中心何去何从?
云锋金融澄清“从未收购”香港中国恒大中心何去何从?,香港,股权,虞锋,
-
全球观热点:体育公园建设“路在何方”?第二届体育公园高峰论坛在沪举行
越来越受大众欢迎的体育公园,应该如何更好地建设?更好地为市民服务?
-
售价约5500元?小米13T和13T Pro规格配置曝光_报道
小米公司即将推出全新的智能手机系列——小米13T系列。根据国外科技媒
-
朝阳站交通枢纽封顶-独家
“成功到达指定位置!”昨天上午11点06分,随着对讲机传出令人激动的声
-
科研人员提出孔径小于10纳米的固态纳米孔制备新方法
近日,中国科学院近代物理研究所材料研究中心科研人员与俄罗斯杜布纳联
-
掌阅科技与全球出版巨头企鹅兰登达成英文原版电子书版权合作-天天微头条
据掌阅科技27日消息,近日,公司与国际出版集团企鹅兰登达成合作,持续
-
如何在PPT中加入视频(如何在ppt中加入flash)
来为大家解答以上问题,如何在PPT中加入视频,如何在ppt中加入flash很
-
《牧场物语》6月29日登陆XGP
IT之家6月26日消息,Xbox官方发文,《牧场物语:重聚矿石镇》将于6月29
-
宝石系列之琥珀泪
1、《宝石系列之琥珀泪》是连载于晋江文学城的一部玄幻类小说,作者是
-
突然杀出!利物浦愿2.5亿欧+奖金报价姆巴佩 比皇马2.2亿还高
北京时间6月27日,据国际足联经纪人MARCOKiRDEMiR爆料称,利物浦愿为姆
-
维c银翘片的作用和功效副作用_维c银翘片的作用和功效 热门
1、具有辛凉解表清热解毒的作用,有较好的疏风散热,解毒利咽功效,可
-
锂电产业链周评(6月第4周):新能源车购置税减免政策延期 钠电乘用车型获工信部公示
锂电产业链周评(6月第4周):新能源车购置税减免政策延期钠电乘用车型获
-
06月26日逸盛大化PTA为6500元
06月26日逸盛大化关于PTA的报价为6500元 吨。PTA的规格:等级:优等
-
2023重庆欢乐谷营业时间(日场+夜场)
图源:乐多2023重庆欢乐谷营业时间营业时间:即日起-6月30日:周一至周
-
第十四届夏季达沃斯论坛今天举行 与会嘉宾:携手合作才能实现互利共赢
为期三天的第十四届夏季达沃斯论坛今天(27日)开始在天津举行,本次论
-
埃及亚历山大省居民楼倒塌事故已造成3死4伤|当前观察
每经AI快讯,据埃及媒体27日报道,埃及亚历山大省民防部门在前一日倒塌
-
【全球时快讯】从砌墙到免费开放,“梅里雪山”格局打开了
从砌墙到免费开放,“梅里雪山”格局打开了
-
环球速递!标普500指数初步收涨超1%
标普500(161125)指数初步收涨超1%,可选消费板块涨约2%,科技、原材料
-
武职分数线和学费_武职分数线
1、历年武职的录取线都是二本降45分左右,这些都是武职的正牌学院近几
-
注入AI的灵魂后,数字人将成为所有人的“门户”
PC时代,门户是一个个网页;移动互联网时代,变成了一个个APP、公众号
-
联合国《世界毒品报告》:冰毒贩运蔓延,可卡因市场不断扩大
当地时间6月25日,联合国发布报告称,全球对可卡因的需求和供应正在增
-
老鹰爵士达成1换2交易!科林斯换盖伊+次轮:评级出炉安吉赢麻了
老鹰爵士达成1换2交易!科林斯换盖伊+次轮:评级出炉安吉赢麻了,科林斯
-
【世界新视野】6月27日大公司动向追踪:周鸿祎晒清华博士录取通知书!贵州茅台控股股东增持计划已实施完毕
金融界6月27日消息今日重要公司动向如下:周鸿祎晒清华博士录取通知书
-
时讯:隔夜欧美·6月27日
⑤国际油价全线上涨,美油8月合约涨0 53%,报69 53美元 桶。日经225指
-
徐良路
1、徐良,1987年2月8日生于山东省青岛市,中国内地男歌手、音乐人,毕