纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了
机器之心报道
编辑:Panda、蛋酱
论文标题:Depth Anything Unleashing the Power of Large-Scale Unlabeled Data 论文地址:https://arxiv.org/pdf/2401.10891.pdf 项目主页:https://depth-anything.github.io/ 演示地址:https://huggingface.co/spaces/LiheYoung/Depth-Anything
强调了大规模、低成本和多样化无标注图像的数据扩展对 MDE 的价值。 指出了在联合训练大规模有标注和无标注图像方面的一个重要实践方法:不是直接学习原始无标注图像,而是为模型提供更困难的优化目标,让其学会使用额外的知识。 提出从预训练编码器继承丰富的语义先验,从而实现更好的场景理解,而不是使用辅助性语义分割任务。 新模型的零样本能力超过 MiDaS-BEiT_L-512。不仅如此,使用度量深度进行微调后,新模型的表现更是显著超过 ZoeDepth。
视觉和多模态大模型方向 实习生和全职都有招聘! Base 地点:北京,新加坡,San Jose 对于优秀的实习生,可以提供远程实习机会!
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章